在当下科技不断发展的时代,都说是AI的时代,从以前的大数据到如今的AI时代,智能机器 *** 系统就是典型的一个产品。
*** 系统中的机器人
*** 系统的兴起是基于满足降低公司人力成本、维护精力的需求,一套 *** 系统的产品设计,上次有分享过史上最详细的 *** 系统产品落地|后台产品经理的工作实例,有那么苦吗?,但除了工单管理、客户管理、以及 *** 系统的BI,其实最为困难的就是如何提升 *** 系统的使用效率。
就 *** 系统的使用效率,其根本就是是否能够为企业降低人工服务的次数、人工服务的时间占比,甚至是提升公司的营业业绩。在这里面,我落地的 *** 系统其占比最终的还是机器人回答。
【机器人问答的产品设计】
但机器人回答的发展期间,机器人的回答方式也在如今也是基于关键词匹配与大数据结合的情况下发展的。
【APP端机器人 *** 】
【WEB端 *** 】
产品落地中,调研到目前国内的 *** 在中文分词中,现在有三大分词算法
之一类叫做基于字符串匹配的分词 ***
第二类基于理解的分词 ***
第三类基于统计的分词 ***
相对于早起的纯关键字匹配,现在国内的机器人也是基于NLP(自然语言处理技术也逐渐在兴起),作为PM的我们,到底要如何去落地机器人问答系统?我谈谈我的案例分享:
知识库的建立
如果说从0-1做 *** 系统,那么机器人的模块从一开始规划中最为重要的就是建立知识库,这个知识库的重要性在于以后的模型建立。
那么问题来了,什么是模型?
【对话模型】
日常生活中,我们所知道的模型就相当于是一个模具,一个模具的可以作为一点,其 *** 更多产品,把模型做的越好、越精确,在量产中就会得到更准确的结果。
更加精准、更加快速
那么对话模型,就是我们这里提的一个模型。在不同行业中,我们可以知道起用户发文的内容范围、回答的范围是不同的。
那么如何训练模型,简单来说就是通过对话找到问题的答案,答案的问题
【问题与答案的训练】
【答案与问题的训练】
这里提一个关键词:语料
预料你可以理解问一些词库,不过这个词库不同的是他会包含更多测试词语、句子、符号等数据,而词库则是我们知识库中最为关键的一个匹配词库。
既然要考虑模型和语料,我们首先要考虑公司的业务是什么?这就是所谓的特定领域,再到全局领域
目前这些语料都有网上的一些公开的包,PM可以去下载了解下是否符合公司的业务。通过这些语料包,可以去知道语气词、标点符号、违规敏感等
这里从特地领域的语料,简单举个列子在金融证券行业,最为关键的语料就是:公司产品名称、股票名称、公司名称、常用服务名称
这些都算语料里面的词库,在一个公司建立知识库中,我是按下图进行分类组合
既然上面的逻辑关系清楚了,我们可以清楚知识库是起着机器人回答的一个重要部分
【网易7鱼】
从上面的图可以看到,其知识库时候为了分类管理,提供了一个分类管理的模块,并且将问题与知识库进行关联。
【知识点与FAQ】
将问题匹配进入相应的知识点,机器人也需要知道谐音、或包含问题以外的其他内容,如何去掉无效内容,匹配问题答案。
【相似词库】
建立相似词库的意义就是为了方便机器人把相似处看作同义词进行理解,把问题进行匹配。
在知识库中添加问题与答案,我们这里落地首先要考虑问题与答案的对应关系。
也就是在对话模型中,一个问题是否会对应2个答案,一个答案是否会对应2个以上的问题?
【知识库添加】
更好的方式是利用EXCEL文档的方式整理,将文档导入上传。这里我借鉴了一些 *** 系统的机器人中心文档,将他们的文档进行归类,整理了如下模版
这样的话,公司即使没有 *** 系统,但通过日常的文档归类,也可以快速的建立词库。
基于字符串的匹配算法
在产品设计中,这套系统还是基于字符串匹配的算法。利用正相更大匹配、逆向更大匹配分、以及最小切分
那么什么是正向匹配算法?
正向更大匹配算法:从左到右将待分词文本中的几个连续字符与词表匹配,如果匹配上,则切分出一个词。
但这里有一个问题:要做到更大匹配,并不是之一次匹配到就可以切分的 。我们来举个例子:
待分词文本如下:
content[]={"产","品","经","理","从","此","站","起","来","了","。"}
词表: dict[]={"产品", "产品经理" , "从此","站起来"}
这里CONTENT[1]开始进行从左到右正向扫描,那么扫描到之一个content[1],这个时候扫描的为“产”字,扫描到第二个content[2],这个时候扫描到[产品];和dict[1]匹配上了,但是因为字数才2个字,需要为3个字,就继续这样向下扫描。
循环处理,最终将词语扫描出来。但这样扫描出来的结果可能为:产品/产品经理/从/此/站起/来,或产品/产品经理/从/此站起/来……
等结果,利用最小切词,切词的换算方式,但当然既然采用的是基于字符串匹配的分词 *** ,其劣势就在这里,切分为导致歧义问题。
因此我们会把逆向更大匹配、正向更大匹配、最少分词结果进行综合匹配。最少分词就是将针对正向、逆向的问题,将双向切分的结果进行比较,选择切分词语数量较少的结果。
机器人知识库初始化
机器人在设置中,建议一开始没有词库的时候,产品经理需要考虑一些基本词库,这些词库是公司名称、公司产品、微信公众号、网站地址等
【机器人初始化】
这样设计的理由很简单,这是公司的基本问题或回答。在这套 *** 系统机器人是对外或甚至以后运营盈利情况下,方便客户首先设置好自己的基本机器人资料。
除了以上的机器人基本词库以外,还有机器人寒暄词库,并且产品设计中要对每一个类型的词库回答进行限制。
比如当问了3个问题,都无法匹配到机器人的答案,机器人应该以转换人工的提醒方式或回答方式,让用户去寻找人工解决办法。
【切换人工】
在当前的机器人系统中,在这个产品设计我一直定位该产品是辅助于人工 *** 去减少工作量,增加工作效率。机器人并不能完全替代人工,所以时刻保持机器人与人工的切换,让用户能够获得好的解决体验。
总结
在当下科技不断发展的时代,都说是AI的时代,从以前的大数据到如今的AI时代,智能机器 *** 系统就是典型的一个产品。
虽然对于PM来说, *** 系统的难点在于如何去跑通公司 *** 业务流程,建立起一套好的服务流程。
1.分担 *** 工作量
2.积累 *** 经验,不断完善问题库
3.自定义机器人样式,模拟人工聊天。
但难点也在于如何通过人工 *** 去积累学习更多的知识,以及通过数据渠道获得 *** 以及所在客户行业的专业基础知识。
更多关于云服务器,域名注册,虚拟主机的问题,请访问西部数码官网:www.west.cn
各位网友朋友大家好,看到admin5的(草根站长故事征集活动),无意之间就有心里一种冲动,看着网络上的故事真是太多了,大千世界,无奇不有。现在还是饿着肚子,也没有什么事情可做,天天添加内容,都快累死了,有太多的时候都是这样度过的,早上10点起床,来到公司一天就是2顿饭,天天关注自...
2006刚过完年,家人都移身前往深圳去玩了,我没有那心情就没跟去。自己一个人在家呆着。呆着无聊,就准备准备去了师傅那里继续我的网络维护学习生涯。在师傅给我安排的工作室里 我天天进的都是it.pconline.com.cn(太平洋IT基地)和网易、天极这些门户站的论坛里 学习巩固师傅说的东西,有...
这是一篇很难得的博客文章 ,一个自己说文笔不好,但是字里行间对公司深情的员工 ———————————————————————————— 看到很多朋友写博客在介绍自己的站,我虽然文笔不好,但是也时常有这种冲动,想把心里面的一些想法,或者自己的作品能让更多人去了解和指出不足的地方。 很荣幸加...
有个女孩叫君儿,男孩叫磊。他们通过QQ聊天认识了,然后经常写信聊天,到相识相知。03年的圣诞节他们见面了,彼此感觉应该还算 很不错,晚上在一起吃饭,在晚上一起去了我们学校过圣诞节。这一晚,君回学校宿舍了,2004年1月1日 元旦到了,磊磊非常想君儿,磊就打电话喊君一起出来玩,那一晚上我们都没有...
春节快到了,因本人经济困难,想做兼职,有意者来电来函咨询,本人承接以下业务: 苦力搬运,装卸,车工,钳工,焊工,水电工,瓦工,砸墙,砌墙,筛沙,油漆,通下水道,贴瓷砖,拆洗油烟机,拆装空调,Vb,C++, .NET,C#,Java,j2ee, j2me,asp,delphi,php,汇编,P...
“平子又把鞋脱了,怪不得这么臭......” 平子是我们这一带有名的人物,之所以有名,因为他在我们这边是大话西游级数最高的玩家。所以很多玩大话的人总是“慕名”前来拜访他 ---就是这个叫做“新浪”的网吧。先别笑,其实N个人都好奇:这个...