原文再续,书接上回。在上一章节中我们讲到人智能服务实施前的最后一公里,意在同大家一起探究梳理清楚智能服务准备工作完成之后还会遇到且非常容易让我们忽略的一些坑,故名“最后一公里”。一个项目往往会有着多方的参与,每一个参与方即是项目成员的身份同时也因其原有岗位的影响会对同一事物持有不同看法,不同做法,其并不一定即是错误,但往往不同岗位叠加则会有错误产生。在一切准备工作皆已完善之下,智能服务的建设就将正式进入实施篇章,对于实施工作来说首先一定需先明确执行的路线地图,即先做什么?做到什么程度?后做什么?做到什么程度?盲目实施与执行往往会事倍功半。

各位训练师都非常了解,想要让机器人更加智能,为其投入大量的客户原始语料是至关重要的事情。在这一思想的指导下面,训练师主要工作是不断的搜索或者站在客户经验的角度上编写客户原始问题,再将其投入到机器人当中,以期待能够持续提升机器人的识别能力。但在实际的训练过程、执行过程中真实情况却是这样的:训练师们看到了一个机器人未能识别的问题,就错误的将这一问题直接投入到机器人当中。每天的训练工作都能发现非常多数量机器人未识别的问题,每日往复,但却发现随时间的推移机器人训练越是投入,对应的识别能力却越发稳固不前。打开对应问题去看,发现一类用户问题甚至维护了数千条的用户问法,究其原因可能存在以下几种情况:维护过程中因为标准的不统一,导致数千条用户问题之间大量存在无用功的情况;大量的维护精力放在了一些重要性不是那么高的场景,导致花费时间维护了用户的问题,但却未将这个问题放在整个服务大盘中来看,在服务大盘中有的问题是高频低复杂度,有的问题是低频高复杂度。对于低频高复杂度的问题来说,问题的识别难度较大,但其出现的频率较低,对于高频低复杂的问题,其出现的频率较高,维护的难度较低,若是没有一个统一的维护标准,就有可能导致训练师们在日常中发现了谁就维护谁,并没有集中力量去维护高频低复杂度的问题。则最终导致结果是机器人的识别能力,随着训练次数训练经历的投入,反倒没有明显的增加和提升,这就是没有先规划实施路线图直接实施带来的后果。

对于实施路线图来说,核心在于明确每一个阶段的里程碑,从里程碑的角度即可反向推导我们的路线图。从大的维度来看,智能服务的实施,分为数据到知识知识到智能智能到应用三个大的方向,那么这里我们谨以在线文本机器人为例进行探讨。

第一个部分是数据到知识;对于人工智能来说最为重要的就是数据。数据质量的高低和数量的多寡决定了智能服务的上限和下限。对于在线文本机器人来说,原始数据即是客户的问题和问法想要让机器人能够回答客户的问题,首先我们需要完整的梳理客户在我们企业服务端上面可能会存在的所有问法。很多训练师第一反应是想到了我们的人人对话日志:客服中心中所有人工客服和人工客户之间的一个对话记录,但往往很多训练师却会忽略诸如我们的工单系统,商品详情页的评论区、帮助互助论坛、自助帮助中心、文档知识等等皆有可能产生对话日志的部分,这同样会导致我们的训练工作覆盖的场景不够完善。除此以外,不同渠道的原始语料对应的知识管理结构也不相同,若是所有的知识类型都采用一种知识库进行管理,那么这会导致我们训练效率大大下降。当我们获取了客户原始语料也不能直接开始训练工作,还需要结合着客户原始语料的数量与该问题识别的难易程度进行分析研究,确定业务场景占比与难易程度情况。

第二个部分是知识到智能;知识到智能,顾名思义即将我们的知识进行管理。管理工作分为两部分,一部分是知识库结构管理,一部分是知识内容管理。知识库结构管理是指不同类型的知识库:FAQ、多轮对话、知识图谱其适用于不同的场景,对应不同的训练工作,不同的训练效率。而知识内容管理是针对知识本身进行管理,其载体是我们机器人最终推送给客户的答案,训练师需要对答案站在客户化的角度,站在业务场景的角度想客户所想,答客户所要。从不同知识库的角度来看我们的训练工作不同,我们的管理方式也不一样;先说FAQ,最终我们产出的结果是针对不同业务场景中一组一组的FAQ问答结果,每一条FAQ问答包括有客户标准问、客户相似问、问题答案等(注:不同系统可能存在不同称谓);除此以外还包括有FAQ效果评测、FAQ知识健康情况、FAQ业务场景占比,每一个部分对应我们不同的训练工作。再来是多轮对话,多轮对话产出的是根据用户对话日志所编写且能够在机器人端实现的业务对话流,其包含的训练工作有多轮对话场景设计、对话流程设计、对话唤醒设计、多轮对话场景梳理、多轮对话效果评测等。除开上述训练工作内容,训练师往往较为容易忽略多轮对话跳出情况分析,即因多轮对话场景用户是按照我们预先设定的流程完成一轮又一轮的对话或者任务,但若是设计不够精巧,客户往往会出现对话跳出的情况。这个时候不仅无法给到客户一个具体的结果,还会导致客户的体验度较低。最后则是知识图谱的管理,分为知识图谱的场景梳理,知识图谱的构建,以及图谱效果的评测。因为知识图谱构建成本往往较高不仅涉及系统部分还涉及了大量难度较高的训练工作,所以需要先明确知识图谱的适用场景,其适用于多维知识场景。对于知识图谱的构建,首先是构建三元组结构,包括:实体、属性、关系、属性值等。完成图谱构建工作后还需对知识图谱的效果进行评测。

但除开上述提及的几种知识管理方式以外,不同类型与场景的文本机器人可能还会有其类型的知识管理方式,包括还会有闲聊知识的管理等等。在明确了三种知识管理方式之后,需要进行应答引擎的分配,包括FAQ场景,多轮对话场景,知识图谱场景,占有整个知识体系的比例,基于具体比例训练师才能安排设计不同知识的训练节奏、训练频次、训练方向等过程管理内容。

当训练工作完成以后,接下来我们需要去明确应用端上面的一些考量,其包括转人工入口投放渠道部署、前端UI设计等大的模块。转人工,我们可以直接理解为在线文本机器人需跟其他部分转接协调的模块,包括有:人工部分、其他智能化工具部分、客户中心原有工作模块等;其设计的核心在于要结合智能化的定位,如:闲时服务、高峰分流、服务质量保障、多个接触渠道;不同定位其设计理念也是不同,如:多个接触渠道,那么就应该将机器人入口与人工入口并列设计。入口投放,则是对于机器人投放入口的选择,对于企业服务端来说,每一个渠道的用户类型,用户数量都是不同的。不同的选择入口投放,势必会导致机器人在这个渠道上面的服务表现有所影响,如:企业某个渠道上面的用户大都是已经购买过该企业产品的用户,那么该渠道的用户进线咨询时售后问题的占比往往可能远远大于其他场景。而客户进线发起服务咨询时第一眼看到的就是机器人页面,针对不同入口的用户群体特质,采用不同页面为客户提供服务,能够有效提升一定的问题解决能力。

写在后面:

本章正式进入至智能服务实施部分,首先明确了智能服务实施开始之前需要先明确实施线路图,并与各位训练师们一起同明确训练过程中的各个里程碑节点,在接下来的章节中我们将会对里程碑节点的实际实施细节展开探讨。