摘要:目前,很多行业的主要服务模式仍然是以人工服务为主,伴随着移动互联网技术的快速发展,人工客服的弊端逐步凸显,客户对于服务需求的增多、要求的提高也给人工服务提出了更大的挑战。以人工智能技术的发展为例,人工智能技术是一个宏大的命题,其包含智能服务、智能指引、智能问答等一系列类型,与服务系统之间的关联性密不可分。在这些细分系统中,智能问答服务的系统分析及应用愈发受到重视,而以用户需求为导向的智能问答已经逐步形成一种完善的自然语言技术、语义分析技术、人工智能技术、语言处理技术等多系统交互的信息服务系统,以用户引擎搜索、智能联想为传输渠道,进而满足客户的服务需求。

关键词:客服智能;问答系统;分析及应用;

摄图网_400147528_banner_金融服务科技时代背景(企业商用)_wps图片.jpg

前言

随着互联网技术的快速发展,移动互联网技术的应用场景不断增多,用户服务需求在不断加强的同时,对服务的专业性要求也不断增加。用户以互联网的方式搜索获取想要获得的信息,信息应用性不断扩大,信息量、信息数据、信息来源等均需要有效进行管理,从数据集群视角准确找到有用的关键信息。在服务领域,前文提到,人工客服有诸多弊端,大量的服务模式需要依靠智能化的服务系统代替传统的人工服务模式,进而不断提高服务效率及服务满意度,同时进一步降低服务成本。

一、客服智能问答系统的分析背景

随着人工智能技术的发展,智能服务系统框架内的智能问题系统也取得了诸多应用及发展,尤其是在应用场景、技术标准、发展框架下,以用户信息及知识需求解决为导向,解决用户在服务层面的信息及知识需求。在智能问答系统的应用框架内,其应用知识领域主要有开放、限定两种模式,开放模式主要是按照开放的问答系统应用框架模式,对客户的提问格式、方式均不限定,以关联性的模式获取答案的反馈。

以某垂直领域电商企业客服中心为例,该中心主要是自营垂直电商业务为主,电商服务与人们的生活息息相关,电商资讯的服务需求较多,用户在咨询中可以先通过开放式的智能问答模式,在降低人工客服的压力同时提升服务的效率。在技术应用语言层面,开放式的问答技术模式基本都是按照自然语言的方式,按照限定知识模式进行技术应用。在限定自然语言的处理过程中,自然语言处理任务在垂直电商领域应用还需要按照标准训练模式、数据构建模式来设计智能问答系统的应用路径。

二、客服智能问答系统的相关技术定义

(一)客服智能问答系统介绍

客服智能问答系统涉及领域非常广阔,其主要从用户意图、期望动作、应用策略进行设计,按照不同问答数据来源进行区分,客服智能问答系统主要可以分为如下三种类型。一是基于自由文本的客服智能问答系统,该系统主要是从问句主题、分类两个部分来进行拆分及分析,该系统通过匹配模式、机器学习、分类应用、主题识别、句法分析的模式确认。后续,按照文档检索的方式,选择合适的答案反馈给客户。

二是基于问答的客服智能问答系统,该系统主要按照常见list列表(FAQ)的智能模式以及社区辅助问答(CQA)和常用问题列表(FAQ)的智能问答模式,两个系统之间的相关性主要是按照问句、模板数据模式计算相关性,将评分相对较高的预设模板通过问答系统提供给客户。

三是基于结构化数据问答模式建立的问答系统,该系统主要是通过分析的模式,先把问句转化为查询,简单的查询模式会在结构化的数据库中自动形成检索答案,不过答案缺少问句转化以及深层次的语义分析,与精准答案的匹配度较低。另外一种方法是按照深度学习模式下构建的问答系统模式,先经过分词的方式,定向输入词语,通过模型加以识别、链接、关系等,最终获得匹配度较高的答案。

(二)客服智能问答系统构建

客服智能问答系统在核心模块组成上主要包括分析模块、信息检索、答案提取等,分析模块主要是客户的问题分析,用以查询用户的精准意图及信息获取的路径需求。信息检索的模式参照用户的输入路径,在现有知识库检索的匹配条件下按照匹配度的高低依次选取候选答案,检索更多需要强大的信息库作为支撑。答案提取的方式有很多种,功能也更为多样,答案选取最终目的也是从不同候选答案中选择匹配度最高的答案。并且,上述三种模块最终构建成为客服问答系统的基础架构。

(三)客服智能问答系统语言

客服智能问答系统语言主要是指自然语言的处理,自然语言处理(NLP)主要是在计算机对人类语言处理的理论及方法处理上应用中文分词、词性标注、实体识别等关键步骤,这些关键步骤共同构成了自然语言的处理过程。在中文分词上,分词最小的语言单位是单词,与英文存在较大差异的是,中文单词之间是没有空格的,这就使得中文分词工具上需要系统改变输入文本序列及过程,解决分词工具带来的空格问题。

三、客服智能问答系统的技术应用

(一)智能问答系统基础框架构建

智能问答系统基础框架构建在细化分析中不难发现,分析模块是针对客服智能问答系统处理复杂度相对简单的模块之一,针对系统自然语言的问题分析及方法验证也是明确了分析确定、提取的环节要素。在具体的分析方法上,先需要问题的预处理,通过分词、停用词的方式确认问题提出,而后用确定问句类型方式,按照分类算法的方式确定类型,减少词语的候选实体,最终选择出合适的答案。最后,选择合适的中心词加以定位,方便信息检索模块的信息查询及提取功能的应用。

在信息检索方面,对用户前期输入的问句需先进行分析,而后进行信息检索。前文提到,第一阶段其实是整个中心词的获取及集合,知识库中的检索包含了中心词的若干信息,中心词的信息也是通过文档抽取的方式获取。信息检索也是在考验搜索引擎的功能,采用开放式问答的方式是系统检索的主要应用功能之一,搜索引擎对语义词句的分析无法在短时间内应用到语义层次上,数据量中的检索效率也会相对较低。在用户提出信息检索的需求后,搜索引擎会在短时间内提供一定数量级的信息,在对大量信息进行分析及筛选后,将 重复的信息删除及清洗,最终从页面信息中获取相关数据。

在客服智能问答系统的答案提取层,其主要目标是为用户提供简洁、明确的答案,不仅仅是文档信息系统的展示。因而,答案提取的功能是需要在各层级答案展示的基础上进一步做处理,功能模块的作用相对明确。答案提取的功能应用上,对筛选答案、候选答案、最佳答案等要进行排序,先进行中心词、问句类型的筛选,而后通过信息检索模块的方式获取候选答案,最后以明确设计好的排序算法对答案进行排序,按照文档相似度呈现用户的不同需求。一般情况下,文档相似度越高,其需求的针对性就越高。除此之外,答案提取中还需要注意知识库中检索的匹配文档句式,该句式相似性需要明确。预设算法路径的权重也需要在答案集合中加以呈现,不同句式的权重需要区分差异性。权重所得出的句式排序及问题类型也要明确,不同句子之间的排序功能要明确出来。

(二)智能问答系统自然语言处理

智能问答系统自然语言处理主要有中文分词、词嵌入技术、实体识别等三种方法。首先,在具体的分词方法上,主流分词方法主要有如下两种,一是字典分词法,基于字典的分词模式按照事先预定的策略固定划分,底层技术中采用字符串的分词匹配方式,选用不同词语大小、方向、规则等都会产生分词的不一致。不仅如此,字典分词方法在进行句列分割时,其分割的结果不是很明显,识别效果较差,但速度较快。虽然在最终的匹配效果及方法上可能会产生一定的歧义,但可以通过统计模型的方式最大限度解决这一问题。二是基于序列标记模式下的分词分割方法,该方法主要是在字典分词方法的基础上采用序列标注的方法,逐步以模型构造的模式进行序列标签分词。在该序列标记分割的基础上,单词成为分割的对象,其无论实在语料库、词语分类、分割模式等方面均产生较大的差异性。

其次,在词嵌入技术上,自然语言的处理任务主要是采用编码的方式转向量化的过程,步骤上先解决中文词典下的文本完整性问题,而后将单个元素进行编号,不同词向量维度下的量化方式基本都是随机的,词义之间的关联性也需要明确。不同分布式词向量之间的表示方法是存在明显差异的,例如:分布式词向量的方法与传统词向量间存在模型、空间的差异性。向量空间模型主要有计数模型、预测模型等,前者是按照语料次数转化为对应的矩阵关系,后者是按照预测模型的方式锁定所处的空间向量,二者之间存在显著的差异。

最后,在实体识别层面,其作为自然语言处理非常重要的一项环节,其主要作用是从问句中获取关键信息,这些关键信息包括地点、时间、任务等,这一技术在客服智能问答系统张红的应用主要是在系统的语言构建、信息抽取、意图识别、语言翻译等领域。一般情况下,实体识别模型在确认实体边界、确定实体类别部分上效果是不同的,实体所属类别的词性标注与所属类别之间存在明确的相关性,分词之间的准确率也会影响到实体的类别识别应用效果。在实体识别模型上,实体识别模型在算法分类上主要有三类,分别是人工识别的词典规则、系统机器学习规则、神经网络规则方法。三类方法都是通过提前预设规则模板的方式,结合词典人工标注将统计信息、中心词、位置词等特征概括统一,规则设定的应用也会在一定程度上影响模型算法的最终呈现。客观而言,随着智能硬件信息系统的不断发展,硬件计算能力也在随之不断提高,神经网络模型应用的具体场景中对自然语言任务的作用也愈发明显,最终形成一整套神经网络算法模型。

四、总结

客服智能问答系统的分析及应用需要包括对问答系统类型的分析,需要不断应用不同领域下问答系统的功能模块,要将系统构建作为核心任务之一。在具体的应用举措上,对客服智能问答系统的问题分析、信息检索、答案提取的功能,采用自然信息语言处理方式将分词、词嵌、实体识别等系统关键技术、算法加以应用,最终构建起完善的客服智能问答系统框架,不断提升智能系统的服务效率及体验。在自然语言处理过程中,准确得到客服智能问答系统答案是信息服务领域的难点之一,可进一步结合自然语言技术、信息检索系统、自然语言答案。在传统的搜索引擎引导下,无法满足部分用户的需求,需要采用这一系统架构方式降低答案的重复率。作为人工智能领域的重要方向之一,智能问答系统的未来具有非常广阔的发展前景及应用价值。

 

作者:杜秋;为客户中心智能化研究者;

本文刊载于《客户世界》2020年10月刊。