摘要:随着云计算技术应用到互联网技术中,形成更具扩展、弹性、扩容、多平台、模式化的云服务平台机制。一些企业的客服中心也在经历了服务人群数量、服务模式变更、外部环境需求变化等多重考验,对客服中心的数据存储、分析、加工等都带来了极大考验。对于客户服务中心而言,建立起一套以数据驱动为前端的平台,实现数据资源的充分存储与分析,兼顾前、中台运营数据支撑应用是整个数据体验平台亟需解决的难题。本文着重于客户服务中心海量数据现状,结合数据的存储、分析需求,以数据收集、数据存储、数据分析、数据服务等四项关键步骤,对服务数据采用分布式分析方法,分别对文本数据、语音数据、舆情数据等进行深度平台化加工,进而设计与搭建具备实践性价值的数据体验平台。
关键词:客服中心 数据体验平台
前言
大数据作为计算机科学与技术发展与应用的一个重要方向,也是“互联网+”的重要组成部分之一,其应用一直是诸多企业在提升自身技术应用能力与水平的关键。大数据应用不仅仅是一种数据化的集合,更是一种新的处理模式及优化模式。客户服务中心需要处理大量的客户咨询、投诉等业务,在处理业务的同时,其数据规模也在不断扩大,随着服务模式和渠道的增加,数据种类日益增多。在数据类型上,有服务数据(多媒体信息,包括文本和语音)、客户数据,还有系统运行数据、其他在服务过程中收集的数据等,利用好这些数据,不仅可以进一步提升客服中心的运营能力,还可以结合人工智能数据的应用,驱动智能数据产品,为前端经营发展助力。
客户服务中心数据体验平台的建立有利于从数据生态的维度,结合服务中心、呼叫中心的数据特点,提升服务价值。采用架构设计、功能设计、数据设计、模型设计的模式,搭建数据体验平台的存储、并发解决方案,实现数据收集、分析的设计与应用,最终形成系统化的解决方案。
一、国内外应用现状
国外对客服中心数据体验平台的研究起源较早,早在20世纪30年代,北美在快速的经济发展中就已经形成了在旅游业、民航业的呼叫中心模式,最早的呼叫中心主要是是以预定服务为主,更多依靠硬件支持,很少有软件服务支持。随着用户需求量的高速增长,20世纪50年代,美国部分企业开始设立具有一定规模的呼叫中心,以全天候服务的方式开展预定业务,而后几十年间,呼叫中心伴随着银行业、电商行业的快速发展,规模不断扩大。以美国知名电商公司EBay为例。该公司以分布式存储的Hadoop数据库,以低成本的方式海量存储购物平台所包含的商品信息,并结合到其呼叫中心的数据体验平台中,使之焕发了巨大的数据应用价值,也形成了诸多精益化数据运营及营销的案例。
国内的呼叫中心起步相对较晚,20世纪90年代开始在电信领域兴起,早期规模较小。直到本世纪初,呼叫中心开始被国内越来越多的企业开始重视,并逐步作为企业发展、产品推广的重要工具,其功能细分也更为明确。2010年后,云计算服务开始应用到客服中心中,云呼叫中心的产品在理论上是可以支持更多座席(甚至是无限座席)。在运用开源数据、分布式文件系统的计算框架模式下,一些高性能数据方法开始逐步被应用及测试,例如:Hadoop模式,以高扩展性功能获取更多的存储空间。对于企业而言,企业对于客服中心所产生的数据不仅是备份及存储,还需要挖掘其中深藏的巨大客户价值,并对数据信息进行深度开发、利用以及加工,最后应用到企业的生产及实践中。
二、数据体验平台需求分析
(一)总体需求与角色需求
总体需求主要是基于客户服务中心在系统规模上的扩大,产生数据规模化运行的标准,系统运营的数据在一定程度上已经无法满足数据分析的需求。并且,随着人工智能服务的高速发展,海量数据基础所产生的职能数据产品及应用,对数据发展带来了更多的动力。以数据驱动平台设计为例,需要为用户提供以业务支撑为导向的运营管理支撑,并附加信息系统功能,包含数据运行、分析、智能应用等核心需求。
在角色需求层需要综合考虑系统、运营、质量考核、数据分析等管理职能,系统管理需要以运营监控为导向,运营需要更多关注服务人员的运营质量,形成全方位、立体化的运营监控模式。对于质量考核而言,数据体验平台需要明确坐席服务质量监控、质量考核的标准,以明确的质量考核标准形成立体化的服务监督标准。数据分析的需求在运营监控、质量监控的基础上,形成数据分析库及功能,定向分析结论。系统管理则是数据体验平台的最高权限者,除了基础的业务分析职能,还需要起到系统信息管理、数据管理、权限管理等功能。
(二)功能需求与非功能需求
功能需求主要分为如下三点:一是体验数据的收集功能,将业务平台、语音平台、在线平台、舆情平台的数据进行抽取、加载,形成实时处理数据,在线或离线处理。二是体验数据的分析功能,这一功能需求包含座席、系统的运营情况,也是分为实时、离线功能,其包含座席话务统计分析、IVR分析、座席服务分析、满意度分析、投诉分析等。三是体验数据的服务功能,该需求主要是一些报表服务、线上服务、存储服务等,按照平台化开放的方式面向运营侧人员生态数据报表,供分析运用。这里需要明确的是,由于客服中心每日服务语音和多媒体交互内容存储数据巨大,数量也在不断增长,需要评估对语音数据进行文本化转换后存储、图片数据进行去重,也有利于减轻数据体验平台的存储压力。
非功能性需求主要包含如下两点:一是稳定高效性功能需求,其主要包含分布式数据以及系统的稳定性,尤其是对于数据需求方而言,这一功能尤为关键,如出现数据丢失等情况,不仅导致数据分析无法进行,更会造成无法估量的经济运营损失,因而首先要考虑稳定高效的功能需求。二是扩展性需求,其主要是在系统测试、试用阶段,按照业务复杂度、数据接入度的要求,以资源扩充为导向,在满足业务资源的同时将动态存储、计算功能进行扩展,进而不断提高系统存储能力及功能应用能力。
三、客户服务中心数据体验平台设计分析
(一)数据体验平台收集模块设计
在数据体验平台收集模块设计中不仅是业务数据量巨大,其在结构化与非结构化的数据领域,总体架构设计及功能也会产生变化。在此过程中,要充分考虑到平台的数据量对数据功能的影响,这也涉及到系统安全性、稳定性以及功能性等影响因素。在收集功能上,还需要充分考虑到系统设计的应用、结构等,在系统展示上按照应用、计算分析、数据存储、接入、数据展示等收集方式,收集展示中涉及到系统管理、运营分析、质量考核等可视化操作模式,需要将其结果展示到系统层的用户群体中。收集模块的应用还需要考虑到分布式的解决方案,海量存储因为要涉及到实时的查询功能,这一功能下可应用HBASE技术,按照非结构化数据的存储方式进行分布式收集处理。按照数据接入层的抽取需求及规则方式,实现结构化、非结构化的数据平台应用,将语音数据上传,形成数据平台数据库集。
(二)数据体验平台分析模块设计
在分析应用层上,主要考虑到平台数据接的处理,包含接收、处理、反馈等需求,展示层需要参照业务逻辑的应用服务方式,先发送存储,再获取数据,最后对展示层进行请求处理后,将最终的处理结果反馈到展示层的框架中。在具体的分析模块设计上,还有一项重要的职责就是应用服务层的数据计算分析服务,其主要是在Spark离线计算、Spark Streaming实时计算、语音识别等基础上,实现语音与文本的双重挖掘。
(三)数据体验平台服务模块设计
在服务模块设计上,充分考虑数据存储层的应用,按照数据仓库、数据库、分布式文件系统的方式,数据仓库(Hive)主要是按照存储运营数据的结构化数据应用方式,先存储语音数据,而后将非结构化数据加以处理,建立起索引、分库、分表的查询功能及方式。数据库(HBase)按照索引数据查询方式,应用到数据相对较小的数据库中,数据功能相对单一。不过,两者的功能都需要建立在分布式的文件系统层上,这也是服务模块设计的关键。
四、客户服务中心数据体验平台搭建路径
(一)以传输导向的收集模块搭建
以传输导向的收集模块搭建需要建立在以客服中心模块数据基础上的需求设计应用,传输导向模块中,明确平台数据收集、数据分析、数据服务等功能模块,将数据收集、指标计算、文件存储、报表应用等业务功能先期进行应用。在具体的功能结构应用上,还需要将数据收集后加以抽取与清洗,转化成数据平台数据。收集中,也可以分为实时收集、定期收集两种模式,便于存储数据库及收集离线内容,生成新的统计库模式。
在客服中心自身已经搭建的话务、业务平台上,先建立数据库记录模式,对通话的数据进行详细的记录,其包括时间、排队等信息,这些数据信息可以满足现阶段的服务需求,还可以形成集群的数据收集方式。例如:数据收集中,MySQL语句汇总的binlog日志就有三种模式以上,行动记录及对数据库的备份功能都是极具收集效果的。还有一种row模式,主要是对数据库执行准确的备份,包括存储过程、触发等数据,都是一种很好的解决方式,同时也很灵活。值得一提的是,现在一些大型的平台也会有开源组件,例如阿里巴巴集团的开源Canal,这些组件也可以在API接口下进行便捷的应用。
(二)以计算导向的分析模块搭建
以计算导向的分析模块搭建主要是对客服中心指标情况进行分析,其包括特定时间段内的运营查询及分析、座席指标统计等。在现有的条件下,座席指标包括对接通率、呼出成功率、服务水平、满意度等指标进行分析总结。对最终的运营数据及分析结果均可以按照实时计算、离线计算的方式,对最终的数据采取、分析、存储等都会起到很大的作用。在这一过程中,实时分析设计与实现按照Hive的实践方式,同步数据管理功能,数据库使用SQL功能操作,信息数据、关系数据等在无法满足存储需求的基础上,将数据转移应用到更大的数据平台功能上,从而提升其大数据存储及关系型数据库的开发功能作用。在文件数据源的基础上,源操作包括功能操作、数据表等,不同数据源创建的临时表操作模式也是不同的,也需要更多的兼容功能及高性能的数据运行能力。
(三)以存储导向的服务模块搭建
以存储导向的服务模块搭建主要以报表服务、文件存储服务功能为主,前者在查询功能设计的基础上按照报表服务类型进行分类查询,其计算结果按照指标控制类、查询导出类等进行信息操作的判断,具体的指标数据上还需要对角色的权限进行正确的判断,功能上主要是数据操作的查询及方法应用。后者在文件存储服务设计及实现上,其主要是文件管理功能,在存储的基础上,按照文件管理创建、删除、检索等功能,以文件ID映射的方式进行识别,所有的HDFS都是在同一目录层级下,功能创建及搭建更为简单,且支持多级目录的创建及应用。
总结
随着国内很多企业客服中心规模及需求的扩大,其在涉及数据体验平台设计及搭建需求主要有如下三个方面,一是对数据存储空间及数据处理要求不断增大,甚至对云数据存储及功能应用也提出了更高的要求。二是在结构化、非结构化的数据应用层,无论是语音数据,还是一些难以实现结构化的文本数据,其均存在巨大的数据存储、处理、分析的问题点。三是平台化数据处理机制的匮乏,这一问题不仅仅体现在T量级的数据处理上,数据丢失、分析问题也会在一些开源模式下应用更多的技术功能。为此,需要通过云服务功能及大数据处理功能,进一步解决数据存储、结构数据应用、平台数据处理机制等三大核心问题,进而为客户服务中心综合体验能力的提升提供更多数据化的功能基础。
编审评注:
客户在寻求服务的过程中,对于企业产品的使用、服务体验和个人诉求都是最接近真实的。其在服务过程中的很多信息都值得企业记录并加以挖掘分析,并在后续的产品改善、营销策略制定和提升客户满意度美誉度方面都有很大的应用前景。而采集、存储、分析和应用就是需要客服中心在考虑成本产出比最优的前提下,让服务数据得以最大化的利用,而这些的前提是企业和呼叫中心的领导是否已经想明白服务数据对企业的作用,以及如何做好数据产出、使用的闭环。至于采取何种技术和解决方案,则是在决策层想清楚大战略方面之后,就容易选型确定。拎着锤子找钉子却是当下一些迫切想将服务数据增值化操作的呼叫中心的典型场景。
——张辉
作者:杜秋;为呼叫中心研究者;
本文刊载于《客户世界》2020年5月刊。