毫无疑问,AI 是目前最受关注的前沿科技,也是最热门的研究方向。
经过几十年的探索和发展,AI 在图像识别、语言识别、智能控制等领域取得了重大突破。现在,越来越多的行业都开始研究 AI,拥抱 AI,希望借助 AI,给自己赋能。
通信行业也不例外。
这些年,包括设备商和运营商在内的很多通信企业,都加大了对 AI 的研究投入,希望能探索出「通信+AI」的未来场景,抢占先机。
尤其是运营商,对 AI 简直是「望眼欲穿」。
一:通信行业为什么需要 AI?
通信行业对 AI 的迫切需求,是由网络发展的现状和未来决定的。
经过 2/3/4G 的发展,我们现在所面对的通信网络,是一个空前复杂的异构多域网络。各种技术混杂其中,网络架构臃肿,业务流程繁琐,给维护带来了巨大的压力。
如今,我们又要面临 5G 的到来。
5G,作为新一代移动通信标准,带来了网络性能和灵活性的大幅提升。但是,它同样也带来了网络复杂程度的进一步提升。
在空口方面,5G 使用了更高的频段,更灵活的空口资源划分方式,而且引入了 Massive MIMO 天线阵列技术。波束赋形如何有效控制,空口效率如何优化提升,给工程师们出了难题。
Massive MIMO 天线阵列
在网络架构方面,因为 SBA(微服务)、NFV/SDN 和切片技术的引入,网络变得灵活是没错,可是,维护的难度也变得更大了。虚拟机、切片资源的管理调度,网络参数的修改调整,都是非常繁琐的工作,风险也很大。
5G 网络架构
5G 带来的这些变化,如果继续采用传统的运维方式,继续依赖人工,肯定无以为继。
通信运营商,作为网络经营的主体,一方面要承担高昂的网络运营成本,另一方面还要投资建设 5G,资金压力更大,面临发展拐点。
因此,必须借助 AI,构建新的通信网络经营模式。
甚至,我们的网络要进化到更高级的形态——智能自治网络,才能应对挑战。
二:通信行业适合 AI 生长吗?
通信行业对于 AI 来说,是一块肥沃的土壤。
AI 的四大要素(数据、算力、算法、场景),通信全部可以提供完美的支持。
数据
数据,是 AI 之源。我们说人工智能,机器学习、深度学习,学的是什么?就是数据。
换句话说,数据就是喂养 AI 的饲料。数据越多,AI 越强。
什么行业数据多?当然是 IT 和通信啊。
我们的通信网络,几百万设备,几十亿手机终端,将来还有几百亿物联网终端,每天都在产生大量的数据。
这些数据里面,既有用户的数据,也有网络自身的管理和运营数据。数据格式比较统一,颗粒度也比较小,非常适合作为学习样本。
而且,我们通信网络本身就具有连接属性,可以很方便地将数据进行搬运采集。
算力
这个就更不用说了。运营商本身就有大量的数据中心(DC),有大量的云计算资源。这些资源,可以为 AI 提供强大的算力支撑。
除了云计算中心,未来还有大量的边缘计算中心,也能够提供灵活的算力。
哪怕是手机这样的用户终端设备,现在也拥有相当强的 AI 算力。
算法
通信行业在 AI 算法开发上也是有先天优势的。
通信网络的很多场景都有极强的规律性,也有很多现成的工作模型。这些都可以为 AI 算法模型提供参考依据。
三:哪些通信场景,可以使用 AI?
前面说了数据、算力和算法。接下来,我们重点说说场景。
所谓场景,就是要搞明白——AI 到底能帮助 5G 和传统通信做哪些事情?
国内外各大标准组织对 AI 在通信领域的落地场景,都有各自不同的定义。
下面这个,是 ETSI ENI 定义的场景:
这个,是 GSMA 的定义:
看着有点多,小枣君稍微整理了一下,大概包括以下几个类别:
无线网络优化
告警分析
流量预测
网络切片管理
网络能耗控制
网络安全防护
我们分别来介绍一下。
无线网络优化
移动通信网络的网络优化,直接影响到用户的网络体验,一直是运营商的工作重点。
说白了,如何用最少的钱,让大家拥有最好的信号,是运营商每天绞尽脑汁在做的事情。
无线网络的优化和固定网络有很大的不同。电磁波在空间中传播,存在很多的不确定性。无线场景复杂多样,外部干扰千奇百怪,信道变化随机性强。
为了做好网络优化,运营商不得不投入大量的资金和人力,聘用或租赁人数众多的网优工程师,专门从事信号质量测试以及调参等网优工作。
采用 AI 的话,可以借助算力,在海量的网优数据中抽取隐含的关联特征和规则,然后建立算法模型,优化参数调整策略,提高网络资源利用率以及网络容量。
设备商展示的 AI 无线网络优化方案
AI 不仅可以用于已建成网络的质量优化,在网络早期规划建设阶段,就可以引入 AI,帮助提升规划的合理性,降低后期成本。
目前,AI 算法主要应用在多维智能分析和智能价值评估两个流程中。
智能规划全流程(《智能自治网络案例报告》,GSMA)
值得一提的是,无线网络优化确实是比较复杂的场景,有时候甚至人类都难以辨别和归类。所以,早期阶段的传统 AI 算法,建模准确率低,效果并不理想。
后来,随着时间的推移,AI 算法不断改进和优化,才慢慢变得成熟和可靠。
由此可见,通信领域的 AI 算法,也是一个不断打磨的过程。
告警分析和故障处理
未来的网络,虽然拓扑结构复杂,但一定是端到端网元全程可视的。
也就是说,整张网络,所有网元,都会呈现在管理维护者的面前。同时,所有的告警数据、KPI 关键指标异常,也都是可视化的。
巨大的信息量,仅靠简单规则过滤或人工识别,是非常困难的。
真正有价值的信息,会被淹没在海量数据中,遭到忽视,给网络运行带来隐患。
引入 AI,可以基于现有相对成熟的规则库和经验建立更智能更精准的算法,帮助进行更有效的告警过滤。
告警根因分析处理流程(《智能自治网络案例报告》,GSMA)
AI 智能告警分析还有一个很大的优势,就是可以跨网元、跨地域、跨厂商进行关联告警分析,提升故障判断的准确率。
举个例子,传统方式下,当某项业务或功能异常,A 设备的工程师会发现告警,然后进行基本排查。如果找不到原因,会通知对端 B 设备的工程师排查。如果还未发现原因,再通知和业务关联的 C 甚至 D 设备的工程师排查。
AI 处理告警信息是联动的。它通过对各个设备告警信息的统一分析,根据之前学习的结果,直接就判断出最有可能的 Top3 原因。
这样一来,故障处理的效率就会大幅提升。
未来真正的自治网络,不仅能够自主发现故障,更可以实现故障自愈。
也就是说,发现故障或异常后,AI 在很短的时间内就可以进行类似 VM(虚拟机)自动隔离,备份资源接管等操作,第一时间内实现业务恢复,无需人为干预。
流量智能预测
通信业务流量趋势,具有非常明显的时间特点。每天不同时间、不同地点的业务量负荷,都有潜在的规律。
例如学校,就有很强的潮汐效应,白天宿舍区域流量小,教学区域流量大,晚上恰好相反。
除了平时之外,法定节假日期间的用户流量趋势,也有明显的特征。
引入 AI,对流量进行精准预测,可以帮助运营商提前对基站和承载网资源进行动态调整(扩容缩容)。自治网络下,AI 可以自己完成调整动作。
根据算法做出的预测,实际还是源于数据。一方面是当前实时的高颗粒度数据,另一方面,是往期的历史数据。
AI 可以根据这些数据,通过机器学习算法,学习出流量在时间和空间上的内在规律,从而得出预测结果,指导资源调整。
网络切片管理
网络切片,是 5G 带来的一个重要概念。
简单来说,它就是在物理网络上,划分出多个逻辑网络,实现不同的服务质量等级。
网络切片虽然好,但也带来了部署和维护的工作量。
AI 可以使用历史流量数据进行训练学习,从而预测各种场景下的资源需求,最终生成切片策略并下发。
在切片运行的过程中,AI 同样可以根据实时运行得到的数据,对模型和策略进行优化,让它们更加完美。
引入 AI,可以快速完成切片业务的部署,减少上线时间。在用户业务关闭后,第一时间释放切片以及对应的资源。
网络能耗控制
5G 网络的能耗一直都是一个大问题。在未来的网络运营过程中,虽然可以通过液冷等被动方式控制能耗,但更主要的手段,应该是动态调整功率输出的方式进行主动能耗控制。
这个和前文所说的 AI 性能动态调整场景有很大的关联。根据 AI 流量预测,调整资源分配,设备输出功率也随之变化,从而达到最佳效率,不浪费。
网络安全防护
目前通信网络面临前所未有的安全威胁。病毒、恶意攻击、敲诈勒索每天都在发生,而且数量激增。
病毒的演变越来越快,攻击类型也越来越复杂。传统的防御,是特征匹配的方式进行攻击识别,在识别成功率和效率方面越来越吃力。即使是专家进行人工分析,也很难保证准确率。
此外,万物互联时代,物联网爆发,网络会变得更加庞大复杂,被动防御的工作量和难度也会大幅增加。
未来,安全防御逐渐从被动防御走向主动防御,从辅助安全走向内生安全。这些都离不开 AI 的帮助和支持。
AI 通过对网络流量、终端行为、内容载荷以及系统日志等信息进行深度分析学习,识别异常行为、恶意代码和风险操作,并建立更灵活的模型,可以挖掘出隐藏更深的威胁。
此外,AI 对垃圾短信防控、网络合规扫描也有巨大的帮助。
四:AI 落地,有哪些挑战和困难?
前面吹了半天 AI 落地的好处,现在我们来看看 AI 落地的困难。
AI 那么强,是不是我们现在就能拿起来就用呢?
当然不是。
AI 的落地应用,对运营商和设备商来说,难度很大。这个难度,不仅是资金和技术方面的,更是人才和文化方面的。
资金我们就不多说了,现在干什么都离不开钱。我们先说说技术。
前面我们说的 AI 四大要素,从技术层面来讲,算力目前有专门的解决方案提供商,问题不太大。更多的问题,是集中在数据和算法上。
数据是发展 AI 的前提。没有高质量的数据,在此基础上建立的算法模型就没有准确率可言。
目前数据最大的问题,是不够「干净」。
对于不同的运营商,或者同一运营商的不同省市公司,数据的采集和存储缺乏统一的标准,也没有进行规范要求。这就容易导致数据的缺失和失真。
为了让数据能够被 AI 消化,运营商需要花费大量的精力对数据进行规整和清洗。这无形中增加 AI 落地的难度和成本。
此外,数据也不是想用就可以用的。
现在世界各国法规对用户数据的使用有越来越严格的要求,即使是运营商,也不能随便采集和使用用户的数据,必须符合合规的要求。
运营商握有数据,搞 AI 还比较方便。设备商就比较尴尬了,他们是没有数据的。
运营商那边不提供数据,设备商这边的研发和建模就没办法进行。运营商如果给设备商提供数据,也必须进行脱敏。
再来看看人才。
任何技术的研究都离不开人才,AI 也一样。
传统运营商和设备商,懂通信不懂 AI。而 AI 企业,懂 AI 不懂通信。如此一来,既懂通信又懂 AI 的人才,就显得非常宝贵。
尤其是运营商这边,作为 AI 落地的主要战场,AI 人才缺口更大。就算 AI 解决方案提供出来,基层没有 AI 工程师去驾驭,显然也是不行的。
除了人才之外,还有制度和文化。
AI 不是一项独立的技术,它需要整个运维工作流程和管理制度做出调整、配合,才能发挥威力。
各个岗位的员工,是否愿意接纳 AI,是否有 AI 意识,也是 AI 能够成功落地的关键。
总而言之,AI 不是一日建成的。整个通信行业的各个环节,都需要持续投入大量的时间、金钱、人力,去培养和孵化它。
五:「通信+AI」的未来
根据研究机构 Tractica/Ovum 的报告,电信行业中,AI 应用带来的年收入,将从 2016 年的 3.157 亿美元,增长至 2025 年的 113 亿美元。年复合增长率将达到 48.8%。
同时,报告还预测,到 2025 年,全球电信行业对人工智能软硬件和服务的投资将达到 367 亿美元。
另一家咨询机构 Analysis Mason 的调研报告也声称,80% 的运营商预期在 2025 年之前实现 40% 以上的网络运营自动化,其中约有三分之一的运营商预期网络自动化将达到 80% 以上。
通信+AI,是大势所趋。
目前,国内三大运营商和主流设备商都在 AI 方面有很大的投入,也有了可喜的成果。
中国移动的九天人工智能平台、中国电信的 CTNet2025 2.0,中国联通的智立方 CUBE-NET2.0+,都是针对 AI 的生态平台。他们希望通过平台赋能,吸引更多开发者使用他们的 AI 引擎,从而形成生态。
运营商的重点在于平台和生态,而设备商的重点在于场景化的解决方案。
前面我们介绍的场景,设备商都处于积极的开发阶段。算法模型在不断的打磨中,逐渐从低级走向高级。算法的效率,也在显著的提升。
按照目前的发展态势,待到 5G 成熟之日,也是 AI 全面落地开花之时。
六:最后的话
最后,小枣君想说一下,AI 对通信工程师职业发展的影响。
毫无疑问,通信网络往智能化方向发展的趋势是无法阻挡的,AI 对部分人工岗位的取代也是无法避免的。
我们现在还不能确定 AI 的发展速度到底能有多快,也不知道具体什么时候才能真正威胁到我们的饭碗。但是,提前规划,早做准备,是不会错的。
还是那句老话,越是低级的、重复的、机械化的工作,越有可能被 AI 取代。
如前文所说,我们通信人,先想办法成为通信+AI 的复合型人才。
既然 AI 要替我们来管理和维护网络,那么,我们干脆让自己成为管理 AI 的人。毕竟,再好的 AI,也必须在人类的管理之下工作。
我们通信工程师可以努力学习 AI 知识,成为一名 AI 专家,利用自身的网络运维经验,将通信专业知识和 AI 技能进行深度融合,可以设计出更好的 AI 模型算法,也能够帮助 AI 进行更有效率的训练优化。
总而言之,与其抗拒和排斥 AI,不如积极拥抱 AI,拥抱变化。能够适应变化的人,才能在变革浪潮到来之时,屹立潮头永不倒。
(文章来源:鲜枣课堂)