发布于 2020-09-29 17:01:54 | 阅读 43015
文中给出的 4 个类型也是 nlp 领域最为常用的文本表示了,文本是由每个单词构成的,而谈起词向量,one-hot 是可认为是最为简单的词向量,但存在维度灾难和语义鸿沟等问题;
发布于 2020-03-26 11:11:25 | 阅读 35674
近年来,自然语言处理技术逐渐成为应用范围最为广泛的人工智能技术之一。尤其是在深度学习浪潮的推动下,AI的这一分支取得了长足进步。
发布于 2020-03-17 11:41:11 | 阅读 24236
近日,谷歌宣布将 AI 语言模型 ELECTRA 作为 TensorFlow 之上的开源模型发布。该方法用到了一种称为替换令牌检测(RTD)的新预训练任务,使其能够在从所有输入位置学习的同时,训练双向模型。
发布于 2020-01-07 17:25:22 | 阅读 25430
对自然语音处理(NLP)领域而言,2019年是令人印象深刻的一年,本文将回顾2019年NLP和机器学习领域的重要事件。内容 主要集中于 NLP 领域,但也会包括一些与 AI 有关的有趣故事,包括新发布模型、工程成果、年度报告以及学习资源等。文章较长,将近万字,适合先马后看,静下心来细细研读。
发布于 2019-12-03 10:26:55 | 阅读 23144
NLP 技术的发展不能离开场景,场景和技术的有效结合才能充分发挥出 NLP 技术的能力。身在工业界,我每一天都为 NLP 技术和场景的各种可能组合激动不已。终于等到你,还好我没放弃!
发布于 2019-11-04 15:01:23 | 阅读 21374
截止 2019 年 10 月底,一款名为 HanLP 的自然语言处理类库在 GitHub Star 数达到了 15.5 K,超过了宾夕法尼亚大学的 NLTK、斯坦福大学的 CoreNLP、哈尔滨工业大学的 LTP。
发布于 2019-07-03 10:19:37 | 阅读 24292
Google 的 BERT 模型一经发布便点燃了 NLP 各界的欢腾,Google Brain 的资深研究科学家 Thang Luong 曾给出其“开启了 NLP 新时代”的高度定义,国内外许多公司及开发者对其进行了研究及应用,本文作者及其团队对 BERT 进行了应用探索。
发布于 2019-04-01 16:57:02 | 阅读 31821
NLP的快速增长主要得益于通过预训练模型实现转移学习的概念。在NLP中,转移学习本质上是指在一个数据集上训练模型,然后调整该模型以便在不同数据集上实现NLP的功能。