盘点2018年度最牛逼的30个机器学习项目！最后一个值得收藏！

在过去的一年中，我们比较了8,800多个开源机器学习项目，从中挑选出前30名，这个极具竞争力的排行榜，精选了2018年1月到12月期间发布的最佳开源机器学习库、数据集和应用程序等。Mybridge AI根据它们的受欢迎程度，参与度和新鲜度来评估。这30个开源项目的Github平均Star数为：3,558

开源项目对数据科学家用处很大，你可以通过阅读代码来学习，并在现有项目之上构建一些东西。话不多说，一起来看看上榜的项目有哪些：

FastText

https://github.com/facebookresearch/fastText Star 16675

微信图片_20181213105500.jpg

fasttext是facebook开源的一个词向量与文本分类工具，在2016年开源，典型应用场景是“带监督的文本分类问题”。

Deep-photo-styletransfer

https://github.com/luanfujun/deep-photo-styletransfer Star 9747

微信图片_20181213105546.jpg

深度摄影风格转换，此代码基于Torch。它已经在Ubuntu 14.04 LTS上进行了测试。上图就是该算法的图片风格转换对比。

face_recognition

https://github.com/ageitgey/face_recognition Star 8672

微信图片_20181213105600.jpg

Face Recognition 是一个基于 Python 的人脸识别库，它还提供了一个命令行工具，让你通过命令行对任意文件夹中的图像进行人脸识别操作。该库使用 dlib 顶尖的深度学习人脸识别技术构建，在户外脸部检测数据库基准(Labeled Faces in the Wild benchmark)上的准确率高达 99.38%。

Magenta

https://github.com/tensorflow/magenta Star 11752

微信图片_20181213105617.jpg

Project Magenta由Google Brain团队发布，其主要目标是利用机器学习创作艺术和谱写曲子。Project Magenta使用了 TensorFlow系统。

Sonnet

https://github.com/deepmind/sonnet Star 5731

微信图片_20181213105626.jpg

Sonnet 库使用面向对象的方法，允许创建定义一些前向传导计算的模块。模块用一些输入 Tensor 调用，添加操作到图里并返回输出 Tensor。其中一种设计选择是通过在随后调用相同的模块时自动重用变量来确保变量分享被透明化处理。

deeplearn.js

https://github.com/PAIR-code/deeplearnjs Star 5462

微信图片_20181213105637.jpg

DeepLearn.js 是 Google 推出的一个可用于机器智能并加速 WebGL 的开源 JavaScript 库，完全在浏览器中运行，不需要安装，不需要后端处理

fast-style-transfer

https://github.com/lengstrom/fast-style-transfer Star 4843

微信图片_20181213105655.jpg

快速风格迁移的TensorFlow实现，任意风格图和内容图0.1秒出结果。

Pysc2

https://github.com/deepmind/pysc2 Star 3683

微信图片_20181213105707.jpg

PySC2 是 DeepMind 开源的 “星际争霸II学习环境”（SC2LE）的 Python 组件，允许研究者较容易地使用暴雪的 feature-layer API 和自己的智能体。

AirSim

https://github.com/Microsoft/AirSim Star 3681

微信图片_20181213105734.jpg

AirSim 是微软开源的一个跨平台的建立在虚幻引擎（ Unreal Engine）上的无人机以及其它自主移动设备的模拟器。它支持硬件在循环与流行的飞行控制器的物理和视觉逼真模拟。

Facets

https://github.com/PAIR-code/facets Star 5054

微信图片_20181213105734.jpg

Facets 是 Google 开源的一款可视化工具，帮助理解、分析和调试 ML 数据集。Facets 包含两个部分 —— Facets Overview 和 Facets Dive ，允许用户以不同的粒度查看其数据的整体图像。

Style2Paints

https://github.com/lllyasviel/style2paints Star 8150

微信图片_20181213110158.jpg

STYLE2PAINTS 是新一代的线稿上色 AI ，可根据用户上传的自定义色彩给线稿进行上色。

Tensor2Tensor

https://github.com/tensorflow/tensor2tensor Star 3087

微信图片_20181213110208.jpg

Tensor2Tensor 是一个模块化和可扩展的库和二进制文件，用于在 TensorFlow 中训练深度学习模型，并专注于序列任务，由谷歌开发维护。

pytorch-CycleGAN-and-pix2pix

https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix Star 6197

微信图片_20181213110218.jpg

基于PyTorch的图像到图像翻译的项目，比如马到斑马，老鹰到猫等。当前的软件适用于PyTorch 0.4+

Faiss

https://github.com/facebookresearch/faiss Star 5181

微信图片_20181213110235.jpg

FAISS 是 Facebook AI 研究团队开源的针对聚类和相似性搜索库，用C++编写，它包含一种在任意大小的向量集合中搜索直到可能不适合在 RAM 中的新算法，还包含用于评估和参数调整的支持代码。

Fashion-mnist

https://github.com/zalandoresearch/fashion-mnist Star 4623

微信图片_20181213110246.jpg

FashionMNIST 是一个替代 MNIST 手写数字集的图像数据集，其涵盖了来自 10 种类别的共 7 万个不同商品的正面图片，FashionMNIST 的大小、格式和训练集 / 测试集划分与原始的 MNIST 完全一致。

ParlAI

https://github.com/facebookresearch/ParlAI Star 3933

微信图片_20181213110259.jpg

ParlAI是 Facebook 开源的，用于在 Python 中实现的对话 AI 研究框架。

Fairseq

https://github.com/facebookresearch/fairseq Star 3254

微信图片_20181213110311.jpg

Fairseq 使用一种全新的卷积神经网络（CNN）进行语言翻译，结果以 9 倍于以往循环神经网络（CNN）的速度实现了目前最高准确率。

Pyro

https://github.com/uber/pyro Star 4772

微信图片_20181213110323.jpg

Pyro 是 Uber AI 实验室开源的一款深度概率编程语言（PPL），基于 Python 与 PyTorch 之上，专注于变分推理，同时支持可组合推理算法。

iGAN

https://github.com/junyanz/iGAN Star 3121

微信图片_20181213110335.jpg

iGAN，又名 interactive GAN ，自然图像流形上的可视化操作的生成。该系统基于类似 GAN and DCGAN 这些深度生成模型（Deep Generative Models）

Deep-image-prior

https://github.com/DmitryUlyanov/deep-image-prior Star 3666

微信图片_20181213110350.jpg

它让一个深度卷积网络去学习复制被破坏的图像（如，加入噪点的图像），发现这个网络会自动先学会如何重建图像。

Face_classification

https://github.com/oarriaga/face_classification Star 3559

微信图片_20181213110417.jpg

利用fer2013/imdb 数据库、Keras CNN 模型和OpenCV进行实时脸部识别和情绪/性别分类。

Speech-to-Text-WaveNet

https://github.com/buriburisuri/speech-to-text-wavenet Star 2785

微信图片_20181213110431.jpg

用WaveNet和TensorFlow进行端到端的英语演讲语句识别。

StarGAN

https://github.com/yunjey/StarGAN Star 3347

微信图片_20181213110441.jpg

StarGAN，顾名思义，就是星形网络结构，在StarGAN中，生成网络G被实现成星形。

Ml-agents

https://github.com/Unity-Technologies/ml-agents Star 4608

TIM截图20181213111216.png

Unity机器学习代理（ML-Agents）是一款开源的Unity插件，让你可以在游戏环境和模拟环境中训练智能代理。

DeepVideoAnalytics

https://github.com/AKSHAYUBHAT/DeepVideoAnalytics/ Star 2337

微信图片_20181213110558.jpg

Deep Video Analytics提供了一个从视频和图像索引和提取信息的平台。使用深度学习检测和识别算法来用检测到的对象索引各个帧/图像。

OpenNMT

https://github.com/OpenNMT/OpenNMT Star 2039

微信图片_20181213110608.jpg

OpenNMT 是一个由 Harvard NLP (哈佛大学自然语言处理研究组) 开源的 Torch 神经网络机器翻译系统。

Pix2pixHD

https://github.com/NVIDIA/pix2pixHD Star 2696

微信图片_20181213110624.jpg

pix2pixHD 是英伟达开源的用条件 GANs （生成式对抗网络）进行 2048x1024 分辨率的图像合成和处理的项目，它可以用于将语义标签贴图转换为逼真的图像，或者从人脸标签贴图合成肖像。

Horovod

https://github.com/uber/horovod Star 4595

微信图片_20181213110635.jpg

Horovod 是 Uber 开源的针对 TensorFlow 的分布式深度学习框架，能够轻松采用单个 GPU TensorFlow 程序，同时也能更快地在多个 GPU 上成功地对其进行训练。

AI-Blocks

https://github.com/MrNothing/AI-Blocks Star 1518

微信图片_20181213110647.jpg

一款强大的WYSIWYG界面，能让任何人创建机器学习模型。

环信中文语义计算平台

https://www.easemob.com/product/ai Star 6666

环信中文语义计算平台是环信机器人推出的针对开发者的自然语言处理(NLP)的能力开放平台。环信中文语义计算平台在经过了近三年的核心算法能力提升和迭代后，在开放NLP基础算法能力的同时，也完整开放了在NLP领域经常使用的应用级别算法能力诸如：纠错、情感分析、意图识别、语义相似度计算等，帮助开发者们在NLP领域的应用环节具有更强的能力，快速应用落地在更多价值场景。

开源最前线（ID：OpenSourceTop）猿妹编译

综合自：https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7

产品

案例

文档

IM即时通讯云

客服云

客服机器人

部署方式

产品方案

核心优势

行业应用

开发文档

下载中心

生态伙伴

盘点2018年度最牛逼的30个机器学习项目！最后一个值得收藏！

相关推荐

周排行

申请试用

提交后工作人员会尽快与您联系进行功能演示

技术咨询已转移到管理后台，请先登录

注册享福利、赢好礼