目前,机器学习是软件开发中最热门的领域之一。甚至许多专家分析,认为机器学习将会彻底改变包括Web应用和移动应用在内的软件开发过程。
以下所列的几个方面可以清楚地说明机器学习对Web开发的重大影响:
· 可以很好的替代传统数据挖掘
· 可以避免安全威胁
· 丰富的机器学习API库
· 加速产品发展
· 生产定制的内容和信息
· 了解用户行为
机器学习通过一些算法可以在没有显式编程的情况下,让计算机进行自行学习。并且可以找到最优的数据分析方法,自动建立分析模型。这就是为什么机器学习框架在Web开发中起着重要作用的原因。
在本文中,我们将讨论一些主要用于Web开发的机器学习框架。下面会一一进行说明。
5大机器学习框架:
1) Microsoft Cognitive Toolkit
开发语言:Python和C++
这是一个开源的深度学习工具包,是微软公司专门用来训练算法的,以便让机器像人脑一样学习。通过这个工具,你可以使用各种机器学习模型,如卷积神经网络、前馈DNN和递归神经网络。
毫无疑问,这个工具主要使用神经网络来检查大型非结构化数据集,给开发者提供现成的神经网络代码。它有更短的训练时间和易于使用的体系结构,并且是高度可定制化的,允许选择参数、网络和算法。并且,它支持多机多GPU的后端集群模式。
2)TensorFlow
开发语言:Python、Java和Go
TensorFlow是在Java开发中最流行的机器学习框架之一。它是一个开源的库,使用了数据流图进行数值计算,将复杂的数据结构传输至神经网络中进行分析和处理。毫无疑问,TensorFlow是在GitHub上分支最多的机器学习项目,并且也是投资人参与最多的项目。
TensorFlow具有灵活的体系结构,让用户能够很容易地利用单一的API库在一个或多个GPU或CPU上实现分布式计算,而不管是在台式计算机、服务器还是移动电话上。
上图中的节点代表了数值运算,而图的边缘则表示它们之间通信的多维数据集(张量)。TensorFlow为张量从数据流图的一端流动到另一端的过程进行计算。
3)Apache Mahout
开发语言:Java和 Scala
这是Apache提供的另一个最流行的源码开放资源库,主要是为统计学专家、数据专家和数学专家而设计的,为了让他们能够更快速、更高效地执行算法操作。另外,它是一种分布式线性代数框架,用于创建具有可扩展性能的机器学习应用。Mahout主要被用于协作分组、过滤和分类几个方面。
此外,它还使你能够在实际运行在大数据平台上的交互式环境中开发自己的数学计算模型,然后可以将相同的程序代码移植到其它应用程序中进行复用。
Mahout Samsara还提供了分布式线性代数以及正在运行的统计引擎,并与交互式Shell和库一起进行分发,以连接到在生产中的应用。利用Apache Hadoop 库,它可以应用map/reduce模式到Apache Hadoop平台,但这并不会对Hadoop上其它那些实现产生影响。
4)Caffe
开发语言:C++和Python
Caffe是一个基于Java语言的关于深度学习的框架,特别是针对运行速度、表示能力和模块化几个方面。它是由伯克利大学人工智能研究小组开发的,极具表现力的体系结构更加支持个性化的应用和创新。
另外,Caffe提供的配置选项允许用户通过配置单个指示器在GPU和CPU之间进行无缝切换。它提供的可扩展代码促进了早期的发展,使其成为另一个非常成功的GitHub机器学习项目。
Caffe的速度对研究机构和工业级应用方面做出了很大的贡献。它是利用了卷积神经网络来实现图像分类/计算机视觉的。它还提供了Model Zoo,这是一组预训练的模型,并且不需要任何编码来实现。
应该指出的是,Caffe最适用于应用系统的构造,并且主要应用于计算机视觉领域。
5)Apache Singa
开发语言:C++、Python和Java.
Apache Siga是一个可扩展的、灵活的、用来简化在大数据上训练深度学习模型的开源框架。它是由新加坡国立大学的团队开发的,主要应用于大数据分析领域。该框架为海量数据可扩展的分布式训练提供了一种灵活的体系结构。
Apache Siga在各种各样的硬件上运行都具有可扩展性。它主要应用在自然语言处理(NLP)和图像识别领域。
目前,Apache孵化器项目提供了一种可以在一组节点中工作的简单开发模型。深度分布式学习在训练过程中使用了模型共享和并行化方式,模型既可以串行训练,也可以选择并行训练。Singa也使用Apache Zookeeper简化了集群的搭建。
不管怎样,Apache Siga也支持传统的机器学习模型,如逻辑回归等等。
结论
我们已经介绍了一些用于Java开发的最好的机器学习框架。事实上,应用了机器学习的Web开发将会使IT世界进行一场革命。然而,目前各种流行的机器学习框架和库不是用Python语言编写的,就是由Python支持的,主要包括Keras、Theano、TensorFlow和一些较小的项目,比如Microsoft Azure Studio、sci-kit learn、Veles、Chainer和Neon等等。
本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。
文章原标题《Top 5 Machine Learning Frameworks For Web Development》
译者:奥特曼,审校:袁虎。
文章为简译,更为详细的内容,请查看原文。