斯坦福大学专家在最近的一份人工智能报告中得出结论,越来越强大的AI应用可能会在未来几年内对我们的社会和经济产生深远的影响,尤其是在从现在到2030年的时间段。
以下是一些最先进的开源AI应用程序:
Caffe
Caffe是一个基于表达体系结构和可扩展代码的深度学习框架,由贾扬清在加州大学伯克利分校的读博期间创建。其速度使其在研究人员和企业用户中广受欢迎。根据其网站,Caffe可以在一天之内只用一个NVIDIA K40 GPU处理超过6000万张图像。它由伯克利视野和学习中心(BVLC)管理,并得到NVIDIA和亚马逊等公司的支持。
CNTK
CNTK是微软的开源人工智能工具,是Computational Network Toolkit的缩写。它可以在单个CPU、单个GPU、多个GPU或拥有多个GPU的多台机器上高效运行。微软主要用它来研究语音识别,但它也在机器翻译、图像识别、图像字幕、文本处理、语言理解和语言建模等领域有广泛的应用。
Deeplearning4j
Deeplearning4j是一个用于Java虚拟机(JVM)的开源深度学习库。它运行在分布式环境中,并集成在Hadoop和Apache Spark中。这使其可以配置深度神经网络,并且与Java、Scala和其他JVM语言兼容。
DMTK
DMTK(Distributed Machine Learning Toolkit)是微软的开源人工智能工具,如同CNTK一样。它被设计为大数据应用程序,目标是更快速地训练人工智能系统。它包括三个主要组件:DMTK框架、LightLDA主题模型算法和分布式(多义)字嵌入算法。为了证明其速度,微软声称它能够在具有100万个主题和1000万个单词词汇表(总计10万亿个参数)的机器上训练一个主题模型,在一个文档中收集1000亿个符号。这一成就远远超过其他工具。
H2O
与专注于研究的工具不同,H2O更注重为企业用户提供AI服务。因此,H2O拥有大量的公司客户,包括First Capital Financial Corporation、思科、Nielsen Catalina、PayPal和泛美。它声称任何人都可以使用机器学习和预测分析的力量来解决业务难题。它可以用于预测建模、风险和欺诈分析、保险分析、广告技术、医疗保健和客户情报。它有两个开源版本:标准版H2O和集成在Apache Spark中的Sparkling Water版。它还提供付费的企业支持。
Mahout
作为Apache基金会的一个项目,Mahout是一个开源机器学习框架。根据其网站,它具有三个主要特性:构建可扩展算法的编程环境、预制算法工具(如Spark和H2O)和一个用于矢量数学实验的环境,称为Samsara。使用Mahout的公司包括Adobe、埃森哲咨询、Foursquare、英特尔、领英、Twitter、雅虎等等。其网站列出了第三方专业支持。
MLlib
得益于其速度,Apache Spark已成为最流行的大数据处理工具之一。MLlib是Spark的可扩展机器学习库。它集成了Hadoop,并可以与NumPy和R进行交互操作。它包含广泛的机器学习算法,如分类、回归、决策树、推荐、聚类、主题建模、特征转换、模型评估、ML管道架构、ML持久化、生存分析、频繁项集和序列模式挖掘、分布式线性代数和统计。
NuPIC
由Numenta公司管理的NuPIC是一个基于分层暂时记忆理论的开源人工智能项目。从本质上讲,HTM试图创建一个计算机系统来模仿人类大脑皮层。他们的目标是创造一台机器,在许多认知任务上接近或超越人类认知能力。除了开源许可之外,Numenta还提供NuPIC的商业许可协议,并授权其技术专利。
OpenNN
OpenNN是一个C++编程库,实现了神经网络算法,为开发人员和研究人员提供了高级AI。其关键特性包括:一种用于构建定制神经网络的直观编程模型、支持各种神经网络架构(如卷积神经网络和循环神经网络)、高效的并行计算、一个交互式调试器和一个用于可视化网络过程的模块。OpenNN被用于广泛的应用,包括图像识别、自然语言处理和预测建模。
这些开源AI应用程序代表了该领域最前沿的研究。随着人工智能在未来几年的不断发展,我们可以期待这些工具以及其他新工具将对我们的社会和经济产生越来越深远的影响。
评论(0)