NVIDIA针对大规模数据分析和机器学习推出RAPIDS开源GPU加速平台

“数据分析和机器学习是高性能计算市场中最大的细分市场,不过目前尚未实现加速,“NVIDIA创始人兼首席执行官黄仁勋在GPU技术大会主旨演讲中发布RAPIDS时表示,”全球最大的行业均在海量服务器上运行机器学习算法,目的在于了解所在市场和环境中的复杂模式,同时迅速、精准地做出将直接影响其基础的预测。 “

2018年10月10日,NVIDIA今日发布了一款针对数据科学和机器学习的GPU加速平台,该平台已为多个行业领先者所采用,并能帮助超大规模公司以前所未有的速度分析海量数据并进行精准的业务预测。


RAPIDS™ 开源软件帮助数据科学家显著地提高了工作绩效,对于这些数据科学家来说,种种业务挑战应接不暇,其中包括预估信用卡诈骗、预测零售存货及理解顾客购买行为等等。众多公司――无论是Databricks和Anaconda等开源社区先驱还是Hewlett Packard Enterprise、IBM和Oracle等技术领袖――在GPU对数据分析的重要性方面日益达成共识,并对RAPIDS表现出越来越多的支持。


据分析师估计,面向数据科学和机器学习的服务器市场每年价值约为200亿美元,加上科学分析和深度学习市场,高性能计算市场总价值大约为360亿美元。


“数据分析和机器学习是高性能计算市场中最大的细分市场,不过目前尚未实现加速,“NVIDIA创始人兼首席执行官黄仁勋在GPU技术大会主旨演讲中发布RAPIDS时表示,”全球最大的行业均在海量服务器上运行机器学习算法,目的在于了解所在市场和环境中的复杂模式,同时迅速、精准地做出将直接影响其基础的预测。 “


黄仁勋表示,“得益于CUDA及其全球生态系统以及与开源社区紧密合作,我们已创建了RAPIDS GPU加速平台。该平台已与全球最流行的数据科学库及工作流无缝整合,可加速机器学习。如同深度学习一样,我们正在不断地为机器学习提速。”


RAPIDS已为GPU加速分析和机器学习提供了一整套开源库,数据可视化即将是下一个目标。RAPIDS由NVIDIA工程师与主要的开源贡献者在过去两年的合作成果。


RAPIDS第一次为数据科学家提供了他们需要用来在GPU上运行整个数据科学管线的工具。最初的RAPIDS基准分析利用了XGBoost机器学习算法在NVIDIA DGX-2™ 系统上进行训练,结果表明,与仅有CPU的系统相比,其速度能加快50倍。这可帮助数据科学家将典型训练时间从数天减少到数小时,或者从数小时减少到数分钟,具体取决于其数据集的规模。


与开源社区开展紧密合作


RAPIDS构建于Apache Arrow、pandas和scikit-learn等流行的开源项目之上,为最流行的Python数据科学工具链带来了GPU提速。为了将更多的机器学习库和功能引入RAPIDS,NVIDIA广泛地与开源生态系统贡献者展开合作 ,其中包括Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、Ursa Labs 负责人兼Apache Arrow缔造者Wes McKinney以及迅速增长的Python数据科学库pandas等等。


McKinney表示,“作为GPU加速的数据科学平台,RAPIDS是由Apache Arrow驱动的新一代的计算生态系统。NVIDIA与Ursa Labs的合作将加速Arrow核心数据库的创新步伐,并有助于大幅提升分析及特征工程的绩效。”


为了推动RAPIDS的广泛应用,NVIDIA正努力将RAPIDS与Apache Spark进行整合,后者是分析及数据科学方面领先的开源框架。


Databricks联合创始人、首席技术官兼Apache Spark 创始人Matei Zaharia表示,“在Databricks公司中,我们对RAPIDS在加速Apache Spark工作量方面的潜力感到非常兴奋。我们目前开展的多个项目都意在将Spark更好地与本地加速器进行整合,其中包括借助Project Hydrogen实现的Apache Arrow的支持以及GPU调度。我们相信,就扩大我们客户数据科学及AI工作量来说,RAPIDS将是全新的、振奋人心的机会。”


广泛的生态系统支持及应用


各个行业技术领先的企业均是NVIDIA GPU加速平台及RAPIDS的率先应用者。


沃尔玛执行副总裁兼首席技术官Jeremy King表示,“NVIDIA的GPU加速平台及RAPIDS软件极大改进了我们使用数据的方式,帮助我们实现了复杂模式大规模地运行,同时进行更加精准的预测。RAPIDS的应用得益于NVIDIA和沃尔玛工程师之间的深度合作,我们准备继续推进这种合作关系。”


此外,一些全球领先的技术公司也力图通过全新的系统、数据科学平台和软件解决方案支持RAPIDS:


“HPE致力于改进客户生活和工作的方式。人工智能、分析和机器学习技术能在揭示洞察方面扮演关键的角色,这有助于帮助客户实现突破性的成果,同时改善我们所生存的世界。HPE提供全面的人工智能和数据分析解决方案并在市场中保持独一无二的优势,其中既包括战略咨询,也包括专为特定需求开发的GPU加速器技术、运行支持以及强大的伙伴生态系统;我们旨在为每位客户定制合适的解决方案。我们对与NVIDIA在RAPIDS方面的合作感到非常兴奋,此举能加快数据科学和机器学习的应用,推动我们的客户更快地实现更具洞察力的成果。”


― 惠普企业首席执行官Antonio Neri


“IBM已为企业人工智能构建了全球领先的、在任何部署模式上均能运行的平台。我们期望能拓展与NVIDIA已有的成功合作,利用RAPIDS来为客户提供全新的机器学习工具。”


― Hybrid Cloud高级副总裁兼IBM Research董事 Arvind Krishna


“当今的计算领域要要强大的处理能力,以便应对数据科学和分析智能等纷繁复杂的工作,而这正是NVIDIA GPU的优势。RAPIDS正在不断加速处理和机器学习培训的速度。能在Oracle Cloud Infrastructure上支持这套全新的开源软件让我们感到非常兴奋,我们也希望能与NVIDIA继续合作,以在我们的Oracle Data Science Cloud等各种平台上支持RAPIDS,并进一步加速客户端到端数据科学工作流。RAPIDS软件在Oracle Cloud上无缝运行,这使客户得以支持各种高性能计算、人工智能和数据科学需求,同时利用Oracle Cloud Infrastructure 上可获得的GPU实例组合。”


― Oracle Cloud Infrastructure软件开发部门高级副总裁Clay Magouyrk

NVIDIA针对大规模数据分析和机器学习推出RAPIDS开源GPU加速平台

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)
小安小安

相关推荐

  • 用好算法,迈向智能社会

    人工智能具有多学科综合、高度复杂的特征,在推动其快速发展的各项技术中,算法至关重要。当前,“算法”一词也频繁出现在公众视野,深度学习、智能推荐广泛应用在我们的日常生活中。

    2026年1月2日
  • 智能交通从运力时代向算力时代跨越

    交通是经济行稳致远的压舱石,是我国国民经济的大动脉,承载着人民群众对美好生活的向往。在新一轮科技革命和产业革命的推动下,“智能”成为推动交通运输行业质量变革、效力变革、动力变革的重要力量。

    2026年1月2日
  • 隐私计算助力数据“开放流通”与“合规安全”

    随着全球数字经济的快速发展,数字化转型快速推进,全球连接设备规模化增长、产生数据维度更加丰富。数据增值、数据联动并赋能千行百业将成为驱动数字经济发展的重要力量。

    2026年1月2日
  • 数智化时代,云计算发展与时俱进

    随着数字化转型进程加快,云计算技术成为企业数字化业务运转的重要支撑。特别是疫情催化、政策加码、市场需求激增,多种变革力量交织汇聚,使数字化转型发展浪潮呈螺旋式上升,企业顺势转型已是必然。云计算通过资源池化,助力企业实现以客户为中心价值链的最短路径,驱动技术、业务、决策的深度融合,成为企业数字化转型的关键技术之一。

    2026年1月2日
  • 2022年5大网络管理发展趋势

    近年来,网络管理的发展趋势也在发生一些变化。企业网络在以往通常采用局域网技术,它使企业内部员工相互保持联系。随着互联网时代的到来,需要与外部世界建立更紧密的联系。Wi-Fi随后占据了上风。企业现在需要提供强大的无线局域网,并帮助远程工作的员工建立与网络的良好连接。边缘网络现在就在人们身边。

    2026年1月1日
  • 从医疗到超算希捷Exos CORVAULT赋能各行业海量数据存储需求

    和如今大多数行业一样,医疗行业也正处于数字化转型的高速发展期。随着医疗技术进步和存储需求提升,医学影像数据量飞速增长,数据安全、备份、数据保护等工作得到了医疗机构与医疗信息化从业者的密切关注。与此同时,医学影像的移动化应用成为常态,基于医学影像的人工智能辅助诊断也在逐渐兴起。如何用更佳的方式存储数据,如何搭建高速度、高容量、高可靠性的存储方案,适应不断涌现的数据使用需求,是医疗机构的核心关注点。

    2026年1月1日 资讯