浪潮发布基于KNL的并行开源深度学习框架CAFFE-MPI

德国当地时间6月20日,与英特尔宣布第二代至强Phi芯片“KnightsLanding”(以下称KNL)正式上市同步,浪潮在刚刚举行的第31届国际超算大会(ISC2016)上,全球首发基于最新KNL平台的深度学习计算框架Caffe-MPI,这标志着浪潮称为全球第一个在英特尔最新的KNL平台上完成Ca

【安防在线 www.anfang.cn】德国当地时间6月20日,与英特尔宣布第二代至强Phi芯片“Knights Landing”(以下称KNL)正式上市同步,浪潮在刚刚举行的第31届国际超算大会(ISC2016)上,全球首发基于最新KNL平台的深度学习计算框架Caffe-MPI,这标志着浪潮称为全球第一个在英特尔最新的KNL平台上完成Caffe并行开发的公司。

1

浪潮集团副总裁胡雷钧表示,此次KNL平台Caffe-MPI的发布,一方面显示出浪潮与英特尔紧密的合作关系,另一方面也将为全球深度学习用户带来新的协处理加速解决方案,让他们可以选择最贴合自身实际应用的异构加速技术。目前,浪潮推动的开源Caffe-MPI已受到中国、印度、美国等众多公司和研究机构的关注。

浪潮Caffe-MPI是全球首款高性能MPI集群版的Caffe深度学习计算框架,其采用成熟的MPI技术对Caffe予以数据并行的优化,其目标是解决深度学习计算模型训练的效率问题。Caffe是目前最快的深度卷积神经网络(DeepConvolutional Neural Networks,CNN)架构,它最早由UC伯克利实验室完成单机单卡的开发,针对CNN训练所设计。然而随着训练模型越来越复杂、训练数据越发庞大,单机单卡已经不能满足用户的实际需求。

浪潮发布基于KNL的并行开源深度学习框架CAFFE-MPI

为此,浪潮在伯克利caffe架构的基础上,针对HPC系统架构技术设计,率先完成了多机多卡的并行化开发,并完全保留了原始caffe架构的特性。浪潮Caffe-MPI硬件系统采用Lustre存储+IB网络+HPC集群,基于Lustre并行存储采用多进程+多线程机制并行读取训练数据,实现较高的IO吞吐;采用IB网络实现高速互联网,实现参数的快速传输和模型更新;采用数据并行机制,利用HPC集群实现大规模训练。同时,浪潮Caffe-MPI可以采用多机多卡同时训练,并可以部署到大规模训练平台上,实现对大规模数据样本的训练。

2

新一代Xeon Phi处理器Knights Landing既可以做协处理器,也可以单独做中央主处理器,处理器核心数量超过72个,并支持四线程,最多拥有288个线程,双精度浮点性能超过3TFlops,单精度则超过6TFlops,被业界视为在高性能计算和深度学习领域革命性的产品。随着此次浪潮率先发布基于KNL平台的Caffe-MPI,相信会有更多的用户感受到新技术在深度学习效率上带来的诸多提升。

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)
小安小安

相关推荐

  • 浪潮发力人工智能 发布AI品牌 TensorServer

    记者了解到,目前浪潮在服务器领域的合作已经具体深入到汽车、智慧城市、智能制造等多个领域;比如说浪潮与比亚迪已经在汽车生产车间、云轨无人检票系统上形成合作;与此同时,浪潮与平安科技在智慧城市和金融智能化方面的合作也取得了大量进展,加速平安在智能门禁、刷脸贷款、身份认证等 AI 场景的应用。

    2025年11月25日
  • 胡润发布独角兽榜单 旷视科技位列人工智能独角兽榜首

    近日有消息称监管层对券商作出指导,包括高端制造、人工智能、生物科技、云计算在内的四个行业若有“独角兽”,立即向发行部报告,符合相关规定者可以实行“即报即审”。胡润研究院早前发布了这四大行业主要的独角兽名单。在这份名单上,旷视科技Face++名列人工智能独角兽之首。其实早在2017年3月,这家公司就被国家科技部评为“独角兽”企业,位列人工智能企业首位。

    2025年11月25日 资讯
  • 地平线成功发布中国首款全球领先的嵌入式人工智能视觉芯片

    人工智能初创企业地平线成功发布中国首款全球领先的嵌入式人工智能“中国芯”,以“算法+芯片+云”的旗帜性成果,打造创新性的中国方案。

    2025年11月25日
  • 人工智能加速方案提供者深鉴科技

    深鉴科技创始人、CEO姚颂介绍,本轮融资一部分将继续用于安防和大数据领域的产品开发和市场销售,落地更多安防监控的终端产品和服务。另一方面,蚂蚁金服的战略资源注入,会帮助深鉴进一步开拓包括金融在内的更多应用场景;与三星之间则侧重于存储等方面的合作,为AI芯片打造以深度学习处理器为核心的智能化解决方案和高效的整体系统,以便多领域拓宽和产品落地,加速深鉴科技迈进商业化阶段。

    2025年11月25日
  • 阅面携手英特尔重磅发布“繁星” 计算机视觉迈入AI芯片新纪元

    本次发布会受到了各界人士的高度重视,阅面科技CEO赵京雷,英特尔业务推广负责人MansourBehrooz等行业重要人物都纷纷出席本次发布会。同时,有超过20家的专业媒体在现场进行体验与报道,数十家合作伙伴为新品站台,充分表达了他们对阅面科技的信任与支持。发布会通过产品、技术的深度阐述、用户体验、记者专访等环节,让各界人士对繁星有了更深入和全面的认识。

    2025年11月25日 资讯
  • GPU后端深度学习主流芯片 国内已有多个GPU替代方案

    目前已有厂商针对安防监控后端推出了GPU的替代方案。2018年10月份,华为自研的云端AI芯片N腾系列,基于达芬奇架构的华为N腾910。在年底,华为又推出了基于ARM的服务器芯片“Hi1620”,采用台积电7nm工艺制造,在ARMv8架构的基础上,华为自主设计了代号“TaiShan”(泰山)的核心,支持48核心、64核心+2.6/3.0GHz配置。百度发布AI“昆仑”芯片,它是目前行业内运行速度最快的智能芯片。

    2025年11月24日