寒武纪发布首款云端智能芯片CambriconMLU100

MLU100采用寒武纪最新的MLUv01架构和TSMC16nm工艺,可工作在平衡模式(1GHz主频)和高性能模式(1.3GHz主频),平衡模式下等效理论峰值速度达每秒128万亿次定点运算,高性能模式下等效理论峰值速度达每秒166.4万亿次定点运算,但典型板级功耗为80瓦,峰值功耗不超过110瓦。

  今年5月份,寒武纪发布了首款云端智能芯片CambriconMLU100,MLU100采用寒武纪最新的MLUv01架构和TSMC16nm工艺,可工作在平衡模式(1GHz主频)和高性能模式(1.3GHz主频),平衡模式下等效理论峰值速度达每秒128万亿次定点运算,高性能模式下等效理论峰值速度达每秒166.4万亿次定点运算,但典型板级功耗为80瓦,峰值功耗不超过110瓦。
寒武纪发布首款云端智能芯片CambriconMLU100
  与寒武纪系列终端处理器一样,MLU100云端芯片延续了寒武纪产品通用性的特点,支持各类深度学习和经典机器学习算法,满足视觉、语音、自然语言处理、经典数据挖掘等领域复杂场景下(如大数据量、多任务、多模态、低延时、高通量)的云端智能处理需求。
  基于MLU100的板卡使用PCIe接口,外形设计灵感来自于寒武纪地质时代的远古海洋生物三叶虫,以黑色、蓝色为主色调。基于MLU100智能处理卡,联想推出了ThinkSystemSR650,该云端智能服务器将支撑联想客户在机器学习/VDI/虚拟化/云/数据库/分析/SAP等方向的需求;中科曙光也同步推出了升级的“PHANERON”,该服务器性能更为强劲,支持2-10块寒武纪MLU处理卡,能灵活应对不同的智能应用负载。
  在R-CNN算法下MLU100与TeslaV100和TeslaP4的计算延迟对比,数据显示MLU100的计算延迟为125ms,TeslaV100的延迟为174ms,TeslaP4的延迟为1069ms,结果显而易见。

该文观点仅代表作者,本站仅提供信息存储空间服务,转载请注明出处。若需了解详细的安防行业方案,或有其它建议反馈,欢迎联系我们

(0)
小安小安

相关推荐

  • 中国人工智能商业落地百强发布 AI视觉技术企业影谱科技位列前八

    2018年为人工智能商业应用元年,商业化成为衡量企业竞争力的重要指标。近日, “2018全球智能+新商业峰会”公布了《2018年中国人工智能公司商业落地100榜单》,商汤、旷视、影谱、优必选、寒武纪等AI企业凭借出色的商业化能力跻身八强。

    2025年11月28日
  • 国内首款云端人工智能芯片发布

    云端智能芯片是面向人工智能领域大规模数据中心和服务器提供的核心芯片。5月3日,中国科学院发布国内首款云端人工智能芯片,理论峰值速度达每秒128万亿次定点运算,达到世界先进水平,将广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域――

    2025年11月28日
  • 核高基重大专项成果发布 芯片国产化进程加速

    据介绍,凭借持续技术创新,国产CPU的单核性能快速提升。有数据显示,飞腾、龙芯、申威和兆芯等国产CPU的单核性能从“十二五”初期不到Intel i3CPU的10%分别提升到36.4%、33.3%、25.8%和51.5%。采用重大专项持续支持的软硬件产品,“神威太湖之光”超级计算机CPU的峰值运算速度在2017年达到3万亿次,较2006年提升600倍。

    2025年11月27日
  • 全球首个AI 芯片基准测试国际标准正式发布

    AI 芯片基准测试国际标准的正式发布,标志着我国在AI芯片领域评测能力得到了国际认可,也是我国AI芯片科研人员对国际标准化研究的重要贡献,将为我国AI芯片技术、产品和评测走出国门开辟了道路。

    2025年11月26日
  • 我国首款嵌入式人工智能视觉芯片发布

    据地平线首席芯片架构师周峰介绍,“旭日”“征程”的核心优势在于,因为采用了地平线自主创新的技术架构和组合算法,芯片的计算速度可提升10倍以上。与通用芯片的商业模式不同,地平线的芯片更聚焦于不同场景下的具体应用,这将推动人工智能应用的加速落地。

    2025年11月26日
  • NetSpeed发布以AI为基础的芯片方案

    Orion AI为极致性能而生,片上带宽高达万亿位,并具备支持数千计算引擎的底层架构。它提供超宽数据通路,接口位宽高达1024位,内部结构位宽更高,并可支持高达4K字节的长突发传输。

    2025年11月26日