【硬件资讯】干TMD的NVIDIA!突破CUDA封锁国产显卡

 新闻资讯     |      2023-12-27 04:51

  【硬件资讯】干TMD的NVIDIA!突破CUDA封锁国产显卡摩尔线程推出全新加速卡支持CUDA生态零成本迁移!新 闻①: 摩尔线程发布全新加速卡MTT S4000,可实现CUDA代码零成本迁移到MUSA平台

  摩尔线程宣布,首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京成功举办,宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地。同时摩尔线程还带来了大模型智算加速卡MTT S4000,采用第三代MUSA内核,单卡支持48GB显存和768GB/s的显存带宽。

  摩尔线程KUAE智算中心解决方案以全功能GPU为底座,是软硬一体化的全栈解决方案,包括以KUAE计算集群为核心的基础设施、KUAE Platform集群管理平台以及KUAE ModelStudio模型服务,旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题。摩尔线程称,新方案可实现开箱即用,大大降低传统算力建设、应用开发和运维运营平台搭建的时间成本,实现快速投放市场开展商业化运营。

  全新智算加速卡MTT S4000基于摩尔线技术,支持多卡互联,助力千亿大模型的分布式计算加速。新产品不但提供了先进的图形渲染能力、视频编解码能力和超高清8K HDR显示能力,还能支持AI计算、图形渲染、多媒体等综合应用场景。更为重要的是,借助摩尔线程自研MUSIFY开发工具,MTT S4000计算卡可以充分利用现有CUDA软件生态,实现CUDA代码零成本迁移到MUSA平台。

  摩尔线程还联合十余家企业,共同宣布成立“摩尔线程PES - KUAE智算联盟”。未来将大力建设和推广从底层硬件到软件、工具到应用的全国产智算平台,旨在实现集群的高利用率,以好用、易用的全栈智算解决方案成为大模型训练首选。

  前有NVIDIA的DLSS被FSR 3给NTR,现在又是CUDA被摩尔线程给NTR,NVIDIA真的好惨啊。之前我们说过,CUDA作为NVIDIA在专业领域的护城河,不少专业应用只支持低效的CPU运算和CUDA,封锁了其它高效GPU、NPU的加入。但现在,先有华为昇腾NPU,现在摩尔线程的MUSIFY开发工具更是直接可以把CUDA生态的代码无损拿到自己的MUSA平台,真的太强了!突破CUDA的希望难道在中国芯片上吗?除了生态问题,我们再看回新发布的加速卡MTT S4000,从官方现在放出的性能参数,在传统的浮点运算性能上已经不弱了,算得上计算卡中靠前的存在,但在AI领域比较重要的INT8算力就要差上很多了,看来摩尔线程此次的重心并不在此,更在意的是传统运算的加速,希望能在未来看到摩尔线程的AI加速卡吧!狠狠的利用CUDA生态!

  摩尔线程今日发布版本号为 v240.50.0.1 的社区版驱动。新的社区版驱动程序在 Windows 10 操作系统下可以支持 HDR 显示功能。

  游戏体验方面,对比 10 月发布的 v230.40.0.2 社区版驱动,新版在《街霸 5》中平均帧率提升超过 15%,《命运方舟》(WeGame)平均帧率提升超过 15%,《无畏契约》和《地铁 2033》平均帧率提升超过 10%,《最终幻想 XIV:晓月之终途》和《Dota2》平均帧率提升接近 10%。

  MTT S80 游戏显卡搭载了完整的“春晓”芯片核心,内置 4096 个 MUSA 流处理核心,配备 16GB GDDR6 高速显存,在 1.8GHz 的主频下,能够提供 14.4TFLOPS 的单精度浮点算力。

  而在家用显卡的领域,摩尔线程也在一如既往的带来重大更新,真正的“养成系”显卡。此次的更新带来的Windows系统下的HDR支持,以及大幅的游戏性能提升,这种两位数的游戏性能提升似乎已经成了摩尔线程每次大更新都会有的项目了,有些游戏算下来至少比刚发布的时候提升50%以上,这在其它显卡上可是闻所未闻的。对于传统的显卡厂商,我们往往会吐槽一句不调好就发布,但对于初生的第一代国产显卡,它发布之初确实没有调的机会和数据,现在能调了也没藏到下一代,而是大方的拿给消费者,这怎么又不能算是一种良心呢?

  新 闻 ③ : 英伟达CFO称考虑第三家晶圆代工厂,与英特尔代工服务合作越来越近

  据DigiTimes报道,近日英伟达首席财务官Colette Kress在瑞银全球科技会上被问及,下一代芯片是否会考虑英特尔作为晶圆代工伙伴。对此Colette Kress回应道,市场上有许多强大的晶圆代工厂,台积电(TSMC)是其中之一,三星也排名前列,至于英伟达是否有考虑第三家晶圆代工厂,答案是肯定的。

  目前英伟达大部分GPU都交由台积电代工,包括大量用于人工智能(AI)和高性能计算(HPC)的数据中心GPU,以及面向游戏玩家的新一代Ada Lovelace架构GPU,而三星则主要生产上一代基于Ampere架构的GPU。短期来说,台积电和三星的产能足够应付英伟达所需要的产能。

  除了正常的成本和产能原因外,英伟达当然也需要考虑其他的因素,所以拥有不俗技术实力的英特尔代工服务(IFS)自然也进入到英伟达的视野中。事实上,早在今年5月的Computex 2023媒体互动问答环节中,英伟达创始人兼首席执行官黄仁勋就曾表示,正在努力实现芯片制造的多元化,而且收到了英特尔的代工服务制造的测试芯片,结果看起来不错。

  当时黄仁勋并没有透露具体是什么样的芯片,也没有告知测试芯片具体采用了哪一种工艺制造。不过从英伟达的行动来看,考虑加入第三家晶圆代工厂应该早已在计划当中。

  Intel那边还在忙着干NVIDIA,CEO帕特-基尔辛格更是露骨的称整个行业都在积极摆脱CUDA,但NVIDIA却还是在积极考虑Intel的代工服务,这就是爱情吗?企业之间尤其是竞争企业之间可没有这样的情谊,NVIDIA作为一家纯粹的芯片设计公司,并不像Intel或者未剥离格罗方德之前的AMD那样,可以自主生产,而是过分依赖代工。依赖代工,就会受制于代工费用以及代工厂产能,事实上今年AI爆火,NVIDIA的加速卡就一直不能满足订单,寻找其它代工渠道是一定的了,这也是NVIDIA业务扩张的需求。而Intel很可能只是第三备选,甚至要排在三星之后,毕竟Intel那个产能自己都不够用,工艺先进程度在这几年也不一定了,不然为啥连计算模块都考虑台积电代工,Intel的晶圆代工业务可能还要惨淡很久啊。