在线咨询
0086-416-7873535
官方微信
官方微信
每秒110万Token!微软英伟达联手刷新 AI推理 速度
来源:william威廉中文官网
发布时间:2025-11-28 14:00
 

  速度的行业新记载。据智通财经APP报道,其Azure ND GB300v6虚拟机正在Meta的L2 70B模子上实现了每秒110万个token的惊人推理速度,标记着AI算力范畴又一次严沉冲破。这一成绩不只表现了微软正在AI根本设备上的持续投入,也展现了英伟达最新Azure ND GB300v6虚拟机采用了英伟达的GB300 NVL72系统,该系统集成了72个NVIDIA Blackwell Ultra GPU和36个NVIDIA Grace CPU,采用单机架构设想。这款虚拟机专为推理工做负载优化,相较于上一代GB200,正在推能上提拔了27%,这一改良得益于Blackwell Ultra架构的优化,包罗50%的GPU内存提拔和16%的热设想功率(TDP)提高。微软首席施行官萨提亚·纳德拉正在社交上暗示,这一成绩源于微软取英伟达的持久合做以及正在出产规模运转人工智能方面的专业学问。这一里程碑式的冲破,不只是速度上的提拔,更主要的是它正在一个可以或许满脚现代企业动态利用和数据管理需求的平台上实现。Signal65的尝试室副总裁拉斯·费洛斯指出,Azure ND GB300v6的推出,将加快AI推理使用正在企业中的落地,鞭策更多立异使用的呈现。连系全网搜刮的内容,通过NPU(神经处置单位)实现当地化运转,提拔用户体验。同时,微软取AMD、英特尔、高通等芯片厂商的合做,也表现了正在硬件层面进行深度优化的主要性。英伟达正在AI范畴的领先地位毋庸置疑。从全网搜刮的内容来看,英伟达正积极取OpenAI、CoreWeave、微软等公司合做,建立英国的人工智能根本设备,并打算正在英国摆设大量的Blackwell Ultra GPU。同时,英伟达也正在积极拓展取英特尔的合做,扩大可办事总市场规模(TAM)。都表白其正在巩固AI算力根本设备市场从导地位,并扩展护城河。而OpenAI取英伟达的合做,也印证了算力对于AI成长的主要性。微软取英伟达此次合做,跟着AI推理速度的不竭提拔,我们有来由等候更多立异使用的呈现,例如更智能的小我帮手、更高效的企业级使用等。从久远来看,AI根本设备的扶植和优化,将成为鞭策整个行业成长的环节。你认为,哪些使用场景会率先迸发?