当前位置:首页 > 站长资讯 > 正文内容

Cerebras 以最快的 Llama 4 Maverick 性能引领 LLM 推理竞赛

a811625538个月前 (05-29)站长资讯53

上周,Nvidia 宣布 DGX B200 中的 8 个 Blackwell GPU 可以在 meta 的 Llama 4 Maverick 上展示每个用户每秒 1,000 个代币 (TPS)。今天,同一家独立基准测试公司 Artificial Analysis 测得的 Cerebras 速度超过 2,500 TPS/用户,是 Nvidia 旗舰解决方案性能的两倍多。

“Cerebras 打破了 NVIDIA 上周创下的 Llama 4 Maverick 推理速度记录,”Artificial Analysis 联合创始人兼首席执行官 Micah Hill-Smith 说。“人工分析以每秒 2522 个令牌的速度对 Cerebras 的 Llama 4 Maverick 终端节点进行了基准测试,而同一型号的 NVIDIA Blackwell 每秒 1038 个令牌。我们已经测试了数十家供应商,Cerebras 是唯一优于 Blackwell 的 Meta 旗舰模型的推理解决方案。

凭借今天的结果,Cerebras 在 400B 参数 Llama 4 Maverick 模型上创下了 LLM 推理速度的世界纪录,该模型是 Llama 4 系列中更大、功能最强大的模型。人工分析测试了其他多家供应商,结果如下:SambaNova 794 t/s、Amazon 290 t/s、Groq 549 t/s、Google 125 t/s 和 Microsoft Azure 54 t/s。

Cerebras Systems 首席执行官 Andrew Feldman 表示:“当今企业中部署的最重要的 AI 应用程序( *** 、代码生成和复杂推理)都受到推理延迟的瓶颈。这些使用案例通常涉及多步骤思维链或大规模检索和规划,GPU 上的生成速度低至每秒 100 个令牌,导致等待时间长达几分钟,使生产部署不切实际。Cerebras 率先重新定义了 Llama、DeepSeek 和 Qwen 等模型的推理性能,经常提供超过 2500 TPS/用户。

凭借其创世界纪录的性能,Cerebras 是 Llama 4 在任何部署场景中的更佳解决方案。Cerebras Inference 不仅是之一个也是唯一一个在该模型上打破 2,500 TPS/用户里程碑的 API,而且与人工分析基准测试中使用的 Nvidia Blackwell 不同,Cerebras 硬件和 API 现已推出。Nvidia 使用了大多数用户无法使用的自定义软件优化。有趣的是,Nvidia 的推理提供商都没有提供 Nvidia 公布的性能的服务。这表明,为了实现 1000 TPS/用户,Nvidia 被迫通过批处理大小 1 或 2 来降低吞吐量,使 GPU 的利用率低于 1%。另一方面,Cerebras 在没有任何特殊内核优化的情况下实现了这一破纪录的性能,并且即将通过 Meta 即将推出的 API 服务提供给所有人。

对于推理、语音和 *** 工作流等尖端 AI 应用程序,速度至关重要。这些 AI 应用程序通过在推理过程中处理更多令牌来获得智能。这也会使他们变慢并迫使客户等待。当客户被迫等待时,他们会离开并转向提供更快答案的竞争对手——这是 Google 十多年前在搜索中展示的发现。

凭借创纪录的性能,Cerebras 硬件和由此产生的 API 服务是全球开发人员和企业 AI 用户的更佳选择。

扫描二维码推送至手机访问。

版权声明:本文由2345好导航站长资讯发布,如需转载请注明出处。

本文链接:http://2345hao.cn/blog/index.php/post/243.html

分享给朋友:

“Cerebras 以最快的 Llama 4 Maverick 性能引领 LLM 推理竞赛” 的相关文章

360安全公司公告:2.51亿元中标天津产业基地项目

360安全公司公告:2.51亿元中标天津产业基地项目

12月25日晚间消息,360公司今晚发布公告称,中标天津市高新区网络安全协同创新产业基地项目,中标金额2.51亿元。 这一中标金额刷新了此前360公司中标重庆合川项目的2.40亿元,也是目前A股网络安全公司所获政企业务项目的最高纪录。 公告显示,此次项目建设内容包括:城市安全大脑、基础网络...

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

高强度竞争领域注定容不下安逸,等待敲锣的协和电子正走在掉队的路上?

  扎根印制电路板技术研发二十年,专注于汽车电子、高频通讯等中高端领域的协和电子(605258)本周启动招股,下周四(11月19日)即将网上申购。   多年的沉淀,令其收获了一批优质客户。不过随着行业规模增长放缓、各类成本抬升以及行业龙头集中度提高,协和电子往日优势逐渐消退,利润水平也逐年降低,此...

手握采购、研发、销售三条“命脉” 谁是操控创耀科技命运的神秘“公司A”

手握采购、研发、销售三条“命脉” 谁是操控创耀科技命运的神秘“公司A”

  1947年,美国贝尔实验室的威廉.肖克利和他的两位助手布拉顿、巴丁,研制出了世界上第一只晶体管,为集成电路产业打开时代大门,也造就了现代信息社会的根基――“芯片”。   但是现代信息社会并不能避不开国与国之间的问题。   “芯片强则产业强,芯片兴则经济兴,没有高端芯片就没有真正的产业安全和国...

威腾电气IPO观察:自夸“头部企业”被打回原形 拿投资者4个亿只为“试试水”?

威腾电气IPO观察:自夸“头部企业”被打回原形 拿投资者4个亿只为“试试水”?

  威腾电气,一家缺乏科创属性、爱夸夸其谈还带着问题供应商的公司,正在冲击科创板市场。   2021年1月14日,以输配电中母线产品研发、制造及销售为主业的威腾电气,正式通过上市委会议,距离科创板上市又近了一步。   但这对投资者而言,可能并不是一件好事。   由于身在传统电力行业,科研步伐又...

19%市占率换不来业绩体量的和林微纳 新业务0.24%市占率又该如何期待?

19%市占率换不来业绩体量的和林微纳 新业务0.24%市占率又该如何期待?

  以19%市占率位居精微屏蔽罩市场头部玩家的和林微纳,即将亮相科创板。   2021年3月9日,主要产品为微机电(MEMS)精微电子零部件的和林微纳,开启了科创板招股。公司与楼氏电子、瑞声科技、裕元电子和银河机械,一同成为精微屏蔽罩市场的主要玩家,2019年五家企业合计占到全球市场总份额的80%...

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

新风光:核心材料严重依赖进口 毛利率下滑市场“风光”不再 |

  作为“光伏、风电”等大热门行业上游关键零部件供应商的新风光,即将登陆科创资本市场。   2021年3月24日,以大功率电力电子节能控制技术为核心技术平台,构筑电气控制装备产品体系的新风光,在科创板开启招股环节。   招股资料显示,新风光本次共计将募资5.9亿元,其中1.5亿元用于变频器和SV...