偷拍 自拍 联思布告旗下首款AMD AI事业器单机部署满血版DeepSeek大模子,可完满极限迷糊量6708 token/s
发布日期:2025-03-19 11:35 点击次数:63新浪科技讯 3月17日下昼讯息偷拍 自拍,联思布告旗下首款AMD AI大模子磨真金不怕火事业器联思问天WA7785a G3在单机部署671B(满血版) DeepSeek大模子时,可完满极限迷糊量6708token/s,将单台事业器动手大模子的性能推向了新高。
パナソニック 分電盤 大形リミッタースペースなし 露出・半埋込両用形依托联思万全异构智算平台,联思通过访存优化、显存优化、PCIe 5.0全互联架构翻新以及精选SGLang框架中性能最优算子等诸多翻新状态,对大模子从预磨真金不怕火、后磨真金不怕火到推理的全进程进行执续优化,在单台部署DeepSeek 671B大模子的联思问天WA7785a G3上实测最高迷糊量达6708 token/s。
在模拟问题对话场景(高下文序列长度128/1K)时,最高可支执并发数158,TPOT 93毫秒, TTFT 2.01秒;而在模拟代码生成(高下文序列长度512/4K )时,并发数可达140,TPOT 100毫秒, TTFT 5.53秒。这一收获意味着单台联思问天WA7785a G3不错相沿1500东谈主领域企业的平方使用,是继联思问天WA7780 G3事业器单机部署满血版DeepSeek 大模子总迷糊量打破2500 token/s之后,单机部署该大模子推感性能的又一次打破。
联思方面称,这次打破是联思中国基础步地业务群、联思商讨院ICI履行室和AMD聚首策画、协同调优、共同完满的。此恶果也并非最终恶果, 联思与AMD 还在执续尝试深度调优新门径,完满更高调优打破。

职守裁剪:郝欣煜 偷拍 自拍