导语:不做 GPU,只做速率。 雷峰网独家获悉,海内一家专注超快流式推理芯片的创业公司——「寒序科技」公布完成数万万元融资,投资方为启高本钱、赛意财产基金,源合本钱担当本轮独家财政参谋。 此前,寒序科技一直较为低调,其AI推理系列(SpinPU-E Series)产物的相干进展于已往两年间并未对于外体系披露。 知恋人士吐露,寒序科技首颗芯片样片回片测试成果“很是抱负”,要害指标中,其「单元面积带宽」与Groq LPU(Language Process Unit,语言处置惩罚单位)披露一致,到达惊人的100 GB/s/妹妹^(2),这是权衡AI芯片推理机能的最主要指标,也是直指2000Tokens/s的底气。 于业内看来,这种能力决议了年夜模子(LLMs)推理时可否真正把“流式输出”、“高Tokens/s”做出来。要害的是,这家公司下一代芯片已经经于流片中,以“片上MRAM+SRAM”及“确定性流式乘加单位”,方针机能指向夸张的2000Tokens/s+,反不雅今朝主流对于话模子推理速率仅约30-50Tokens/s。 于当前推理芯片竞争中,这险些是最具辨识度的硬指标之一。也是以,靠近项目的人士将其评价为:海内少有的、真正沿着Groq标的目的往下打的团队。 值患上留意的是,业内近期遍及传说风闻,NVIDIA已经以约200亿美元估值级别锁定Groq的推理技能互助,并规划于NVIDIA GTC 2026行将发布的新一代AI推理体系中采用Groq芯片设计。寒序方案被业界认为是最切近该方案的超年夜带宽流式处置惩罚芯片。 与GPU线路差别,这家公司选择的是更聚焦、更极致的产物界说:不卷年夜而全,不卷通用练习,而把资源压到推理速率上,焦点理念四个字——唯「快」不破。 寒序科技建立在2023年8月,源在海内磁学研究主要高地「北京年夜学磁学中央」。焦点团队是海内首个有能力跑通从物理、质料、器件到异质集成、芯片设计、算法的交织团队。 有靠近本轮融资的人士告诉雷峰网(公家号:雷峰网),这家公司之以是近期最先对于外开释信息,一个主要配景是:其要害技能与样片验证已经经走过最伤害阶段。今朝,该公司新一轮融资也已经于推进中。 更多创业项目,添加微信ydinitialheart相识。 雷峰网原创文章,未经授权禁止转载。详情见转载须知。