算力是智能时代的土壤,其规模与效率决定着数字未来的疆界。
“让有计算的地方,就有‘无穹’的智能涌现。”WAIC2024召开时,无问芯穹联合创始人、CEO夏立雪还站在一个小论坛舞台上,WAIC2025召开时,无问芯穹的论坛被搬上了更大的舞台,转变发生在DeepSeek激活国产算力的那个春节。
无问芯穹一直想做“AI算力界的安卓系统”,像桥梁一般,将模型和芯片协同优化,让自主可控的AI基础设施从“能用”迈向“好用”,将算力成本打下来。
“两年前,我们惊艳于几千卡集群训练而成的GPT3.5,但今年,一部手机也可以装下与它同等性能的小型AI了。”夏立雪指出,顶尖模型不断从大规模算力下放到中等算力、小算力场景中。
在WAIC2025上,无问芯穹发布了“三个盒子”:针对万卡至十万卡级全局算力网络的“无穷AI云”,针对百卡至千卡级大型智慧集群的“无界智算平台”,以及针对单卡至十卡级有限算力终端的“无垠终端智能”解决方案。夏立雪将这一系列产品形象地称之为“大盒子”“中盒子”和“小盒子”。
无问芯穹想要将散落在全国各地的算力汇聚到一个池子里,构成一张异构、异域、异属的算力网,可以像水电煤一样随取随用。
“大盒子”无穹AI云的底层就是这张覆盖全国的算力网,基于无问芯穹“一网三异”调度架构,目前已成功覆盖“东数西算”国家战略布局的关键节点,汇聚了来自26个省市、53个核心数据中心的庞大算力资源,整合超15种主流芯片架构的异构算力池,总算力规模超25000P。基于广域高性能专线内网互联互通,企业能够按需在不同地域、不同型号的算力资源之间进行实时切换与无缝迁移。在过去半年里,无穹AI云在上海市、杭州市、北京市等地接连落地。
“中盒子”无界智算平台面向高校科研机构、区域智算中心,已在超100个大型研发场景中保障大规模模型训练与推理。在与上海算法创新研究院的合作中,无问芯穹基于3000卡沐曦国产GPU集群,稳定支撑百亿参数大模型训练长达600小时不间断,创造了国产算力模型训练的纪录。
在即将爆发的推理时代,为了让每一张闲置的GPU都能释放能量,无问芯穹推出全球首个跨地域全分布式联合强化学习服务,将各地AIDC中零散的算力资源与一个中等体量的算力集群结合起来,甚至可以支持消费级显卡的接入。
基于这一重要突破,无问芯穹与中国电信、中国移动、中国联通三大运营商,以及20余家AIDC伙伴启动了“AIDC联合运营创新生态计划”。
智能终端是将AI技术突破与我国制造业优势、市场规模优势结合的最佳“反应界面”。“小盒子”就是为了端侧模型而生,无问芯穹与上海创智院共同打造了全球首款端侧本征模型无穹天权Infini-Megrez2.0,在实现云级21B参数智能水平的同时,将内存占用控制在7B规模、实际计算量控制在3B规模,可以完美地适配当下的各类终端设备,打破了终端“能效、空间、智能”的不可能三角,突破了终端设备的资源局限。
不仅要把大象装进冰箱,还要让大象在冰箱里跳舞。合盖休眠、离线办公的情况下,AI PC里的模型依然能调度闲置GPU执行后台任务,在电脑合盖之前,对它说一声“整理今天的会议记录”,唤醒设备时,整理好的会议纪要已完整呈现在电脑上,算力亦能瞬时恢复满血状态,并且全程不需联网。算下来,单台设备年均可释放1000多小时的生产力,真正实现了“手停脑停,AI不停”。