开源AI推动 小型语言模型迅速崛起

Yashasvini Razdan, Senior India Reporter for EE Times2026-05-08 08:34:31EE Times

随着AI系统从少数企业掌控的资本密集型大型语言模型(LLM)向外发展,小型语言模型(SLM)正凭借开源系统迅速崛起,其开放权重体系也在迅速缩小与封闭平台之间的性能差距。


最新研究显示,开放权重的人工智慧(AI)模型可望节省数十亿美元成本,即便企业仍普遍青睐封闭式系统。

随着AI系统从少数企业掌控的资本密集型LLM向外发展,SLM正凭借开源系统迅速崛起,其开放权重体系也在迅速缩小与封闭平台之间的性能差距。

Mozilla基金会主席Mark Surman在接受《EE Times》采访时表示,训练和运行大型AI模型所需的高昂成本正推动产业寻求更加节能、低成本的创新路径。


「开源AI的成本结构与传统开源软体截然不同,因为涉及运算资源、能源和基础设施,」Surman解释,「今年,产业将更关注针对特定应用场景的小型语言模型,同时透过分散式训练提升效率,并利用闲置运算资源。」

Surman将Meta发布的Llama模型视为关键转捩点。他指出,在此之前,大型语言模型似乎注定难以开源——几乎所有核心技术都被OpenAI和Anthropic等公司牢牢掌控。

「对多数人来说,AI就是聊天机器人或能预测阅读偏好的社交媒体推送。AI无处不在,但其底层架构如同乐高积木一样由不同元件构成,」Surman解释,「当用户使用聊天机器人或刷社交媒体资讯流时,OpenAI、Meta或阿里巴巴等公司已按照自己的方式组装好这些积木,并将它们封装成一个『盒子』。开源意味着可以接触到所有积木。」


打破盒子

Surman指出,要判断AI是否真正「开放」,必须观察系统的各个组成部分。他列举了多款已向开发者开放的模型,包括美国大型科技公司的Gemma和GPT-OSS,中国的Qwen和Kimi,以及法国Mistral AI的系列模型。

区分开放权重(open-weight)模型与完全开源(fully open-source)模型至关重要。开放权重模型的预训练过程处于黑盒子状态,开发者虽可对模型进行微调和适配,却无法窥见到其建构方式。而完全开源模型则允许开发者查看训练资料和预训练过程中的检查点。虽然目前已有完全开源模型问世,但其性能仍落后开放权重模型和封闭模型。 Surman表示,需要更多投资来提升完全开源模型的能力。

【编按:开放权重模型将AI模型的关键参数,即‌权重,向公众免费开放,允许任何人下载、在本地设备上运行或进行微调的模型。但与「完全开源」模型不同,开放权重模型‌通常不公开训练资料、训练程式码或完整架构细节‌‌。 】

然而,开源AI并不仅限于模型本身。它还包括开来源资料集、用于编排运算基础设施的开放式方案,以及建构AI系统的开放架构和协调方式。 「Transformer、大型语言模型、强化学习和代理(Agent)框架等技术已经广为人知。开放权重模型与专有模型正在能力上逐渐接近,足以满足大多数用户的需求,」Surman透露。

同时,学术界也开始量化这一转型带来的经济效益。


数十亿美元的「低估」

2025年11月,麻省理工学院(MIT)数位经济计画研究科学家、Linux基金会首席科学家Frank Nagle与乔治亚理工学院谢勒商学院资讯技术管理领域的助理教授Daniel Yue共同发表了一篇论文,为Surman的观点提供了实证支撑。

他们研究了LLM推理市场——即训练模型根据使用者指令生成输出的环节,也是目前AI日常支出最集中的领域。他们发现,依价格和性能来看,开放权重模型的利用率远低于其应有水准。

研究使用了OpenRouter的资料,该平台可将API请求分发至数十家推理服务商,覆盖市场0.3~1.06%的消耗总量。研究人员追踪了2025年5月至9月期间的每日Token使用量、价格及模型供应情况。

研究结果揭示了AI经济中的一个悖论:OpenAI、Anthropic和Google等公司的封闭模型仅透过专有API访问处理了80%的Token,并贡献了95%以上的收入。而开放权重模型(其权重可公开获取并由任意推理服务商托管)处理了20%的Token,却只获得约4%的收入。

两者的价格差距更明显。平均而言,开放权重模型平均成本仅为封闭模型的15.66%,也即是后者价格约为前者的6倍。 Surman解释,这种差异来自自由度:「使用开源技术,你无需支付高额租金,还兼具灵活性和可扩展性。」

论文指出,开源模型成本更低,这源于结构性差异。由于任何机构都能托管开源模型,众多推理服务商竞相提供相关服务,从而推动其价格趋近边际成本。相比之下,封闭模型通常仅由一到两家原始开发公司及其可能的云端合作伙伴提供服务,这使得它们能够维持较高的溢价。

尽管价格差异巨大,但两者的性能差距却并不明显。 Nagle和Yue的研究推断,在GPQA、MMLU Pro、LiveCodeBench、LM Arena等主流的基准测试中,开放权重模型大约能达到封闭模型90%的性能。其中GPQA研究生级推理测试得分89.6%。根据其研究论文,开源模型追平封闭模型所需的时间也在缩短:2024年上半年平均需要27周,2024年下半年缩短到17周,2025年上半年进一步缩短到13周。

即便在回归分析中纳入价格与性能指标后,开源模型的实际使用率仍比同类封闭模型低63~88%。研究还发现,在多个案例中,封闭模型不仅价格更高,性能也逊于现有开源替代方案,但用户仍持续选择前者。论文模拟了将这些明显「劣势」的封闭模型替换为更优的开放模型的场景,仅在OpenRouter平台上一年即可节省1.04~1.46亿美元。扩展到整个推理市场后,三种独立估算方法显示,潜在但尚未实现的节省规模为201亿至483亿美元/年,其中优选估算值为248亿美元。


AI采用过程中的信任与转换成本

值得注意的是,Nagle和Yue并未认为用户的行为是不理性的。他们的研究显示,转换成本、品牌信任、安全顾虑,以及标准化基准测试可能无法反映实际性能差异等因素,共同解释了使用者对封闭模型的偏好。论文指出,这些隐藏因素所造成的经济影响远超以往认知。

Surman援引美国商务部委托的一项研究指出,开放权重模型与封闭模型在边际风险上并无显著差异。 「两者都可能被破解,」他表示,「虚假讯息和深度伪造技术的危害取决于部署者的身份与方式。在Mozilla,我们参与了ROOST (Robust Open Online Safety Tools)基金会专案,该基金会开发基于AI的信任与安全软体,供平台用于检测和清除有害内容。」

Surman进一步阐释:「开源AI的商业模式包括服务收费、技术支援收费,以及让使用相同软体的使用者共用资源。开源技术向来以可审计性和透明度著称——任何人都能查看程式码,当问题出现时,众多开发者可共同修复。而专有系统在AI领域基本不受监管,关键在于你选择信任谁。」

Surman指出,科技产业早已建立在开源基础上。他列举了Amazon Web Services (AWS)、微软Azure、Google Cloud Platform等云端服务商,以及Meta和X等公司,均运行在Linux等开源软体之上。

谈及围绕授权合约的持续争论,Surman阐述了Mozilla的立场:「宽松授权仍是正确选择。开源透过授权合约运用版权法,赋予修改和共用成果的权利。要实现负责任的AI应用,我们需要安全防护栏技术、商业流程和国家层面的法律,而不是去改变开源授权。」

随着全球秩序重组,各国正积极探索促进广泛参与的途径,为开源AI创造新空间。面对被誉为数位技术新纪元的AI浪潮,Surman回顾了电脑时代、个人电脑时代、网路时代及网际网路时代的演进历程,指出开源始终是抵制集中化的重要力量。

「开源AI若能成功,意味着更多人能参与塑造这个社会、经济与技术的新纪元,”」Surman说,「五年后,我期待看到AI的来源更加多元,更多人成为创造者而非单纯的消费者。」


Declare:The sources of contents are from Internet,Please『 Contact Us 』 immediately if any infringement caused