Gartner:中国大语言模型价格战推动人工智能加速上云
“Gartner研究表明,随着时间的推移和价格的持续下降,以及云部署在敏捷性、创新速度和生态系统方面的优势,中国企业的人工智能(AI)部署将逐步从本地转向云端。Gartner预测,到2027年,中国的全部AI推理工作负载中,基于云的工作负载占比将从前的20%上升至80%。
”Gartner研究表明,随着时间的推移和价格的持续下降,以及云部署在敏捷性、创新速度和生态系统方面的优势,中国企业的人工智能(AI)部署将逐步从本地转向云端。Gartner预测,到2027年,中国的全部AI推理工作负载中,基于云的工作负载占比将从前的20%上升至80%。
Gartner高级研究总监方琦表示:“多家中国生成式人工智能(GenAI)厂商,其大语言模型应用编程接口(API)的推理成本已经降低了90%以上,有力地推动了企业地GenAI采用。企业数据和分析(D&A)领导者应积极评估相关影响,并扩展GenAI解决方案,以满足未来需要。”
DeepSeek于2024年5月6日推出了V2模型,价格仅为GPT-4 Turbo的1/75。几天后,字节跳动于5月16日推出豆包大模型,宣称比行业平均价格便宜99.3%。作为应对,阿里巴巴、百度和腾讯纷纷调整了其大语言模型API的价格。

图1:中国主流厂商大语言模型与OpenAI的价格变化情况比较
API价格下降短期内对企业的影响有限
在计算企业GenAI解决方案的总拥有成本(TCO)时,需要将微调成本考虑在内。首先,可以使用高端GenAI模型来评估企业用例的技术可行性,然后使用企业自身的数据,对小型模型进行微调,以执行特定的下游任务。此外,在使用API将数据上传到云端时,还应考虑额外的数据安全和隐私要求。与规模较小的模型相比,最先进的大语言模型的价格变化并不显著,这将进一步减轻价格变动的影响。
方琦表示:“已部署本地GenAI解决方案的中国企业,不会受到大语言模型 API价格变化的影响。对于云部署来说,API成本只是GenAI解决方案整体成本的一部分。需要注意的是,价格只是评估因素之一,还需要对其他因素进行仔细审查,如模型质量、吞吐量和延时。”
API价格的持续下降,推动了对AI部署策略的重新评估
企业应根据业务重点来选择AI部署方式,尤其需要从六个角度比较云部署和本地部署方案的优劣势,这六个角度分别是:企业数据的主要存放位置、安全和监管合规、专门的基础设施、平台/集成的优劣势、运营支出(OpEx)与资本性支出(CapEx)、人才和技能集合。
方琦表示:“随着大语言模型API的平均价格不断下降,云部署解决方案在未来将拥有更明显的优势。此外,随着技术的加速迭代和相关架构的日益复杂化,云部署解决方案的优势将在许多场景中更加突显。因此,各企业机构需要重新评估其AI部署战略。”
关于Gartner
Gartner(纽约证券交易所代码: IT)为企业机构提供切实可行的客观洞察,助力企业机构在最关键的优先事项上做出明智决策,取得出色业绩。欲了解更多信息,请访问http://www.gartner.com/cn。
相关阅读
- 蓝牙核心规范6.2正式发布
- 是德科技联合新思科技、Ansys 为台积电 N6RF+ 制程节点提供射频设计迁移流程
- 引领通信革新 技象科技TPUNB技术创新生态大会成功举办
- 长江存储晶栈Xtacking 4.0荣获FMS 2025最具创新存储技术奖
- 给5G戴个红帽子?5G RedCap到底是个啥?
- 英飞凌与Eatron将双方在AI电池管理解决方案方面的合作范围扩展至工业和消费应用领域
- 比特网早报:台积电已开始生产4nm芯片,英伟达招募ASIC工程师
- MWC探馆:邂逅酷赛科技陈凯峰,解锁ODM行业突围密码
- 英飞凌加入FiRa联盟董事会,共筑超宽带未来
- 鲁大师10月新机性能/流畅/AI/久用榜:骁龙8 至尊版与天玑9400正面交锋,厂商旗舰扎堆上线