DeepSeek-V3.2-Exp发布,API成本降低50%以上
9月30日消息,DeepSeek通过官方公众号宣布,正式发布实验性大语言模型DeepSeek-V3.2-Exp。该版本作为迈向新一代架构的过渡产物,在V3.1-Terminus基础上引入自研的DeepSeek Sparse Attention(DSA)稀疏注意力机制,重点针对长文本场景的训练与推理效率开展技术验证与优化。
据介绍,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

为了严谨地评估引入稀疏注意力带来的影响,DeepSeek特意将DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus 进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

在新模型的研究过程中,需要设计和实现很多新的GPU算子。DeepSeek使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。
因此,本次开源的主要算子包含TileLang与CUDA两种版本。DeepSeek建议社区在进行研究性实验时,使用基于TileLang的版本以方便调试和快速迭代。

目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价,开发者调用DeepSeek API的成本将降低50%以上。
相关阅读
- 全球电子协会(Global Electronics Association)正式亮相,新名称传承IPC 70年影响力,赋能全球6万亿美元电子产业发展
- 比特早报:联想与英伟达合作提供AI专业服务,Arm发布新一代Neoverse高性能芯片IP产品
- 比特网早报:中国首个国产移动操作系统正式发布,软银和阿波罗讨论成立大型AI基金
- 汇顶又赢麻了!荣耀多款新品搭载汇顶方案!
- AI时代下网络安全面临新挑战,派拓网络带来应对策略
- 安森美公布2025年第二季度财报
- Siren 14推出采用AI技术并可通过移动设备访问的警务安全功能,提供简化的搜索界面
- Fortinet发布防火墙设备 FortiGate Rugged 70G
- 双奖同辉,佳绩频传!大联大世平一举斩获“应用创新之流程智造‘新质’奖和离散智造‘新质’奖”两项殊荣
- 全球首个!优必选Walker S2人形机器人实现自主换电 7*24小时打工