DeepSeek-V3.2-Exp发布，API成本降低50%以上_科技IT

DeepSeek-V3.2-Exp发布，API成本降低50%以上

科技IT 2025-10-20 user6946

9月30日消息，DeepSeek通过官方公众号宣布，正式发布实验性大语言模型DeepSeek-V3.2-Exp。该版本作为迈向新一代架构的过渡产物，在V3.1-Terminus基础上引入自研的DeepSeek Sparse Attention(DSA)稀疏注意力机制，重点针对长文本场景的训练与推理效率开展技术验证与优化。

据介绍，DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制，在几乎不影响模型输出效果的前提下，实现了长文本训练和推理效率的大幅提升。

为了严谨地评估引入稀疏注意力带来的影响，DeepSeek特意将DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus 进行了严格的对齐。在各领域的公开评测集上，DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

在新模型的研究过程中，需要设计和实现很多新的GPU算子。DeepSeek使用高级语言TileLang进行快速原型开发，以支持更深入的探索。在最后阶段，以TileLang作为精度基线，逐步使用底层语言实现更高效的版本。

因此，本次开源的主要算子包含TileLang与CUDA两种版本。DeepSeek建议社区在进行研究性实验时，使用基于TileLang的版本以方便调试和快速迭代。

目前，官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp，同时API大幅度降价，开发者调用DeepSeek API的成本将降低50%以上。

The End

免责声明：本文内容来源于第三方或整理自互联网，本站仅提供展示，不拥有所有权，不代表本站观点立场，也不构成任何其他建议，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容，请及时联系我们进行处理。

DeepSeek-V3.2-Exp发布，API成本降低50%以上

分类导航

最新文章

本栏文章

随机文章

友情链接

DeepSeek-V3.2-Exp发布，API成本降低50%以上

相关阅读

分类导航

最新文章

本栏文章

随机文章

友情链接