DeepSeek发布V3.2与V3.2-Speciale模型,V3.2推理能力比肩GPT-5

软糖碎碎 · 发表于 2025-12-2 17:57:57

本帖最后由软糖碎碎于 2025-12-2 18:00 编辑

近期DeepSeek在Hugging Face平台正式推出了V3.2与V3.2-Speciale两款正式版模型，其中V3.2此前已在官方网页端、App及API渠道上线，而V3.2-Speciale则仅提供临时API，供研究与评测使用。

从性能表现来看，两款模型各有侧重：

- V3.2的推理能力已达到GPT-5水平，略低于Gemini-3.0-Pro；技术上采用了DeepSeek Sparse Attention机制优化计算复杂度，还支持“思考融入工具调用”机制（首个将思考与工具使用结合的模型），同时相比同类模型大幅降低了输出长度，减少了计算开销。

- V3.2-Speciale则集成了DeepSeek-Math-V2的定理证明能力，支持极长思维链的“扩展思考”，不仅在高度复杂任务上表现优于标准版，还斩获了IMO 2025、CMO 2025、ICPC 2025、IOI 2025等国际顶级竞赛的金牌；不过它的Token消耗更多，且仅面向研究场景，不支持工具调用、未针对日常对话优化。

你有没有体验过DeepSeek系列模型？对这种“实用版+研究竞赛版”的模型布局，你觉得适配性如何？

DeepSeek发布V3.2与V3.2-Speciale模型,V3.2推理能力比肩GPT-5

相关帖子