DeepSeek发布V3.2与V3.2-Speciale模型,V3.2推理能力比肩GPT-5
本帖最后由 软糖碎碎 于 2025-12-2 18:00 编辑近期DeepSeek在Hugging Face平台正式推出了V3.2与V3.2-Speciale两款正式版模型,其中V3.2此前已在官方网页端、App及API渠道上线,而V3.2-Speciale则仅提供临时API,供研究与评测使用。
从性能表现来看,两款模型各有侧重:
- V3.2的推理能力已达到GPT-5水平,略低于Gemini-3.0-Pro;技术上采用了DeepSeek Sparse Attention机制优化计算复杂度,还支持“思考融入工具调用”机制(首个将思考与工具使用结合的模型),同时相比同类模型大幅降低了输出长度,减少了计算开销。
- V3.2-Speciale则集成了DeepSeek-Math-V2的定理证明能力,支持极长思维链的“扩展思考”,不仅在高度复杂任务上表现优于标准版,还斩获了IMO 2025、CMO 2025、ICPC 2025、IOI 2025等国际顶级竞赛的金牌;不过它的Token消耗更多,且仅面向研究场景,不支持工具调用、未针对日常对话优化。
你有没有体验过DeepSeek系列模型?对这种“实用版+研究竞赛版”的模型布局,你觉得适配性如何?
页:
[1]