DeepSeek V3.2

Cherry Studio 用户现在可以通过内置的 CherryIN 服务免费体验 DeepSeek V3.2——DeepSeek 于 2025 年 12 月 1 日发布的旗舰级稀疏注意力 MoE 模型，首次将"思考"原生集成到工具调用中，是进阶 Agent 与长上下文场景的理想选择。

🚀 什么是 DeepSeek V3.2？

DeepSeek V3.2 基于 V3.2-Exp 迭代而来，采用 Mixture-of-Experts（MoE）架构，并引入 DeepSeek Sparse Attention（DSA） 稀疏注意力机制，在保持超大规模总参数的同时显著降低长上下文推理成本。

架构：MoE + DeepSeek Sparse Attention（DSA）+ Multi-Head Latent Attention（MLA）
总参数量：685B
每 Token 激活参数量：约 37B
专家数：每层 256 个专家
开源许可：MIT
发布时间：2025 年 12 月 1 日（V3.2-Exp 于 2025 年 9 月 29 日发布）

V3.2 同时发布了面向 API 的 DeepSeek-V3.2-Speciale 版本，在复杂推理任务上取得 IMO、CMO、ICPC World Finals 与 IOI 2025 的金牌级表现。

📚 延续扎实的训练与对齐流程

DeepSeek V3.2 沿用了 V3 系列成熟的训练流水线，并针对 Agent 场景做了关键扩展：

大规模预训练：在海量高质量多语言语料上完成基础训练，覆盖代码、数学与科学知识。
稀疏注意力引入：在 128K 序列长度下训练主模型与 lightning indexer，每个 query token 选择 2048 个 key-value token 参与注意力。
大规模 Agent 数据合成：覆盖 1,800+ 环境与 85,000+ 复杂指令的全新 Agent 训练数据合成方法。
思考与工具调用融合：V3.2 是 DeepSeek 首个将"思考"原生集成到工具调用中的模型，支持在"思考模式"与"非思考模式"下均可调用工具。

⚙️ 旗舰级核心能力

DeepSeek V3.2 主打"与 GPT-5 水平相当"的综合能力，并在 Agent 与复杂推理上大幅强化：

✅ 原生思考 + 工具调用：首个将 thinking 集成进 tool-use 的 DeepSeek 模型
✅ 顶级推理能力：V3.2-Speciale 在 IMO / CMO / ICPC World Finals / IOI 2025 上达到金牌水平
✅ 代码与开发任务：继承 V3 系列强代码能力
✅ 长上下文稳定性：DSA 带来的长文档与代码库级分析能力
✅ 结构化工具调用：适合构建多步规划与执行的 Agent

💡 DeepSeek Sparse Attention：更长、更省

DSA 是 V3.2 的核心技术升级，通过 lightning indexer + 细粒度 token 选择 实现：

首次在大模型上实现细粒度稀疏注意力
将核心注意力复杂度从 O(L²) 降低
在长上下文训练与推理上显著提速，同时保持与稠密注意力几乎一致的输出质量

场景	推荐用法	示例
短对话 / 简单问答	直接调用	日常问答、摘要
中等复杂任务	启用工具调用	数据分析、代码重构
复杂 Agent 任务	思考 + 工具调用	多步规划、代码库分析、长文档审阅

🌟 开放、可用、生态友好

⚡ DSA 带来的长上下文推理加速
💰 通过 CherryIN 在 Cherry Studio 中免费使用
🖥️ 开源权重、MIT 许可，vLLM、SGLang 等主流推理框架 Day-0 支持

🧠 聚焦实用能力：代码与 Agent

DeepSeek V3.2 在实际开发工作流中表现尤为出色：

多语言代码生成与重构
代码仓库级上下文理解与补丁生成
Agent 工具链：稳定调用外部工具、搜索、代码执行
数学与复杂推理：支持竞赛级题目

🧭 如何在 Cherry Studio 中使用？

打开 Cherry Studio，进入 设置 → 模型服务。
找到 CherryIN 服务商并开启。
在模型列表中选择 DeepSeek V3.2。
返回聊天界面，在顶部模型选择处切换为 DeepSeek V3.2 即可开始对话。

💡 提示：CherryIN 提供的免费模型额度由 Cherry Studio 官方承担，适合日常体验与评测；生产环境建议结合 DeepSeek 官方 API 使用。

📘 立即体验 DeepSeek V3.2，开启旗舰级推理与 Agent 之旅！

DeepSeek V3.2

DeepSeek V3.2

🚀 什么是 DeepSeek V3.2？

📚 延续扎实的训练与对齐流程

⚙️ 旗舰级核心能力

💡 DeepSeek Sparse Attention：更长、更省

🌟 开放、可用、生态友好

🧠 聚焦实用能力：代码与 Agent

🧭 如何在 Cherry Studio 中使用？

results matching ""

No results matching ""