DeepSeek V3.2

Cherry Studio 用户现在可以通过内置的 CherryIN 服务免费体验 DeepSeek V3.2——DeepSeek 于 2025 年 12 月 1 日发布的旗舰级稀疏注意力 MoE 模型,首次将"思考"原生集成到工具调用中,是进阶 Agent 与长上下文场景的理想选择。


🚀 什么是 DeepSeek V3.2?

DeepSeek V3.2 基于 V3.2-Exp 迭代而来,采用 Mixture-of-Experts(MoE)架构,并引入 DeepSeek Sparse Attention(DSA) 稀疏注意力机制,在保持超大规模总参数的同时显著降低长上下文推理成本。

  • 架构:MoE + DeepSeek Sparse Attention(DSA)+ Multi-Head Latent Attention(MLA)
  • 总参数量:685B
  • 每 Token 激活参数量:约 37B
  • 专家数:每层 256 个专家
  • 开源许可:MIT
  • 发布时间:2025 年 12 月 1 日(V3.2-Exp 于 2025 年 9 月 29 日发布)

V3.2 同时发布了面向 API 的 DeepSeek-V3.2-Speciale 版本,在复杂推理任务上取得 IMO、CMO、ICPC World Finals 与 IOI 2025 的金牌级表现。


📚 延续扎实的训练与对齐流程

DeepSeek V3.2 沿用了 V3 系列成熟的训练流水线,并针对 Agent 场景做了关键扩展:

  1. 大规模预训练:在海量高质量多语言语料上完成基础训练,覆盖代码、数学与科学知识。
  2. 稀疏注意力引入:在 128K 序列长度下训练主模型与 lightning indexer,每个 query token 选择 2048 个 key-value token 参与注意力。
  3. 大规模 Agent 数据合成:覆盖 1,800+ 环境与 85,000+ 复杂指令的全新 Agent 训练数据合成方法。
  4. 思考与工具调用融合:V3.2 是 DeepSeek 首个将"思考"原生集成到工具调用中的模型,支持在"思考模式"与"非思考模式"下均可调用工具。

⚙️ 旗舰级核心能力

DeepSeek V3.2 主打"与 GPT-5 水平相当"的综合能力,并在 Agent 与复杂推理上大幅强化:

  • 原生思考 + 工具调用:首个将 thinking 集成进 tool-use 的 DeepSeek 模型
  • 顶级推理能力:V3.2-Speciale 在 IMO / CMO / ICPC World Finals / IOI 2025 上达到金牌水平
  • 代码与开发任务:继承 V3 系列强代码能力
  • 长上下文稳定性:DSA 带来的长文档与代码库级分析能力
  • 结构化工具调用:适合构建多步规划与执行的 Agent

💡 DeepSeek Sparse Attention:更长、更省

DSA 是 V3.2 的核心技术升级,通过 lightning indexer + 细粒度 token 选择 实现:

  • 首次在大模型上实现细粒度稀疏注意力
  • 将核心注意力复杂度从 O(L²) 降低
  • 在长上下文训练与推理上显著提速,同时保持与稠密注意力几乎一致的输出质量
场景 推荐用法 示例
短对话 / 简单问答 直接调用 日常问答、摘要
中等复杂任务 启用工具调用 数据分析、代码重构
复杂 Agent 任务 思考 + 工具调用 多步规划、代码库分析、长文档审阅

🌟 开放、可用、生态友好

  • ⚡ DSA 带来的长上下文推理加速
  • 💰 通过 CherryIN 在 Cherry Studio 中免费使用
  • 🖥️ 开源权重、MIT 许可,vLLM、SGLang 等主流推理框架 Day-0 支持

🧠 聚焦实用能力:代码与 Agent

DeepSeek V3.2 在实际开发工作流中表现尤为出色:

  • 多语言代码生成与重构
  • 代码仓库级上下文理解与补丁生成
  • Agent 工具链:稳定调用外部工具、搜索、代码执行
  • 数学与复杂推理:支持竞赛级题目

🧭 如何在 Cherry Studio 中使用?

  1. 打开 Cherry Studio,进入 设置 → 模型服务
  2. 找到 CherryIN 服务商并开启。
  3. 在模型列表中选择 DeepSeek V3.2
  4. 返回聊天界面,在顶部模型选择处切换为 DeepSeek V3.2 即可开始对话。

💡 提示:CherryIN 提供的免费模型额度由 Cherry Studio 官方承担,适合日常体验与评测;生产环境建议结合 DeepSeek 官方 API 使用。


📘 立即体验 DeepSeek V3.2,开启旗舰级推理与 Agent 之旅!

results matching ""

    No results matching ""