智谱 GLM-4.5-Air
为了让每一位开发者和用户都能轻松体验前沿大模型的能力,智谱向免费为 Cherry Studio 的用户开放了 GLM-4.5-Air 模型。作为专为智能体(Agent)应用打造的高效基础模型,GLM-4.5-Air 在性能与成本之间实现了出色平衡,是构建智能应用的理想选择。
🚀 什么是 GLM-4.5-Air?
GLM-4.5-Air 是智谱最新推出的高性能语言模型,采用先进的混合专家架构(Mixture-of-Experts, MoE),在保持卓越推理能力的同时,显著降低计算资源消耗。
- 总参数量:1060 亿
- 激活参数量:120 亿
通过精简设计,GLM-4.5-Air 实现了更高的推理效率,适合在资源受限环境下部署,同时仍能胜任复杂任务处理。
.avif)
📚 统一训练流程,夯实智能基础
GLM-4.5-Air 与旗舰系列共享一致的训练流程,确保其具备扎实的通用能力基础:
- 大规模预训练:在高达 15 万亿 token 的通用语料上完成训练,构建广泛的知识理解能力;
- 专项领域优化:在代码生成、逻辑推理、智能体交互等关键任务上进行强化训练;
- 长上下文支持:上下文长度扩展至 128K tokens,可处理长文档、复杂对话或大型代码项目;
- 强化学习增强:通过 RL 优化模型在推理规划、工具调用等方面的决策能力。
这一训练体系为 GLM-4.5-Air 赋予了出色的泛化能力和任务适应性。
.avif)
⚙️ 专为智能体优化的核心能力
GLM-4.5-Air 针对智能体应用场景进行了深度适配,具备以下实用能力:
✅ 工具调用支持:可通过标准化接口调用外部工具,实现任务自动化\ ✅ 网页浏览与信息提取:可配合浏览器插件完成动态内容理解与交互\ ✅ 软件工程辅助:支持需求解析、代码生成、缺陷识别与修复\ ✅ 前端开发支持:对 HTML、CSS、JavaScript 等前端技术有良好理解与生成能力
该模型可灵活集成至 Claude Code、Roo Code 等代码智能体框架,也可作为任意自定义 Agent 的核心引擎使用。
.avif)
💡 智能“思考模式”,灵活响应各类请求
GLM-4.5-Air 支持混合推理模式,用户可通过 thinking.type 参数控制是否启用深度思考:
enabled:启用思考,适合需要分步推理或规划的复杂任务disabled:禁用思考,用于简单查询或即时响应- 默认设置为 动态思考模式,模型自动判断是否需要深入分析
| 任务类型 | 示例 |
|---|---|
| 简单任务(建议关闭思考) | - 查询“智谱AI的成立时间” |
| 中等任务(建议启用思考) | - 比较飞机与高铁从北京到上海的优劣 |
| 复杂任务(强烈建议启用思考) | - 说明 MoE 模型中专家如何协作 |
🌟 高效低成本,部署更轻松
GLM-4.5-Air 在性能与成本之间实现了优秀平衡,特别适合实际业务部署:
- ⚡ 生成速度超 100 tokens/秒,响应迅速,支持低延迟交互
- 💰 API 成本极低:输入仅 0.8 元/百万 tokens,输出 2 元/百万 tokens
- 🖥️ 激活参数少,算力需求低,易于在本地或云端高并发运行
真正实现“高性能、低门槛”的 AI 服务体验。
.avif)
🧠 聚焦实用能力:智能代码生成
GLM-4.5-Air 在代码生成方面表现稳定,支持:
- 覆盖 Python、JavaScript、Java 等主流语言
- 根据自然语言指令生成结构清晰、可维护性强的代码
- 减少模板化输出,贴近真实开发场景需求
适用于快速原型构建、自动化补全、Bug 修复等高频开发任务。
现在就免费体验 GLM-4.5-Air,开启你的智能体开发之旅!\ 无论你是想打造自动化助手、编程伴侣,还是探索下一代 AI 应用,GLM-4.5-Air 都将是你高效可靠的 AI 引擎。
📘 立即接入,释放创造力!