今日上午,DeepSeek-V4 预览版正式发布并全面开源,全系标配100 万 token 超长上下文,在推理能力、智能代理、代码创作等维度实现全面升级,正式迈入百万上下文普惠新时代。

本次更新推出两大版本,精准覆盖不同使用需求。旗舰款 DeepSeek-V4-Pro 综合性能强劲,轻量款 DeepSeek-V4-Flash 主打高性价比,兼顾专业办公与日常轻量化使用场景。
开源权重和本地部署
- DeepSeek-V4 模型开源链接:
https://huggingface.co/collections/deepseek-ai/deepseek-v4
https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
- DeepSeek-V4 技术报告:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
在核心实力上,DeepSeek-V4-Pro 表现亮眼。智能代码代理能力达到开源顶尖水平,综合交付质量对标一线闭源大模型;世界知识储备、数理推理、专业代码创作能力大幅提升,综合实力稳居开源模型第一梯队。

轻量化的 Flash 版本实力同样不俗,基础推理、日常智能任务表现贴近旗舰版,运行速度更快、调用成本更低,超级适合日常问答、文案创作、轻量办公等大众化场景。

技术层面,全新注意力机制搭配 DSA 稀疏注意力架构,有效压缩算力与显存消耗,让百万级长文本解析不再依赖高配设备,大幅降低超长上下文的使用门槛。
在使用与部署方面,用户可通过 DeepSeek 官网、官方 APP 快速体验,双版本分别对应专家模式与极速模式。API 接口全面兼容主流格式,迁移改造简单便捷,企业与开发者可快速接入使用。

定价策略十分亲民,两大版本划分梯度收费,缓存命中后使用成本进一步降低,兼顾个人用户与企业规模化部署需求。同时官方已明确,旧版接口将于 2026 年 7 月 24 日正式停用,后续将统一切换至全新 V4 系列模型。

除此之外,模型权重已同步在各大开源平台开放下载,配套技术文档齐全,支持本地部署、二次开发。双版本均支持思考 / 非思考双模式,可自主调节推理强度,适配复杂科研、代码开发、日常办公等各类场景。
API 文档:
思考模式 | DeepSeek API Docs
随着 AI 技术持续迭代,超长上下文已成为大模型核心竞争力。DeepSeek-V4 的全面开源落地,不仅拉高了开源模型的性能上限,也让低成本、高性能的长文本 AI 应用走进大众视野,为行业发展注入全新活力。