DeepSeek-V4 正式开源上线!百万级超长上下文全面普及

内容分享5小时前发布
0 0 0
全能 AI 聚合平台 免费

一站式接入主流 AI 大模型,支持对话 · 生图 · 生视频,即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama
AI对话 AI生图 AI视频
免费使用 →

今日上午,DeepSeek-V4 预览版正式发布并全面开源,全系标配100 万 token 超长上下文,在推理能力、智能代理、代码创作等维度实现全面升级,正式迈入百万上下文普惠新时代。

DeepSeek-V4 正式开源上线!百万级超长上下文全面普及

本次更新推出两大版本,精准覆盖不同使用需求。旗舰款 DeepSeek-V4-Pro 综合性能强劲,轻量款 DeepSeek-V4-Flash 主打高性价比,兼顾专业办公与日常轻量化使用场景。

开源权重和本地部署

  • DeepSeek-V4 模型开源链接:

https://huggingface.co/collections/deepseek-ai/deepseek-v4

https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4

  • DeepSeek-V4 技术报告:

https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

在核心实力上,DeepSeek-V4-Pro 表现亮眼。智能代码代理能力达到开源顶尖水平,综合交付质量对标一线闭源大模型;世界知识储备、数理推理、专业代码创作能力大幅提升,综合实力稳居开源模型第一梯队。

DeepSeek-V4 正式开源上线!百万级超长上下文全面普及

轻量化的 Flash 版本实力同样不俗,基础推理、日常智能任务表现贴近旗舰版,运行速度更快、调用成本更低,超级适合日常问答、文案创作、轻量办公等大众化场景。

DeepSeek-V4 正式开源上线!百万级超长上下文全面普及

技术层面,全新注意力机制搭配 DSA 稀疏注意力架构,有效压缩算力与显存消耗,让百万级长文本解析不再依赖高配设备,大幅降低超长上下文的使用门槛。

在使用与部署方面,用户可通过 DeepSeek 官网、官方 APP 快速体验,双版本分别对应专家模式与极速模式。API 接口全面兼容主流格式,迁移改造简单便捷,企业与开发者可快速接入使用。

DeepSeek-V4 正式开源上线!百万级超长上下文全面普及

定价策略十分亲民,两大版本划分梯度收费,缓存命中后使用成本进一步降低,兼顾个人用户与企业规模化部署需求。同时官方已明确,旧版接口将于 2026 年 7 月 24 日正式停用,后续将统一切换至全新 V4 系列模型。

DeepSeek-V4 正式开源上线!百万级超长上下文全面普及

除此之外,模型权重已同步在各大开源平台开放下载,配套技术文档齐全,支持本地部署、二次开发。双版本均支持思考 / 非思考双模式,可自主调节推理强度,适配复杂科研、代码开发、日常办公等各类场景。

API 文档:

思考模式 | DeepSeek API Docs

随着 AI 技术持续迭代,超长上下文已成为大模型核心竞争力。DeepSeek-V4 的全面开源落地,不仅拉高了开源模型的性能上限,也让低成本、高性能的长文本 AI 应用走进大众视野,为行业发展注入全新活力。

© 版权声明

相关文章

暂无评论

none
暂无评论...