涛涛涛涛疯狂掏钱

帅气的我简直无法用语言描述！

文章2 网址0 书籍0 软件0 评论2

国产模型实测：DeepSeekV4/千问/豆包，代码+写作+翻译谁更值？

国产模型实测：DeepSeekV4/千问/豆包，代码+写作+翻译谁更值？

一句话说清：不跑分，跑场景。同一个任务分别丢给三个模型，对比输出质量、速度、成本。代码/写作/翻译/摘要各测一遍，帮你省掉自己对比的时间。国产大模型最近井喷——DeepSeek V4、千问、豆包，每...

1个月前

150

终结 RL 推理之争：CMU 可控实验揭开能力起源之谜

终结 RL 推理之争：CMU 可控实验揭开能力起源之谜

本文约3000字，提议阅读6分钟本文介绍了 CMU 可控实验下预训练、中期训练与 RL 对推理模型的影响及训练方案。在 DeepSeek-R1 和 OpenAI o1 等模型通过强化学习（RL）展现...

2个月前

040

没有更多了