Meta 刚刚在 Hugging Face 上发布了 MobileLLM-R1 边缘推理模型，参数少于 10 亿性能提升 2–5×，超越其他完全开源模型：MobileLLM-R1 MATH 准确率上比 Olmo-1.B 高约 5 倍，比 SmolLM2-1.7B 高约 2 倍

内容分享9个月前发布猛的藏轩

全能 AI 聚合平台免费

一站式接入主流 AI 大模型，支持对话 · 生图 · 生视频，即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama

AI对话 AI生图 AI视频

免费使用 →

与 Qwen 相比，仅使用 1 10 的预训练 token：仅用 4.2 万亿 token（仅占 Qwen3 的 36 万亿 token 的 11.7%）进行训练，就在多个推理基准测试中达到或超过 Qwen3 的准确率。 Meta 刚刚在 Hugging Face 上发布了 MobileLLM-R1 边缘推理模型，参数少于 10 亿性能提升 2–5×，超越其他完全开源模型：MobileLLM-R1 MATH 准确率上比 Olmo-1.B 高约 5 倍，比 SmolLM2-1.7B 高约 2 倍

内容分享 # 技术分享 # 日常生活 # 每天跟我涨知识 # 深度学习 # 编程严选网

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

大数据与AI结合：机器学习模型训练中的数据预处理技巧

大数据与AI结合：机器学习模型训练中的数据预处理技巧

7个月前

0100

使用NVM对node进行版本管理

使用NVM对node进行版本管理

7个月前

080

每日GitHub精选：一站式大模型微调工具 LLaMA Factory

每日GitHub精选：一站式大模型微调工具 LLaMA Factory

5个月前

040

2. 别再瞎花AI编程钱了！CodeBurn一键查清你的Token都烧在了哪里

2. 别再瞎花AI编程钱了！CodeBurn一键查清你的Token都烧在了哪里

1个月前

140

暂无评论

none

暂无评论...