Scaling law?

原来早在 2017 年，百度就进行过 Scaling Law 的相关研究，并且通过实证研究验证了深度学习模型的泛化误差和模型大小随着训练集规模的增长而呈现出可预测的幂律 scaling 关系。只是，他们当时用的是 LSTM，而非 Transformer，也没有将相关发现命名为「Scaling Law」。在追求 AGI 的道路上，Scaling Law 是绕不开的一环。如果 Scaling Law 撞到了天花板，扩大模型规模，增加算力不能大幅提升模型的能力，那么就需要探索新的架构创新、算法优化或跨领域的技术突破。作为一个学术概念，Scaling Law 为人所熟知，一般归功于 OpenAI 在 2020 年发的这篇论文 Scaling law?

文章版权归作者所有，未经允许请勿转载。

我能每天都穿短靴配铅笔裤吗？

内容分享

3个月前

010

RestTemplate 调用中文乱码

内容分享

2个月前

040

Jakarta EE 课程 — 微型资料投递与分发（Mini Drop-off Box）

内容分享

5个月前

040

谈一谈在linux中实用性较强的scp命令，附有案例

内容分享

3个月前

220

2 条评论

大山子读者

这东西还是看谁先做出来

5个月前无记录

回复
百事可乐鸡翅读者

Scaling law?原来早在 2017 年，百度就进行过 Scaling Law 的相关研究，并且通过实证研究验证了深度学习模型的泛化误差和模型大小随着训练集规模的增长而呈现出可预测的幂律 scaling 关系。只是，他们当时用的是 LSTM，而非 Transformer，也没有将相关发现命名为「Scaling Law」。在追求 AGI 的道路上，Scaling Law 是绕不开的一环。如果 Scaling Law 撞到了天花板，扩大模型规模，增加算力不能大幅提升模型的能力，那么就需要探索新的架构创新、算法优化或跨领域的技术突破。作为一个学术概念，Scaling Law 为人所熟知，通常归功于 OpenAI 在 2020 年发的这篇论文#AI顶会#深度学习模型#提升模型的能力#语言数据 #ai顶会

5个月前无记录

回复

Scaling law?

Ai智能体是未来最大的商业风口

相关文章

我能每天都穿短靴配铅笔裤吗？

RestTemplate 调用中文乱码

Jakarta EE 课程 — 微型资料投递与分发（Mini Drop-off Box）

谈一谈在linux中实用性较强的scp命令，附有案例

2 条评论

热门网站

小苹果活动助手

真我手机官方网站

小苹果网页助手

千牛工作台

创自由

迅雷12：化繁为简更轻快！

热门文章

LibrePods：安卓用 AirPods 功能全解锁

4g工业级无线路由器介绍（一名资深技术支持工程师推荐）

新一条SQL查询语句是如何执行的？

紧急提醒！这5类电话一接就可能破财：附识别+拦截全攻略

手机流量管理设置与使用技巧

Transformer 模型详解

Scaling law?

Ai智能体是未来最大的商业风口

相关文章

热门网站

小苹果活动助手

真我手机官方网站

小苹果网页助手

千牛工作台

创自由

迅雷12：化繁为简 更轻快！

热门文章

标签云

迅雷12：化繁为简更轻快！