什么是Scaling Law？

什么是Scaling Law？

#机器坏人 #机器学习 #人工智能 #AI新手村 #AI便利店 #scaling_law #深度学习 #原创漫画 #漫画科普 #AI科普

画的太好了，图二中的数据量，模型参数量，芯片的算力这三个让我想起几个数字。三者的比例曾经发生过一些变化，列如scaling law的开篇论文提到数据量是参数量的20倍，效果会最好，但后来发现这个这个比例依旧可以上升，目前的比例可能是上百倍，千倍，列如 2023 年 7 月中旬，llama2 发布，其中 7B 版本的小模型训练数据有 2T，是参数量的 285 倍。
不过算力和参数量的比例是可以通过理论计算出来的，一般情况下是计算量是参数量的20倍。
目前的scaling law的确有点难以持续前进了，不过即使撞墙，感觉模型能力已经很强了。

文章版权归作者所有，未经允许请勿转载。

没有相关内容!

13 条评论

香嘤计划投稿者

你真棒博主夸夸你内容很好 [g=shuai]

3个月前无记录

回复
宁都思源实验学校陈苇芳读者

最sb的翻译就是所谓“缩放定理”。楼主用原名挺好

3个月前无记录

回复
汝非吾江湖读者

[g=huaixiao][g=huaixiao] 大力出奇迹～

3个月前无记录

回复
每日笑点集投稿者

二姐果然专业！

3个月前无记录

回复
入戏太深读者

目前呢

3个月前无记录

回复
小渔读者

@小罗睡不醒

3个月前无记录

回复
文老汉读者

数据质量提升和场景模型优化或许可以缓解SL失效问题，感觉还是挺有道理的。对于多模态模型而言，实则本来数据集就没有文本数据那么多（列如3D资产的数据就超级有限，完全没法大力出奇迹）。但是还是狠狠担忧呀，基座模型到止步这里，垂类模型的天花板还能多高呢？如果未来模型将会足够成熟的假设不能成立，下游这些应用的发展空间和成熟度是否也隐隐能看到天花板，ai产品经理机会或许也并不会那么乐观

3个月前无记录

回复
煮茶听鸟鸣读者

Scaling Law 缩放定律

3个月前无记录

回复
不是吧文艺投稿者

省流：力大砖飞

3个月前无记录

回复
CiCiO715 投稿者

不是百度2017年提出的么

3个月前无记录

回复
自由作者读者

？

3个月前无记录

回复
鱼见·UOMI 投稿者

谢谢

3个月前无记录

回复
看日出日落132 投稿者

大计科号令天下，谁与争锋！

3个月前无记录

回复

什么是Scaling Law？

没有更多了...

没有更多了...

相关文章

13 条评论

热门网站

Poki (宝玩)

Windsurf

Raphael AI

文件禅

3699小游戏

达尔优品牌官方网站

热门文章

序参量：理解连续相变、对称破缺和系统宏观秩序的关键概念

Java最强开源AI工具！支持人脸识别，活体检测，表情识别、目标检测等。调用AI像使用Hutool工具一样简单

什么是Scaling Law？

没有更多了...

没有更多了...

相关文章

13 条评论

热门网站

Poki (宝玩)

Windsurf

Raphael AI

文件禅

3699小游戏

达尔优品牌官方网站

热门文章

序参量：理解连续相变、对称破缺和系统宏观秩序的关键概念

Java最强开源AI工具！支持人脸识别，活体检测，表情识别、目标检测等。调用AI像使用Hutool工具一样简单

标签云