大模型SFT过程的不稳定?

本期通过“乐队演奏乐曲”这一例子跟大家探讨SFT后大模型变傻了的问题,感兴趣的同学欢迎评论区交流哦~️在训练LMM时,我们会发现一个有趣的现象:同一份数据进行多次训练,在benchmark上的预测结果...
头像3个月前
000

AI术语:Scaling laws

.Scaling Laws,一种普遍存在的统计规律,不仅在AI领域,物理学等领域也有其身影。 在 AI 领域,它揭示了AI系统性能与模型大小、数据集大小、计算资源等之间的幂律关系:即随着规模的扩大,性...
头像3个月前
100
1 2