头像

榆灿28

帅气的我简直无法用语言描述!

大模型SFT过程的不稳定?

本期通过“乐队演奏乐曲”这一例子跟大家探讨SFT后大模型变傻了的问题,感兴趣的同学欢迎评论区交流哦~️在训练LMM时,我们会发现一个有趣的现象:同一份数据进行多次训练,在benchmark上的预测结果...
头像4小时前
000