


1. 基础理论(30%)
✅ Transformer架构:
SelfAttention、MultiHead Attention、FFN 的原理和公式。
位置编码(Positional Encoding)的作用。
✅ 预训练与微调:
预训练任务(MLM、NSP、CLM)。
微调方法:全参数微调 vs. LoRA/Adap
获取同款笔记及更多内容,请点击:面试八股AI大模型
© 版权声明
文章版权归作者所有,未经允许请勿转载。
上一篇
没有更多了...
下一篇
没有更多了...
相关文章
没有相关内容!



qiu
求资料
👌
求求求
求