








一周速通大模型面试八股
(每天12小时,按模块拆解,重点突出核心概念和面试高频问题)
Day 1:大模型基础与训练方法
1. 核心概念
大模型定义:参数量(GPT3 175B)、数据量、算力需求。
预训练目标:自回归(GPT)、自编码(BERT)、混合(T5)。
2. 训练技术
数据并行 vs. 模型并行(Tensor
获取同款笔记及更多,请点击:大模型面试题合集
© 版权声明
文章版权归作者所有,未经允许请勿转载。
上一篇
没有更多了...
下一篇
没有更多了...
相关文章
没有相关内容!



好的
👌
已关注,求资料
dd
求资料