一周速通大模型面试八股 (每天12小时,按模块拆解,重点突出核心概念和面试高频问题) Day 1:大模型基础与训练方法 1. 核心概念 大模型定义:参数量(GPT3 175B)、数据量、算力需求。 预训练目标:自回归(GPT)、自编码(BERT)、混合(T5)。 2. 训练技术 数据并行 vs. 模型并行(Tensor
获取同款笔记及更多,请点击:大模型面试题合集
求资料
好的
👌
已关注,求资料
dd
求资料
好的
👌
已关注,求资料
dd