一面:
1. 简历上写了grpo,用简单语言讲下grpo、ppo区别,手写dpo的loss 2. off-policy和on-policy是什么,分别对应哪种 3. vllm这些用过吗?原理是什么,会写算子吗? 4. 对推理优化有什么想法?(场景题,我回答agent小模型剪支) 5. sft
目前还在招吗
infra据说岗位很少?
铁厂infra还挺强的感觉,sglang群里一打铁厂大佬
感觉问了许多训练的内容
infra 也算后端
不是推理么,由于你是做训练的才猛问的么
简历许多 train 的,基本上目前全是简历内容,八股很少
面试体验超级好,强烈推荐铁厂!
没论文可以思考infra赛道吗985本硕研一下小透明,组里面没有发论文的机会,正在思考要不要ai infra,否则只能去搞后端了 [g=keai][g=keai]
面试官做推理的,不懂我做训练的,但可能内部想要做训练的人才招,资源蛮多的
infra还爷吗,纯赛博土木
面经攒了一个月了
这就不知道了
哈哈,老梗了,好卡多都不用来 train [g=yun]
infra据说岗位很少?
铁厂infra还挺强的感觉,sglang群里一打铁厂大佬
感觉问了许多训练的内容
infra 也算后端
不是推理么,由于你是做训练的才猛问的么
简历许多 train 的,基本上目前全是简历内容,八股很少
面试体验超级好,强烈推荐铁厂!
没论文可以思考infra赛道吗985本硕研一下小透明,组里面没有发论文的机会,正在思考要不要ai infra,否则只能去搞后端了 [g=keai][g=keai]
面试官做推理的,不懂我做训练的,但可能内部想要做训练的人才招,资源蛮多的
infra还爷吗,纯赛博土木
面经攒了一个月了
这就不知道了
哈哈,老梗了,好卡多都不用来 train [g=yun]