快手推理优化暑期实习面经

6个月前发布

base 杭州快手

一面：

1. 简历上写了grpo，用简单语言讲下grpo、ppo区别，手写dpo的loss
2. off-policy和on-policy是什么，分别对应哪种
3. vllm这些用过吗？原理是什么，会写算子吗？
4. 对推理优化有什么想法？（场景题，我回答agent小模型剪支）
5. sft

目前还在招吗

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

没有相关内容!

13 条评论

是贺吖z 投稿者

这就不知道了

6个月前无记录

回复
漂亮虎咚咚投稿者

哈哈，老梗了，好卡多都不用来 train [g=yun]

6个月前无记录

回复
正版乔氏读者

infra据说岗位很少？

6个月前无记录

回复
祁嘻嘻读者

铁厂infra还挺强的感觉，sglang群里一打铁厂大佬

6个月前无记录

回复
分快三看走势图技巧读者

感觉问了许多训练的内容

6个月前无记录

回复
宅尚美全屋定制读者

infra 也算后端

6个月前无记录

回复
往来____ 投稿者

不是推理么，由于你是做训练的才猛问的么

6个月前无记录

回复
走势怎么看怎么样才稳赚读者

简历许多 train 的，基本上目前全是简历内容，八股很少

6个月前无记录

回复
摩斯羊读者

面试体验超级好，强烈推荐铁厂！

6个月前无记录

回复
将军上座读者

没论文可以思考infra赛道吗985本硕研一下小透明，组里面没有发论文的机会，正在思考要不要ai infra，否则只能去搞后端了 [g=keai][g=keai]

6个月前无记录

回复
猛男江停挺举三百斤奶黄包投稿者

面试官做推理的，不懂我做训练的，但可能内部想要做训练的人才招，资源蛮多的

6个月前无记录

回复
小C揾大钱投稿者

infra还爷吗，纯赛博土木

6个月前无记录

回复
jk-galaxy 投稿者

面经攒了一个月了

6个月前无记录

回复