快手推理优化暑期实习面经

1天前发布
2 13 0
快手推理优化暑期实习面经base 杭州快手

一面:

1. 简历上写了grpo,用简单语言讲下grpo、ppo区别,手写dpo的loss
2. off-policy和on-policy是什么,分别对应哪种
3. vllm这些用过吗?原理是什么,会写算子吗?
4. 对推理优化有什么想法?(场景题,我回答agent小模型剪支)
5. sft

目前还在招吗

© 版权声明

相关文章

没有相关内容!

13 条评论

  • 头像
    正版乔氏 读者

    infra据说岗位很少?

    无记录
    回复
  • 头像
    祁嘻嘻 读者

    铁厂infra还挺强的感觉,sglang群里一打铁厂大佬

    无记录
    回复
  • 头像
    分快三看走势图技巧 读者

    感觉问了许多训练的内容

    无记录
    回复
  • 头像
    宅尚美全屋定制 读者

    infra 也算后端

    无记录
    回复
  • 头像
    往来____ 投稿者

    不是推理么,由于你是做训练的才猛问的么

    无记录
    回复
  • 头像
    走势怎么看怎么样才稳赚 读者

    简历许多 train 的,基本上目前全是简历内容,八股很少

    无记录
    回复
  • 头像
    摩斯羊 读者

    面试体验超级好,强烈推荐铁厂!

    无记录
    回复
  • 头像
    将军上座 读者

    没论文可以思考infra赛道吗985本硕研一下小透明,组里面没有发论文的机会,正在思考要不要ai infra,否则只能去搞后端了 [g=keai][g=keai]

    无记录
    回复
  • 头像
    猛男江停挺举三百斤奶黄包 投稿者

    面试官做推理的,不懂我做训练的,但可能内部想要做训练的人才招,资源蛮多的

    无记录
    回复
  • 头像
    小C揾大钱 投稿者

    infra还爷吗,纯赛博土木

    无记录
    回复
  • 头像
    jk-galaxy 投稿者

    面经攒了一个月了

    无记录
    回复
  • 头像
    是贺吖z 投稿者

    这就不知道了

    无记录
    回复
  • 头像
    漂亮虎咚咚 投稿者

    哈哈,老梗了,好卡多都不用来 train [g=yun]

    无记录
    回复