一对一指导

共 2 篇文章

排序

发布更新浏览点赞

全能 AI 聚合平台免费

一站式接入主流 AI 大模型，支持对话 · 生图 · 生视频，即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama

AI对话 AI生图 AI视频

免费使用 →

LLM的SFT和RL有啥新发现？

LLM的SFT和RL有啥新发现？

1、SFT作为RL训练稳定剂的新认识以前我觉得SFT和RL是完全独立的阶段，但目前发现它们的关系要微妙得多。SFT阶段就像是为RL训练提供了一个稳定的基座，有了它，RL训练可以大幅减少不稳定性。在我尝...

内容分享 # 一对一指导 # 发文 # 大模型

8个月前

010

大模型推理性能如何优化？

大模型推理性能如何优化？

1. 模型压缩，轻量化是关键说到大模型，大家都知道它的计算量大，推理慢。要想提升推理性能，第一得思考模型的压缩。实则，许多时候并不是非要用那么重的模型。通过剪枝、量化这些技术，你可以大幅减少模型的计算...

内容分享 # Python # 一对一指导 # 复现

8个月前

120