LLM的SFT和RL有啥新发现? 1、SFT作为RL训练稳定剂的新认识以前我觉得SFT和RL是完全独立的阶段,但目前发现它们的关系要微妙得多。SFT阶段就像是为RL训练提供了一个稳定的基座,有了它,RL训练可以大幅减少不稳定性。在我尝... 内容分享# 一对一指导# 发文# 大模型 3个月前000
同时学会pytorch和tensorflow 很多教程要么只教Pytorch,要么是讲Tensorflow,你花大把时间学完一个再学另一个的时候,之前学的都快忘光了 采取对照学习法,Pytorch和Tensorflow探索flow一起学,它们在功能和原理上有类似之处,我们能一次性用两种方式搞定,让你深度学习框架的学习之路既轻松又高效。 重点:Pytorch和Ten... 内容分享# pytorch# Tensorflow# 深度学习 3个月前000
牛津博士力作,解决你99%的深度学习问题 。《深度学习图解》Grokking Deep Learning是一本旨在协助读者直观理解深度学习概念的书籍。这本书采用图解的方式,简化了深度学习的复杂理论,使得初学者能够更容易地掌握这一领域的基础。书... 内容分享# 深度学习# 深度学习入门# 深度学习图解 3个月前600
带你从头构建Transformer 。掌握Transformer模型还是超级有必要的,特别是对LLM感兴趣的人来说,今天这个教程中,我们将带大家使用 PyTorch 从零开始构建一个基础Transformer模型。构建Transform... 内容分享# transformer# 人工智能# 机器学习 3个月前500
最全面详细的Pytorch搭建指南 。涵盖知识:基础的数据读取、网络搭建,到训练过程、推理过程,再到模型优化、可视化以及实践中的各种技巧等,写了一个明确易懂的说明。 实用指南:涵盖从0搭建Pytorch模型的全方位知识,对如何搭建一个完... 内容分享# pytorch# 模型开发# 深度学习 3个月前000
5分钟告诉你深度学习到底为啥有效! 。深度学习作为机器学习的一个分支,已成为人工智能领域的一项变革性技术,在计算机视觉、自然语言处理、自动驾驶 等多个应用领域均取得了显著成就。深度学习的有效性并非偶然,而是源于多个基本原理和进步的协同作... 内容分享# 交叉学科# 人工智能# 机器学习 3个月前000
PyTorch实用教程|从零基础到精通~ 在GitHub上,有一份名为《从零到精通深度学习 PyTorch》的开源教程,它详细讲解了PyTorch的基本概念、深度学习的整个流程、计算机视觉的应用、自定义数据集的处理、模块化编程的技巧以及模型部... 内容分享# pytorch深度学习# 人工智能# 机器学习 3个月前300
深度学习入门建议~来啦!!!! [飞吻R]只是个人的一些提议,觉得先跑通了一个项目,才会知道这是干什么的,要不然刚上来就一堆公式推导容易被劝退。[星R]深度学习简单来说就是学习一个函数,输入一个x,得到一个y。而我们要做的就是设计一... 内容分享# Python学习 # 代码复现 # 深度学习 3个月前000
大模型推理加速技术的学习路线在这里! 。推理优化的重大性大模型推理优化是解决大规模语言模型(LLM)高效推理的关键。以540B参数的GaLM为例,其推理成本超级高,如果无法优化成本,模型的普惠性将大打折扣。大模型的推理需求主要可分为两类... 内容分享# 大模型# 强化学习# 时间序列分布预测 3个月前100
大模型推理优化的几个常见技术 。结构裁剪面对超大参数量模型,不做裁剪直接部署,那是真不现实。常用的一招是剪掉影响不大的层,列如中间冗余的attention block,或者MLP里维度特别高的部分。 也可以用结构重参数化的思路,把... 内容分享# Python# 大模型# 深度学习 3个月前100
如何通过推理加速优化你的大模型? 目前大模型火归火,但落地一看推理慢、资源吃紧,许多都跑不动,特别是在边缘设备或者商用场景里。所以推理加速优化,真的就是决定能不能真正work的关键。我们来聊聊2025年比较实用、还挺有前景的优化手段... 内容分享# Python# sci# 大模型 1个月前100
大模型推理性能如何优化? 1. 模型压缩,轻量化是关键说到大模型,大家都知道它的计算量大,推理慢。要想提升推理性能,第一得思考模型的压缩。实则,许多时候并不是非要用那么重的模型。通过剪枝、量化这些技术,你可以大幅减少模型的计算... 内容分享# Python# 一对一指导# 复现 3个月前100