LLM的SFT和RL有啥新发现? 1、SFT作为RL训练稳定剂的新认识以前我觉得SFT和RL是完全独立的阶段,但目前发现它们的关系要微妙得多。SFT阶段就像是为RL训练提供了一个稳定的基座,有了它,RL训练可以大幅减少不稳定性。在我尝... 内容分享# 一对一指导# 发文# 大模型 3个月前000
终于把神经网络算法搞清楚了!!! 。神经网络由一系列相互连接的节点(称为“神经元”)组成,这些节点按照必定的层级结构组织,一般包括输入层、隐藏层和输出层。卷积神经网络(CNN):卷积神经网络(CNN)是一种深度学习模型,专门用于处理图... 内容分享# 大模型# 大模型微调# 大模型训练 3个月前000
大模型SFT过程的不稳定? 本期通过“乐队演奏乐曲”这一例子跟大家探讨SFT后大模型变傻了的问题,感兴趣的同学欢迎评论区交流哦~️在训练LMM时,我们会发现一个有趣的现象:同一份数据进行多次训练,在benchmark上的预测结果... 内容分享# LLM# LMM# 大模型 3个月前000
AI大模型入门:思维链COT详解 。思维链COT(ChainofThought)是近年来人工智能领域超级热门的概念,它模仿人类的推理过程,协助模型更高效地解决复杂问题。 核心定义:思维链是一种通过逐步推理解决问题的方法,即将一个复杂问... 内容分享# ai# AI工具# 大模型 3个月前000
将大型语言模型作为自动对齐器,为视觉语言 。随着大型语言模型(Large Language model,LLMs)的发展,视觉语言模型(Vision-Language model, VLMs)已经达到了一个新的复杂程度,在执行复杂的认知和推理... 内容分享# 人工智能# 大模型# 大语言模型 3个月前000
小型视觉语言模型的强大威力 。昨天抖音发布多模态大模型SAIL-VL-2B,该模型取得了pencompass榜单2B模型第一的成绩,展现了。今天学长给大家详细介绍了SAIL-VL-2B模型的概述与评估表现,让我们一起紧跟多模态大... 内容分享# LMM# 人工智能# 多模态大模型 3个月前000
AI术语:Scaling laws .Scaling Laws,一种普遍存在的统计规律,不仅在AI领域,物理学等领域也有其身影。 在 AI 领域,它揭示了AI系统性能与模型大小、数据集大小、计算资源等之间的幂律关系:即随着规模的扩大,性... 内容分享# ai# AI术语# 大模型 3个月前100
上班摸鱼用MCP搭建了一个Agent系统 。上班摸鱼动手做了一个实践!.主要是为了从零到一搞清楚基于MCP开发Agent应用全流程,方便为研究新的落地场景,做新的AI产品做准备。.实践实现的是目前最常见的Agent知识库系统,支持检索问答,上... 内容分享# Agent# ai# MCP 3个月前300
自己动手搭建AI Agent效率直接起飞 。家人们,今天来聊聊超厉害的AI Agent !它的强劲之处在于能自动执行复杂任务,大大提升自动化水平,让智能决策更高效,简直是工作学习的超强助手。 工作原理四步走 感知:通过各种传感器敏锐捕捉环境变... 内容分享# Agent# ai# 大模型 3个月前400
快速搭建本地 AI 知识库方案 。从头开始利用RAG、Agent、LangChain等技术搭建本地知识库-本地模型准备:通过Ollama部署模型,需要详细部署教程的朋友可以参照我上一条《2步轻松部署本地AI大模型》的笔记进行设置... 内容分享# ai# AI产品经理# RAG 3个月前100
大模型推理加速技术的学习路线在这里! 。推理优化的重大性大模型推理优化是解决大规模语言模型(LLM)高效推理的关键。以540B参数的GaLM为例,其推理成本超级高,如果无法优化成本,模型的普惠性将大打折扣。大模型的推理需求主要可分为两类... 内容分享# 大模型# 强化学习# 时间序列分布预测 3个月前100
大模型推理优化的几个常见技术 。结构裁剪面对超大参数量模型,不做裁剪直接部署,那是真不现实。常用的一招是剪掉影响不大的层,列如中间冗余的attention block,或者MLP里维度特别高的部分。 也可以用结构重参数化的思路,把... 内容分享# Python# 大模型# 深度学习 3个月前100
如何通过推理加速优化你的大模型? 目前大模型火归火,但落地一看推理慢、资源吃紧,许多都跑不动,特别是在边缘设备或者商用场景里。所以推理加速优化,真的就是决定能不能真正work的关键。我们来聊聊2025年比较实用、还挺有前景的优化手段... 内容分享# Python# sci# 大模型 1个月前100
大模型备案全攻略,保障数据安全! 大模型备案,听起来复杂?实则跟着指南一步步来,就简单多了! 技术文档、 测试报告、 用户协议,三大材料缺一不可。 技术文档要详尽,模型架构、数据流程一目了然; 测试报告关乎模型合规,性能安全一个不落... 内容分享# ai# 人工智能# 大模型 3个月前100
大模型推理性能如何优化? 1. 模型压缩,轻量化是关键说到大模型,大家都知道它的计算量大,推理慢。要想提升推理性能,第一得思考模型的压缩。实则,许多时候并不是非要用那么重的模型。通过剪枝、量化这些技术,你可以大幅减少模型的计算... 内容分享# Python# 一对一指导# 复现 3个月前100
大模型备案冲刺包!码住不踩雷! 1.语料安全:抽4000条人工+10%技术检,合格率96% 98%才过关!把敏感词库更新到最新,别让违规语料混进来 2.生成内容:题库至少1000题,人工+关键词+模型三重抽检,90%通过率是底线!提... 内容分享# ai# 大模型# 大模型备案 3个月前100
大模型备案安全评估要求! 生成式AI大模型要备案,安全评估是命门,我熬夜啃完官方文件,把重点画给你们。 语料安全:至少抽3万条,人工+技术双检,合格率≥98%才稳!关键词库和分类模型得按第8章标准搭,别偷懒~ 生成内容:自建题... 内容分享# ai# 大模型# 大模型备案 3个月前100