大模型

LLM的SFT和RL有啥新发现？

1、SFT作为RL训练稳定剂的新认识以前我觉得SFT和RL是完全独立的阶段，但目前发现它们的关系要微妙得多。SFT阶段就像是为RL训练提供了一个稳定的基座，有了它，RL训练可以大幅减少不稳定性。在我尝...

内容分享 # 一对一指导 # 发文 # 大模型

6个月前

010

终于把神经网络算法搞清楚了！！！

。神经网络由一系列相互连接的节点（称为“神经元”）组成，这些节点按照必定的层级结构组织，一般包括输入层、隐藏层和输出层。卷积神经网络（CNN）：卷积神经网络（CNN）是一种深度学习模型，专门用于处理图...

内容分享 # 大模型 # 大模型微调 # 大模型训练

6个月前

010

大模型SFT过程的不稳定？

本期通过“乐队演奏乐曲”这一例子跟大家探讨SFT后大模型变傻了的问题，感兴趣的同学欢迎评论区交流哦～️在训练LMM时，我们会发现一个有趣的现象：同一份数据进行多次训练，在benchmark上的预测结果...

内容分享 # LLM # LMM # 大模型

6个月前

010

AI大模型入门：思维链COT详解

。思维链COT（ChainofThought）是近年来人工智能领域超级热门的概念，它模仿人类的推理过程，协助模型更高效地解决复杂问题。核心定义：思维链是一种通过逐步推理解决问题的方法，即将一个复杂问...

内容分享 # ai # AI工具 # 大模型

6个月前

010

将大型语言模型作为自动对齐器，为视觉语言

。随着大型语言模型(Large Language model，LLMs)的发展，视觉语言模型(Vision-Language model, VLMs)已经达到了一个新的复杂程度，在执行复杂的认知和推理...

内容分享 # 人工智能 # 大模型 # 大语言模型

6个月前

010

小型视觉语言模型的强大威力

。昨天抖音发布多模态大模型SAIL-VL-2B，该模型取得了pencompass榜单2B模型第一的成绩，展现了。今天学长给大家详细介绍了SAIL-VL-2B模型的概述与评估表现，让我们一起紧跟多模态大...

内容分享 # LMM # 人工智能 # 多模态大模型

6个月前

010

AI术语：Scaling laws

.Scaling Laws，一种普遍存在的统计规律，不仅在AI领域，物理学等领域也有其身影。在 AI 领域，它揭示了AI系统性能与模型大小、数据集大小、计算资源等之间的幂律关系：即随着规模的扩大，性...

内容分享 # ai # AI术语 # 大模型

6个月前

110

上班摸鱼用MCP搭建了一个Agent系统

。上班摸鱼动手做了一个实践！.主要是为了从零到一搞清楚基于MCP开发Agent应用全流程，方便为研究新的落地场景，做新的AI产品做准备。.实践实现的是目前最常见的Agent知识库系统，支持检索问答，上...

内容分享 # Agent # ai # MCP

6个月前

310

自己动手搭建AI Agent效率直接起飞

。家人们，今天来聊聊超厉害的AI Agent ！它的强劲之处在于能自动执行复杂任务，大大提升自动化水平，让智能决策更高效，简直是工作学习的超强助手。工作原理四步走感知：通过各种传感器敏锐捕捉环境变...

内容分享 # Agent # ai # 大模型

6个月前

410

快速搭建本地 AI 知识库方案

。从头开始利用RAG、Agent、LangChain等技术搭建本地知识库-本地模型准备：通过Ollama部署模型，需要详细部署教程的朋友可以参照我上一条《2步轻松部署本地AI大模型》的笔记进行设置...

内容分享 # ai # AI产品经理 # RAG

6个月前

110

大模型推理加速技术的学习路线在这里！

。推理优化的重大性大模型推理优化是解决大规模语言模型（LLM）高效推理的关键。以540B参数的GaLM为例，其推理成本超级高，如果无法优化成本，模型的普惠性将大打折扣。大模型的推理需求主要可分为两类...

内容分享 # 大模型 # 强化学习 # 时间序列分布预测

6个月前

110

大模型推理优化的几个常见技术

。结构裁剪面对超大参数量模型，不做裁剪直接部署，那是真不现实。常用的一招是剪掉影响不大的层，列如中间冗余的attention block，或者MLP里维度特别高的部分。也可以用结构重参数化的思路，把...

内容分享 # Python # 大模型 # 深度学习

6个月前

110

如何通过推理加速优化你的大模型？

目前大模型火归火，但落地一看推理慢、资源吃紧，许多都跑不动，特别是在边缘设备或者商用场景里。所以推理加速优化，真的就是决定能不能真正work的关键。我们来聊聊2025年比较实用、还挺有前景的优化手段...

内容分享 # Python # sci # 大模型

4个月前

110

大模型备案全攻略，保障数据安全！

大模型备案，听起来复杂？实则跟着指南一步步来，就简单多了！技术文档、测试报告、用户协议，三大材料缺一不可。技术文档要详尽，模型架构、数据流程一目了然；测试报告关乎模型合规，性能安全一个不落...

内容分享 # ai # 人工智能 # 大模型

6个月前

110

大模型备案冲刺包！码住不踩雷！

1.语料安全：抽4000条人工+10%技术检，合格率96% 98%才过关！把敏感词库更新到最新，别让违规语料混进来 2.生成内容：题库至少1000题，人工+关键词+模型三重抽检，90%通过率是底线！提...

内容分享 # ai # 大模型 # 大模型备案

6个月前

110

大模型备案安全评估要求！

生成式AI大模型要备案，安全评估是命门，我熬夜啃完官方文件，把重点画给你们。语料安全：至少抽3万条，人工+技术双检，合格率≥98%才稳！关键词库和分类模型得按第8章标准搭，别偷懒～生成内容：自建题...

内容分享 # ai # 大模型 # 大模型备案

6个月前

110

大模型推理性能如何优化？

1. 模型压缩，轻量化是关键说到大模型，大家都知道它的计算量大，推理慢。要想提升推理性能，第一得思考模型的压缩。实则，许多时候并不是非要用那么重的模型。通过剪枝、量化这些技术，你可以大幅减少模型的计算...

内容分享 # Python # 一对一指导 # 复现

6个月前

100

LLM的SFT和RL有啥新发现？

终于把神经网络算法搞清楚了！！！

大模型SFT过程的不稳定？

AI大模型入门：思维链COT详解

将大型语言模型作为自动对齐器，为视觉语言

小型视觉语言模型的强大威力

AI术语：Scaling laws

上班摸鱼用MCP搭建了一个Agent系统

自己动手搭建AI Agent效率直接起飞

快速搭建本地 AI 知识库方案

大模型推理加速技术的学习路线在这里！

大模型推理优化的几个常见技术

如何通过推理加速优化你的大模型？

大模型备案全攻略，保障数据安全！

大模型备案冲刺包！码住不踩雷！

大模型备案安全评估要求！

大模型推理性能如何优化？

网址

3699小游戏

3699小游戏

Poki (宝玩)

奔图，专注做好打印机【官网】

商丘网 —— 商丘网络第一媒体

卫星地图高清2025

热门文章

大模型

网址

3699小游戏

3699小游戏

Poki (宝玩)

奔图，专注做好打印机【官网】

商丘网 —— 商丘网络第一媒体

卫星地图高清2025

热门文章

标签云