做RAG系统最难搞定的是那部分工作? RAG基础概念Retrieval-Augmented Generation(RAG)是通过检索外部知识来增强LLM生成能力的技术。检索可以是通过搜索引擎或是离线数据库(如企业、政府机密数据)。检索到的... 内容分享# Python# 代码定制# 深度学习 1个月前000
国内顶尖人工智能实验室推荐 。1. 中国科学院计算技术研究所2. 清华大学计算机科学与技术系人工智能研究所3. 北京大学计算机科学技术研究所4. 上海交通大学人工智能与机器人研究院5. 华为诺亚方舟实验室6. 中科院自动化研究所... 内容分享# Python# 人工智能# 机器学习 1个月前000
大模型推理优化的几个常见技术 。结构裁剪面对超大参数量模型,不做裁剪直接部署,那是真不现实。常用的一招是剪掉影响不大的层,列如中间冗余的attention block,或者MLP里维度特别高的部分。 也可以用结构重参数化的思路,把... 内容分享# Python# 大模型# 深度学习 2个月前100