全能 AI 聚合平台 免费

一站式接入主流 AI 大模型,支持对话 · 生图 · 生视频,即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama
AI对话 AI生图 AI视频
免费使用 →

多模态大模型视觉编码器优化

。 视觉编码器扩展:传统的视觉语言模型(VLM)如CLIP使用的是基于ViT的编码器,一般采用监督学习进行训练。这些模型通过对齐图像与文本标签来提取图像特征,但对于分布外图片的处理存在不足,可能导致图...
头像8个月前
030

AI4Science科研,全线上

。一、项目组背景本组导师依托北京大学背景,重点在人工智,能(尤其是大模型、生成模型)与科学研究的深度融合(AI4Science),希望能够用AI技术解,决生物、医学、化学等领域的科学和实践问题,现面向...
头像7个月前
020