
世界上最前沿的四大AI,各自擅长什么?局限在哪里?这是我在2026年4月,用到的和我看到的。
1️⃣ ChatGPT
最令人惊喜的,是Codex,原本是一个开发者工具,目前逐渐变成了一个通用AI智能体,能够一句话让AI处理任何事情,包括操作浏览器、操作你的本地电脑(你看着它的专有鼠标在你的屏幕上点),量大管饱,Plus套餐基本不用担心额度。
4月底发布GPT5.5之前,先发布了GPT-images-2.0文生图AI智能体工作流,图片的文字准确率全网第一,图片效果甚至某些方面超过谷歌香蕉。
只聊天,就用ChatGPT网页版,同时强烈提议你使用Mac/Win的Codex app,安装使用比OpenClaw小龙虾更快更省。
2️⃣ Gemini
最擅长创意的AI大模型,同时幻觉率一直维持着比较高的水平。
Gemini AI大模型在谷歌生态里无处不在,关键是,看你在哪里使用它:
– Gemini app,一直是谷歌生态内部的三等公民,体验很差,勉强跟上AI智能体的动作,居然是生成文件只供下载(不能编辑)。有一说一,集成的Nano Banana 2,出图质量很高,而且富有创意。
– Notebook LM,这是超级能打的知识库产品,生成PPT一绝,就算为了这个软件业值得订阅谷歌AI套餐。
– Workspace、搜索、Gmail、油管等谷歌生态软件,都集成了Gemini。
Gemini的总部是DeepMind,远在伦敦,最近三个月更新很慢。相反,谷歌的生态建设和投资布局却步步为营,拉动股价持续看好。
3️⃣ Claude
新出的Opus 4.7,口碑不如Opus 4.6,许多开发者使用Opus 4.6做架构设计、做前端设计,但是由于性价比实在太低,所以会用Codex或者Kimi来做具体代码执行。
Claude做PPT的效果超级不错,当然延续纸质感、淡雅和高级感,在全网有独特感。口碑不一。品味这件事情,太雅受众面反而小。
Anthropic关注点在软件,且太保守,所以算力严重不足。一方面疯狂随机封号,另一方面用KYC打击中转站,再一方面暂停新用户注册,再再方面新模型神话Mythos仅特供部分企业,且不对外开放。
4️⃣ Grok
超级硬核、工程优先,查找实时信息,准确且极快,4-16个Agents协同作业,token输出速度全网第一,你会感觉用起来最快。最大的特点是和X社交网络深度集成,无与伦比的优势。
Grok生图也推出了Agent模式,生图和生视频速度快,但质量不如Gemini和GPT。Grok写代码要等Cursor在巨像的训练结束。
订阅价格是30美金/月(比其他家贵50%),但是API价格有极高性价比。
你在用哪一款或哪几款AI?评论区交流