。Grok 4 已于北京时间 2025 年7 月 10 日中午 12 点正式发布!看完全程直播,我只想到一个词:惊艳!开场演讲马斯克经典登场——依旧是那种“嘴快脑慢”的风格;紧随其后,xAI 联合创始人、湖南籍华人吴宇怀上台发言,再后来是他的老师、Geoffrey Hinton 弟子 Jimmy Ba,让人倍感亲切。Human Last Exam(HLE)成绩公布由全球近千名专家联合打造的多模态基准测试——“人类最后一场闭卷考试”共含 3000 道高难度题目,目前 SOTA 模型得分徘徊在 22 分左右,而 Grok 4 则一跃飙升至 44.4 %,几乎碾压一切。即使在不调用工具的情况下,它也已经全面超越 Gemini 2.5 Pro;启用工具后,更是实现了无可匹敌的 44.4 %!在线演示人肉搜索:Grok 4 仅用几分钟就能准确找出大部分 xAI 员工资料,堪称 AI 版“人肉搜索”。学术测试:在 GPQA(科学、数学、历史、常识)、AIME 25(数学,一举满分)、LCB(编程)、HMMT 25、USAMO 25 等多项权威榜单上,Grok 4 均展现出碾压式优势。ARC-AGI:这是由 François Chollet 提出的抽象推理基准,Grok 4 在该项测试中的表现让人刮目相看(与 arcprize.org 上的排行榜略有出入,具体评分标准尚待官方释疑)。Vending-Bench:在模拟自动售货机运营的长期业务场景中,Grok 4 的净收益是 Claude Opus 4 的两倍!订阅与 APIGrok 4 已在官网上线,常规订阅价每月 30 美元,Heavy 版为 300 美元;同时开放 API,支持高达 256K 的上下文窗口。但是!别忘了你有Xstech AI







© 版权声明
文章版权归作者所有,未经允许请勿转载。

不需要
需要国外电话号码吗