OpenAI壮士断腕关停Sora 押注语音AI改写交互规则

内容分享3小时前发布
0 0 0
全能 AI 聚合平台 免费

一站式接入主流 AI 大模型,支持对话 · 生图 · 生视频,即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama
AI对话 AI生图 AI视频
免费使用 →

OpenAI关停了爆火仅半年的Sora,把全部算力资源转向语音AI模型。这件事看起来是企业战略调整,但背后藏着整个AI行业竞争逻辑的彻底转向:

从抢“展示技术肌肉”的热点赛道,转向抢用户真实交互的入口阵地。为什么曾经封神的视频生成会变成吞金黑洞,而语音交互突然成了所有人争抢的香饽饽?

OpenAI壮士断腕关停Sora 押注语音AI改写交互规则

汽车智能座舱中控屏 · 中控屏显示导航、音乐及AI对话内容

Sora的落幕 是通用AI泡沫的一次挤破

2025年9月Sora发布时,整个科技圈都沸腾了。能生成1分钟连贯高清视频,物理细节还原度拉满,不少人直接喊出“好莱坞要完蛋”,甚至迪士尼都传出计划注资十亿美元合作开发IP。

可谁能想到,仅仅半年时间,这个曾经碾压所有同行的“视频界GPT-3.5”,就被OpenAI亲手关停。根据公开数据,Sora上线半年累计消费者收入仅140万美元,但每天的算力成本就高达1500万美元。

只要服务器开机,每天就烧掉一套豪宅,一年就是几十亿美元的无底洞。

除了成本问题,版权争议更是让Sora寸步难行。靠着生成知名IP内容出圈,也引来了版权方的集体反对,内容限制层层加码后,用户新鲜感快速消退,30天留存率仅1%,60天留存几乎归零。

这件事给整个行业敲了一个警钟:能展示技术不代表能做成生意,通用大模型的狂欢之下,藏着变现难的普遍困境。哪怕是OpenAI这样的头部玩家,也扛不住持续失血的吞金项目。

而OpenAI选择关停Sora后,把全部算力投入到GPT-Realtime-2语音模型,这个选择本身就说明:AI行业正在从“炫技”转向“务实”,抢下交互入口比做一个好看的花瓶重大得多。

OpenAI壮士断腕关停Sora 押注语音AI改写交互规则

X平台推文截图 · 马斯克转发xAI的Grok Voice宣传内容

为什么所有巨头都在押注语音交互?

2026年5月的第一周里,OpenAI上线了GPT-Realtime-2,千问同步在PC端推出AI语音输入,马斯克也在X上为xAI的语音助手造势,整个行业在短短几天内集体转向语音赛道。

Sam Altman说过,年轻人更喜爱通过语音和AI互动,而中老年人更习惯打字。顺着这个角度往下挖,你会发现这件事不止是用户习惯差异,背后是交互逻辑的底层重构。

OpenAI壮士断腕关停Sora 押注语音AI改写交互规则

AI产品功能介绍图 · 展示X3的方言、外语识别及行业词库能力

过去二十年,键鼠和图形界面GUI塑造了我们对生产力工具的认知:必须坐在电脑前,必须用眼睛盯着屏幕,必须用手一个字一个字敲。这种方式精准高效,但也把我们牢牢绑定在书桌前。

而语音交互界面LUI的出现,直接打碎了这个刻板印象。你起身接水、下楼透气,甚至瘫在椅子上发呆时,只要随口说几句话,AI就能跟上你的思维,灵感不会由于没坐在电脑前就溜走。

语音输入过去一直被诟病“有效信息含量低”,但这个问题只有AI能解决。就拿千问PC端的语音输入来说,你说话时大量的“呃”“就是”这类填充词,AI能直接过滤干净,还能自动整理句式,生成通顺规整的内容。

OpenAI壮士断腕关停Sora 押注语音AI改写交互规则

千问PC端界面 · 显示语音输入功能及用户输入的需求

更关键的是,图形界面GUI能覆盖的场景已经摸到天花板了。开车、锻炼、下厨、洗澡这些场景,你的手和眼睛都被占用,语音是唯一可行的交互方式。

目前国内新能源车企早就盯上了这块蛋糕,不少车型已经接入了头部AI大模型的语音能力,复杂指令也能一次听懂,这也是为什么目前新车发布,语音交互体验已经成了核心宣传点。

OpenAI壮士断腕关停Sora 押注语音AI改写交互规则

GPT-Realtime-2介绍页面 · 展示模型推理、速度、价格等参数信息

谁能拿下语音交互的主导权,谁就能垄断下一代用户碎片化时间的交互主权。提前迎合年轻人的使用习惯,建立用户粘性,这个逻辑和当年海外厂商烧钱做教育市场是一样的。

语音AI是AI硬件普及的最短路径

许多人讨论语音交互,都只盯着软件层面的交互变革,但很少有人注意到:语音AI实则是传统IoT设备转型AIoT最快的捷径。

过去想要把智能硬件变“机智”,必须堆屏幕、堆高性能芯片,成本居高不下,许多小厂商根本玩不起。但AI语音改变了这个规则:只需要一个收音麦克风、一个基础计算模块,再加上网络连接,就能把普通IoT设备改造成AIoT产品。

OpenAI壮士断腕关停Sora 押注语音AI改写交互规则

手机背贴的钉钉A1 Lite · 手持贴有钉钉A1 Lite的带碳纤纹壳的手机

钉钉A1录音卡就是最好的例子。它本身只是一个贴在手机背后的小卡片,负责语音拾取和降噪,转写、翻译、整理这些 heavy lifting 的工作全都交给手机里的大模型完成。既能优化录音效果,又不用在硬件端堆算力,成本控制得超级美丽。

除了给传统设备赋能,语音AI甚至直接催生了一批全新的AI产品。科大讯飞基于语音技术,推出了AI翻译机、会议耳机、AI办公本等一系列产品,把原本的体验痛点彻底解决。

就拿电子墨水屏办公本来说,墨水屏天然不适合键盘输入,过去只能当个显示器用,根本没法真正办公。但语音输入解决了输入问题,再加上方言和多语言识别能力,直接让墨水屏从“显示设备”升级成了全能办公本。

语音交互降低了AI硬件的门槛,让AI能真正走进更多生活场景。

中国AI企业在这里有天然护城河

发力语音交互,对国内AI厂商来说还有一层特殊意义:我们天生更懂中文,这是海外巨头抢不走的优势。

中文本身的语言逻辑比英语复杂得多,有大量倒装、省略,还有只可意会的潜台词,再加上中国庞大的方言体系,每个方言都有自己的文化和表达习惯。

海外大模型哪怕能做基础的中文翻译,遇到带口音的口语、特定语境的俚语,往往就无从下手。列如ChatGPT就没法稳定输出粤语,说着说着就会自动切回英语,这个问题对国内厂商来说根本不存在。

OpenAI壮士断腕关停Sora 押注语音AI改写交互规则

X平台推文截图 · Sam Altman发布关于AI语音交互的观点

这个优势不止覆盖国内用户,还延伸到了海外华人市场。全球有几千万海外华人,许多一代移民哪怕在海外生活几十年,还是只会说中文,不少老年人甚至不会打字,语音交互是他们使用智能设备的唯一方式。

这个市场被海外巨头长期忽略,但对国内AI厂商来说,这就是现成的增量市场。死磕中文和方言识别,本质上就是给自己建立了天然护城河,也找到了一条走向全球的差异化路径。

OpenAI壮士断腕关停Sora 押注语音AI改写交互规则

实时翻译波形界面 · 呈现语音输入输出波形及双语转写内容

回头看整个AI行业的发展,实则一直遵循着一个规律:交互方式每迭代一次,就会诞生一批新的巨头。从命令行到图形界面,从PC触屏到手机滑动,每一次变化都重构了行业格局。

目前AI行业正在从“人适应AI”转向“AI适应人”,我们不需要学习怎么给AI写精准的提示词,AI反而要学着听懂我们杂乱的口语,跟上我们跳脱的思维。那个对着输入框抠字眼的时代,正在慢慢翻篇。

国内AI厂商抓住了中文语音这个天然优势,能不能在这一轮交互变革中抢下先机,甚至实现弯道超车?时间会给出答案,但至少目前,我们已经站在了更有利的位置上。

#与ChatGPT的有趣对话##语音交互##OpenAI##千问##ClaudeCode##你喜爱华为的三面折叠机吗?##目前哪款手机的系统是最好的##目前中国芯片,到底到世界什么程度##教育##民生##华为手机##鸿蒙##小米手机##iPhone##华为畅享#

© 版权声明

相关文章

暂无评论

none
暂无评论...