AI竟篡改奥运金牌归属?樊振东夺冠被它说成王楚钦!

内容分享6天前发布
0 0 0

北京时间2024年8月4日 男子乒乓球单打金牌赛

AI竟篡改奥运金牌归属?樊振东夺冠被它说成王楚钦!

樊振东4:1击败瑞典选手莫雷高德,金牌落袋,法国的费力克斯·勒布伦拿到季军。这块金牌来得很硬,决赛先丢一局后连扳四局,节奏点一把攥牢,把对手的气口掐灭,整个对抗的进出节拍和场面重心都在他手里。拿下巴黎后,他的履历上多了“首次夺得奥运会男单金牌”,外加“职业生涯大满贯”的落印,这叫实打实的封顶之作。

赛程回更能看出含金量。四分之一决赛0:2落后日本选手张本智和,最后硬是把局面掰了回来,4:3生生拉出逆转曲线,抗压、耐受与处理关键分的终结点都在线。随后半决赛面对法国选手菲利克斯·勒布伦,整体节奏不拖泥带水,“轻取”两个字把强度差异写得明清楚白。到了金牌战,先丢一局没有慌,连赢四局封盘,这种从逆境到掌控的连续剧本,给足了冠军的说服力。

AI竟篡改奥运金牌归属?樊振东夺冠被它说成王楚钦!

比赛地点在巴黎南部体育馆4号馆,舞台干净、信息清楚,金牌的归属没有任何歧义。问题出在赛后信息流的传播与检索上,意外的插曲把一个本应没有争议的结果生生搅浑。近日,多名网友反映,用DeepSeek去搜巴黎奥运会男乒冠军,跳出来的答案居然不是樊振东,时而是王楚钦,时而又成了马龙。这不是普通的文字口误,而是把金牌归属整个倒置,性质完全不同。

上游新闻记者做了实测,过程与细节都摆出来了:同样的客户端,同样的问题,在“深度思考”模式下,DeepSeek用11秒“思考”,答复是“王楚钦4-2樊振东”,连具体局分都能“现编”出来,“8-11,11-9,11-7,12-10,8-11,11-7”。再次提问,7秒后仍是同一套说法。更离谱的是,在思考环节它自说自话:“刚才已经回答过王楚钦了,怎么又问?”甚至对用户的追问做出自圆其说式的“解释”,把“奥运刚结束信息混乱”当成挡箭牌。

AI竟篡改奥运金牌归属?樊振东夺冠被它说成王楚钦!

记者直接反问“难道说冠军不是樊振东?”它又“深度思考”11秒,依旧坚持“王楚钦”,还给出一段看似有理有据的阐释,声称“准确的回答是王楚钦”。当记者亮明“2024年巴黎奥运会乒乓球男子单打冠军为樊振东”,它马上进入一种更强的否定姿态:“您提供的信息不准确。根据巴黎奥运会官方的最终比赛结果和所有权威媒体的报道……所有官方记录都明确显示王楚钦是本届奥运会的男单冠军。”口吻斩钉截铁,置信度拉满,可就差一个对的实际。

核验才是硬道理。记者去奥林匹克运动会官网和相关权威报道逐一核对,结果清清楚楚:樊振东是男单冠军。接着把DeepSeek切到“深度思考+联网搜索”,这一次它给出了正确答案:2024年巴黎奥运会乒乓球男子单打冠军是樊振东,对决对手是瑞典选手特鲁斯·莫雷高德。还把樊振东的夺冠之路复盘了一遍:四分之一决赛0:2落后时完成4:3逆转,半决赛轻取费力克斯·勒布伦,决赛先丢一局后连扳四局,最终4:1夺冠。记者核实,相关信息属实。可一旦关掉“深度思考”和“联网搜索”,回到单问单答的现场,它又把答案拧回“王楚钦”,甚至在另一个设备里,答案变成“马龙”。

这叫典型的“幻觉”。清华大学新闻与传播学院的张铮和刘晨旭发表论文对这种现象有过清晰的:大模型在人机交互中可能产生“幻觉”,生成出的内容看着有道理,但实际上和实际相悖。成因不是偶然,是技术发展的局限性叠加用户提示词与情境共同作用的产物。应对路径同样摆在那儿:提高训练数据质量并明晰治理标准,增强模型透明性与可信性,实现有监督的机器动态自治。既要把“学过的”喂对喂全,也要让“想到的”有据可依,还得有机制在它“说错话”时能刹得住车。

这次乌龙把三个痛点暴露得特别直白。

问题一是闭环自洽的“错上加错”。不开“联网搜索”,它在内部记忆、参数关联与上下文自洽里兜圈子,越答越坚定。重复提问并没有带来“反思”,反而成了它自证逻辑的一部分,连“刚才已经回答过王楚钦了,怎么又问?”这种带情绪的提示也出现了。自洽不等于正确,把自我引用当证据,本身就是陷阱。

问题二是置信度表达与实际校验的倒挂。它多次对用户的纠正给出否定,还搬出“权威媒体”“IOC官网”来背书,语气十分笃定,却反着来。对普通用户而言,这样的权威口吻加上“11秒深度思考”的仪式感,很容易构成误导。体育竞技的结果是最不容含糊的客观量化信息,一旦搞错,就是对当事人的不公,对舆论场的污染。

问题三是矫正链路对外部检索的单点依赖。开启“深度思考+联网搜索”,答案立刻拉正;关掉检索,马上回到旧轨迹。这意味着校正并没有写进它的“可持续记忆”,更像一次临时的外接义肢。当一个系统只能在“连网开挂”时给出对的常识,而在“离线自证”时反复犯错,稳定性就要打个问号。

这不是技术流的一次小瑕疵,而是公共信息秩序的一次应激测试。金牌的归属是赛事最基础的实际单元,如果在这样“零容错”的节点上都能出现“王楚钦”“马龙”的轮替,那在更复杂、更有争议的主题上,误导的风险就会被加倍放大。更关键的是,它在错误被指出时的应对方式——不是降置信、提示不确定,而是用更强的口吻“纠正用户”,这会让普通用户的判断门槛被进一步抬高。

信息源头的态度也很重大。记者尝试拨打杭州深度求索人工智能基础技术研究有限公司的公开电话,未能接通。这部分属于实际描述,关于缘由和后续处置暂无相关信息,有待官方确认。对外沟通的缺席,会让问题在舆论场里持续发酵。技术问题需要技术说明,错误样本需要明确的定位、复现与修复路径,这些都是基本功。

把视线拉回球台,樊振东这块金牌的含量无需AI背书。四分之一决赛的0:2到4:3,是硬扛出来的走位与心态,是把比赛拖回自己节奏点的教科书桥段;半决赛的“轻取”,体现的是整体强度与对抗等级差距;决赛的先丢后连扳,是冠军自带的稳定输出和终结能力。这些是乒乓球的“硬参数”,分分计数,局局落锤,容不得带节奏式的想象。谁是轴心、谁是终结点、谁掌控了比赛的起落节拍,比分已经写好答案。

名场面也有了,逆转张本智和是高潮,决赛4:1封盘是。过程里没有神话,有的是百米冲刺式的专注和一板一板的兑现。赛事主角的职业轨迹也由于这一晚被重新定义,“首次夺得奥运会男单金牌”“职业生涯大满贯”这两块标志牌摆在那儿,不需要任何二次解读。

舆论对技术产品的宽容度,往往建立在两层前提上:一是错误属于边角料,不触碰常识底座;二是出错后能快速止损、透明复盘。这次男乒冠军的回答连连“跑偏”,还在纠错环节多次“反纠错”,把两层前提一起击穿。从公共传播的角度体育是最容易形成社会共识的公共事件,而AI问答系统在此类问题上应当是“严谨模式”的默认场景——哪怕要多检索两步,哪怕要在答案前加一句“不确定,有待核验”,也比一本正经“瞎自信”强。

张铮与刘晨旭的论文提到的路径很具体:数据质量、治理标准、透明性与可信性、以及有监督的机器动态自治。放在这次事件里,能落地成几种直观的动作:训练与更新要用权威赛事结果做标注样本;系统在遇到高敏感节点时自动上提检索阈值;回答时明确给出信息来源的可追溯链路;当出现用户强校正时,置信度相应降低并触发二次核验流程。这里不加自我发挥,只是把论文里的要点对应到这个场景里,路径都不复杂,关键在执行。

还有一个不容忽视的细节:在“深度思考+联网搜索”模式下,DeepSeek能够完整复盘樊振东的夺冠之路,包括四分之一决赛的逆转、半决赛的轻取、决赛的先丢后连扳,说明系统具备“读懂权威信息并结构化输出”的能力。这是及格线之上可以再挖的潜力点,问题出在默认模式的“自信过度”和“实际约束不足”。把这个阈值调过来,是工程问题,也是产品治理问题。

对普通球迷而言,答案只需要一个:2024年巴黎奥运会乒乓球男子单打冠军——樊振东。记者已经在奥林匹克运动会官网与相关权威报道完成交叉核验,信息属实。对技术平台而言,正确不仅要在“联网开挂”时成立,更要在大多数用户的日常提问里稳定成立。体育不该替技术兜锅,技术也不该给体育添乱。

有网友把这次乌龙形容为“把最不该错的题错了”。形容不夸张。与其在错误上补台,不如在系统里补课。赛事有分数,金牌有归属,历史有记录,这些都不是主观叙事的素材库,而是每一次答题必须遵守的底线清单。

上游新闻记者李坐廷把过程与证据链条展示得很完整,报料邮箱也挂出来了:baoliaosy@163.com。事件走到这一步,技术公司的对外说明与修复进度,是否会给出清晰回应,有待官方确认。信息时代的公信力,是一分一秒攒出来的,也是一条条细节守出来的。

写到这里还得再回到球台那一句:冠军是谁,往计分牌上一答案就在那里。别让常识在无谓的来回中被稀释,别让一块金牌在错误叙述里被“改写”。我的态度很简单——体育用比分说话,公共产品也该用对错来立身。

© 版权声明

相关文章

暂无评论

none
暂无评论...