编辑|Sia
目前还没有人真正解决这个问题:如何让 LLM 知道什么时候该精确、什么时候可以随机。
这真是一个让人当场破防的早晨。
一位 The Verge 的科技记者起床、走进厨房、对着支持 Alexa 的博世咖啡机说了句,煮杯咖啡。
没有即兴发挥,也没提什么复杂要求,她只是希望机器老老实实执行一个早就设好的程序,结果,被拒绝了。
而且不是一次。
自从升级到 Alexa Plus(亚马逊的生成式 AI 语音助手)之后,这种对话几乎成了她的晨间固定项目。
每一次要它煮咖啡,Alexa 都能给出不同理由,以惊人的创造力告诉你,不行。

2025 年都快过去了,AI 会写论文、会写代码、会陪人聊天、会教书,却在清晨败给了一句「煮杯咖啡」。
在社区讨论中,类似吐槽场面非常壮观,可谓怨声载道。
开灯这个事儿,完全成了重灾区。






播放歌曲也是艰难。

定个时也这么难了啊。

彻底心灰意冷的也有。

显然,现实与大家对 AI 的直觉预期,构成了鲜明反差。
传统助手虽然笨吧,但高度确定,只要你把(有点傻的)「咒语」念对,结果总是可以预期的。
现在好了,以 LLM 为核心的生成式AI助手,智商是高了,理解是深了,表达是丰富了,却偏偏在它们原本最擅长的事情上频频翻车:
开灯、设定计时器、播报天气、播放音乐、运行 Routine。

为什么会这样?
因为,LLM 天生引入了大量随机性。它能理解更多含义,也允许更自由的表达,但代价是:解释空间被极大放大了,包括误解的可能性。
你向 ChatGPT 提出同一个问题,今天和明天得到不同答案,这正是它的价值所在。但当这种特性被用于控制一台咖啡机时,就有问题了。
在要求即时、可重复、零容错的控制场景下谈概率,本身就是一个大 bug。

相比之下,传统语音助手的本质,其实是模板匹配器。它们并不理解,只是识别关键词,然后填参数。
比如你说「播放广播」,系统非常清楚,后面只可能跟「电台名称」。
为了弥补生成式模型在确定性上的短板,亚马逊和谷歌都尝试将 LLM 与智能家居 API 深度绑定。但这又引入了新的问题。
LLM 确实不擅长在每一次请求中,都生成完全一致、语法严格正确的系统调用。
而当它们被要求直接生成 API 调用、去控制真实设备时——哪怕是一个极小的偏差,都可能导致整个操作失败。
这正是为什么,你的咖啡机有时就是死活不肯给你做咖啡。

理论上,让新助手达到旧助手那样的可靠性,并非不可能,但这需要极其大量的工程投入、约束设计和失败兜底。
而在资源有限、 「做点更刺激、也更赚钱的事情」诱惑又足够大的现实里, 最简单的路径就是先把技术推到现实世界中,再让它慢慢自我修正。
换句话说,我们正在集体扮演一个角色:AI 的长期内测用户。
目前还没有人真正解决「如何让 LLM 知道什么时候该精确、什么时候可以随机」的问题。所以,大家可能要在相当长的一段时间里,不断和它较劲、和血压搏斗。

既然如此,为什么还要坚定地抛弃旧技术?
两个字:潜力。
所谓的代理式 AI(Agentic AI),让系统具备服务链式调用的能力:它能够理解复杂任务之间的内在关系,并在此基础上动态生成执行逻辑。
这也是旧技术路线必须被放弃的根本原因。
过去,基于固定规则与关键词匹配的语音系统,在架构层面就被限定为「单指令执行器」,它们无法理解目标、拆解任务,更不可能在运行时生成新的行动路径。
这不是一次简单的技术升级,而是一次能力范式的切换。

回到社区舆论,虽然连最基本的指令都出错,但网友们也承认,升级后的语音助手在理解复杂命令这件事上,确实更强了。
比如你说,「这里调暗一点,温度再高一点。」 它可以同时调灯和调恒温器。
当质问「Alexa,你到底在干嘛?为什么不关掉我的音乐?!」 它真的会去查一下发生了什么。
放在过去,这些都是不可想象的。
最为人称道的是是摄像头通知功能的变化。
传统系统往往只有一句高度概括的废话,「后院检测到运动。」于是你不得不:打开 App → 点开视频 → 回看 → 发现是一只猫。
现在,新系统会直接告诉你,「门口出现了不熟悉的面孔,但没有进入院子。」
用语音设置复杂 Routine,也确实比在 Alexa App 里一层层点设置来得轻松,哪怕这些 Routine 运行起来并不那么稳定。

在大量用户讨论中,也逐渐形成了一个相对温和的共识:问题不在于是否引入 AI,而在于「边界」、是否试图用 AI 替代一切。
一些用户认为,更合理的方向不是「去按钮化」——取代那些已经被验证过的、确定性的执行机制,而是让 AI 帮助人理解系统。

当前出现的混乱,或许并不是生成式 AI 的失败,而是其被放置在了一个并不适合它的核心位置。
不过,至少在今天,这条清醒的边界远未被勾勒出来,也不知什么时候能被画出来。
那么,你的智能家具还好吗?有没有过类似的抓狂瞬间?欢迎来评论区唠唠。
本文转自:凤凰网科技
原文地址: https://tech.ifeng.com/c/8q161iD5bp2

小同爱分享5 天前
我床上有两个枕头,一个是我的,另一个还是我的。 - 小同爱分享
小同爱分享18 天前
失败是成功之母,但我的失败,好像不孕不育。 - 小同爱分享