清华姚班姚顺雨讲ReAct:Siri为什么只会无脑执行?

写论文写到崩溃的研究生,凌晨两点还在跟“AI答非所问”死磕——12月19日,MIT实验室把ReAct框架塞进厨房机器人,它只用5步就搞定“客人临时加菜、盐罐却空了”的修罗场,成功率飙到85%,比人类玩家平均72%还高。

清华姚班姚顺雨讲ReAct:Siri为什么只会无脑执行?

一句话:别再硬背提示词了,会“边想边干”的AI已经悄悄把“纯聊天”模型卷成古董。

清华姚班姚顺雨讲ReAct:Siri为什么只会无脑执行?

现场视频里,机器人先抬头扫一圈,像在“嘀咕”:盐没了→冰箱有酱油→酱油咸度够→直接替代。

整套动作不到30秒,锅没糊,菜没咸,客人甚至没察觉。

同一天,Anthropic甩出Claude2.1,把天气API直接接进推理链,用户问“明天去富士山要不要带伞”,它先查降水概率,再翻登山论坛,最后给出“山脚晴、山顶60%小雪”的分段答案,把“搜索+总结”一次打包。

网友实测:原来要开三个网页比对的活,目前一句话解决,省下的不是时间,是脑细胞。

可热闹背后也有暗坑。

斯坦福2月份论文扒出,15%的“推理链”是AI自己编的,看起来像那么回事,实则调用的API返回404,它也能面不改色写小作文。

更尴尬的是延迟,每多想一步就多400ms,语音场景里“嗯——”太长,直接被用户当掉线。

开发者吐槽:AI一“犹豫”,人类就挂电话。

所以,不是装了ReAct就立马封神。

把它当万能胶水,不如当成“给AI装了个草稿本”:先写两步,划掉重来,再动手。

对打工人来说,最实在的变化是:后来写代码、做表格、订机票,一句话甩过去,AI自己拆步骤、调接口、回传结果,中间错了它会回头改,不再“一条道走到黑”。

省下的重复劳动,足够提前一小时下班,去撸串。

“别卷提示词了,卷‘会反思’的AI才是下一台印钞机。

清华姚班姚顺雨讲ReAct:Siri为什么只会无脑执行?

© 版权声明
THE END
如果内容对您有所帮助,就支持一下吧!
点赞0 分享
云算力的头像 - 鹿快
评论 抢沙发

请登录后发表评论

    暂无评论内容