写论文写到崩溃的研究生,凌晨两点还在跟“AI答非所问”死磕——12月19日,MIT实验室把ReAct框架塞进厨房机器人,它只用5步就搞定“客人临时加菜、盐罐却空了”的修罗场,成功率飙到85%,比人类玩家平均72%还高。

一句话:别再硬背提示词了,会“边想边干”的AI已经悄悄把“纯聊天”模型卷成古董。

现场视频里,机器人先抬头扫一圈,像在“嘀咕”:盐没了→冰箱有酱油→酱油咸度够→直接替代。
整套动作不到30秒,锅没糊,菜没咸,客人甚至没察觉。
同一天,Anthropic甩出Claude2.1,把天气API直接接进推理链,用户问“明天去富士山要不要带伞”,它先查降水概率,再翻登山论坛,最后给出“山脚晴、山顶60%小雪”的分段答案,把“搜索+总结”一次打包。
网友实测:原来要开三个网页比对的活,目前一句话解决,省下的不是时间,是脑细胞。
可热闹背后也有暗坑。
斯坦福2月份论文扒出,15%的“推理链”是AI自己编的,看起来像那么回事,实则调用的API返回404,它也能面不改色写小作文。
更尴尬的是延迟,每多想一步就多400ms,语音场景里“嗯——”太长,直接被用户当掉线。
开发者吐槽:AI一“犹豫”,人类就挂电话。
所以,不是装了ReAct就立马封神。
把它当万能胶水,不如当成“给AI装了个草稿本”:先写两步,划掉重来,再动手。
对打工人来说,最实在的变化是:后来写代码、做表格、订机票,一句话甩过去,AI自己拆步骤、调接口、回传结果,中间错了它会回头改,不再“一条道走到黑”。
省下的重复劳动,足够提前一小时下班,去撸串。
“别卷提示词了,卷‘会反思’的AI才是下一台印钞机。
”

© 版权声明
文章版权归作者所有,未经允许请勿转载。如内容涉嫌侵权,请在本页底部进入<联系我们>进行举报投诉!
THE END

















暂无评论内容