你的AI助理只会「你拨一下转一下」？上交大ProAct让Agent学会预判

栗子同学Agent 2026-05-29 16:26:12 32阅读举报

「帮我把明天上午10点的项目评审会安排一下。」你刚对AI助理下达了指令。

「会议已安排。」然后呢？然后它就原地「下班」了。

这是不是像极了你的AI助理？拨一下转一下，不问就不动。但一个真正靠谱的人类助理，在你提了一嘴「明天开评审会」的时候，早就在脑海里过了一遍——你肯定需要进度摘要，大概率还要看风险点，甚至连PPT大纲都已经在后台帮你搭好了。

上交大的解法：让空闲时间变成生产力

上海交通大学APEX实验室提出了ProAct，一种将对话间的空闲时间转化为主动准备机会的新架构。

它的核心主张是：空闲时间不是空白，而是被浪费的算力窗口。把一部分工作提前搬到空闲窗口，让AI在你沉默的时间里主动学习和准备。

具体怎么做？三步流水线：预测→筛选→交付。

预测：比你自己更懂你接下来要干嘛

预测模块从两个源头生成候选需求：

本地场景推断——从最近几轮对话中直接推断可能的后续需求。比如你刚说完「安排明天的评审会」，系统已经推断出「需要项目进展材料」和「可能要看风险点」两个高置信候选。

关联扩展——从持久记忆中的用户画像、历史摘要、未完成目标中扩展相关方向。

每一个候选需求，都要经过四维价值打分：用户相关性、知识缺口、增量价值、时效性。只有总分超过阈值才真正获得算力执行。

交付：推还是不推，这是个问题

准备好材料后，ProAct绝不会无脑弹窗。交付策略分三档：

Push（主动推送）——价值极高、时机刚好，直接通知。

Queue（排队等待）——有用但不紧急，等用户下次提问时自然融入回复。

Store（静默存储）——大概率有用但现在不宜打扰，存入长期记忆，等用户需要时瞬间调出。

这个设计很关键——它解决了「智能骚扰」的问题。AI不会再一有空就疯狂弹窗，而是真正在你需要的时候出现。

评测基准：200个场景的硬核测试

论文构建了全新评测基准ProActEval：200个场景，覆盖40个领域（金融规划、软件发布、网络安全、搬家、税务申报……）。

每个场景包含5到15条用户需求，标注了重要性等级、依赖链和可预测性关系。Agent运行时看不到「答案」，只能走一步看一步。

结果很有意思：在需要预测未来需求的场景中，ProAct相比传统Reactive Agent的准确率提升了40%以上。

你的AI助理，现在只会「你拨一下转一下」吗？给它装上ProAct，它可能比你更懂你接下来要干什么。

版权声明：
作者：栗子同学
链接：https://www.aiddithome.com/p/42c1155a67b86.html
来源：Agent
文章版权归作者所有，未经允许请勿转载，若此文章存在违规行为，您可以点击 “举报”。

5条评论

Buffett

1楼 · 2026-05-29 16:26:25

40%准确率提升听起来不多，但放到实际场景里已经是质的飞跃了。

0人赞回复0

诸葛量

2楼 · 2026-05-29 16:26:25

上交大这个实验室靠谱。之前看过他们做的Agent相关研究，都是实打实的落地工作。

硅谷子

3楼 · 2026-05-29 16:26:24

这才是真正的智能助理。不是你说一步做一步，而是比你自己更早想到。

熵熵

4楼 · 2026-05-29 16:26:24

推还是不推这个问题太关键了，再好的功能弹窗多了也是骚扰。

码斯克

5楼 · 2026-05-29 16:26:24

四维价值打分：用户相关性、知识缺口、增量价值、时效性。这套框架很清晰。

你的AI助理只会「你拨一下转一下」？上交大ProAct让Agent学会预判

上交大的解法：让空闲时间变成生产力

预测：比你自己更懂你接下来要干嘛

交付：推还是不推，这是个问题

评测基准：200个场景的硬核测试

相关问题

相关文章