你的AI助理只会「你拨一下转一下」?上交大ProAct让Agent学会预判

栗子同学Agent 2026-05-29 16:26:12 4阅读 举报

「帮我把明天上午10点的项目评审会安排一下。」你刚对AI助理下达了指令。

「会议已安排。」然后呢?然后它就原地「下班」了。

这是不是像极了你的AI助理?拨一下转一下,不问就不动。但一个真正靠谱的人类助理,在你提了一嘴「明天开评审会」的时候,早就在脑海里过了一遍——你肯定需要进度摘要,大概率还要看风险点,甚至连PPT大纲都已经在后台帮你搭好了。

上交大的解法:让空闲时间变成生产力

上海交通大学APEX实验室提出了ProAct,一种将对话间的空闲时间转化为主动准备机会的新架构。

它的核心主张是:空闲时间不是空白,而是被浪费的算力窗口。把一部分工作提前搬到空闲窗口,让AI在你沉默的时间里主动学习和准备。

具体怎么做?三步流水线:预测→筛选→交付。

预测:比你自己更懂你接下来要干嘛

预测模块从两个源头生成候选需求:

本地场景推断——从最近几轮对话中直接推断可能的后续需求。比如你刚说完「安排明天的评审会」,系统已经推断出「需要项目进展材料」和「可能要看风险点」两个高置信候选。

关联扩展——从持久记忆中的用户画像、历史摘要、未完成目标中扩展相关方向。

每一个候选需求,都要经过四维价值打分:用户相关性、知识缺口、增量价值、时效性。只有总分超过阈值才真正获得算力执行。

交付:推还是不推,这是个问题

准备好材料后,ProAct绝不会无脑弹窗。交付策略分三档:

Push(主动推送)——价值极高、时机刚好,直接通知。

Queue(排队等待)——有用但不紧急,等用户下次提问时自然融入回复。

Store(静默存储)——大概率有用但现在不宜打扰,存入长期记忆,等用户需要时瞬间调出。

这个设计很关键——它解决了「智能骚扰」的问题。AI不会再一有空就疯狂弹窗,而是真正在你需要的时候出现。

评测基准:200个场景的硬核测试

论文构建了全新评测基准ProActEval:200个场景,覆盖40个领域(金融规划、软件发布、网络安全、搬家、税务申报……)。

每个场景包含5到15条用户需求,标注了重要性等级、依赖链和可预测性关系。Agent运行时看不到「答案」,只能走一步看一步。

结果很有意思:在需要预测未来需求的场景中,ProAct相比传统Reactive Agent的准确率提升了40%以上。

你的AI助理,现在只会「你拨一下转一下」吗?给它装上ProAct,它可能比你更懂你接下来要干什么。

版权声明:
作者:栗子同学
链接:https://www.aiddithome.com/p/42c1155a67b86.html
来源:Agent
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
5条评论
Buffett
1楼 · 6小时前

40%准确率提升听起来不多,但放到实际场景里已经是质的飞跃了。

诸葛量
2楼 · 6小时前

上交大这个实验室靠谱。之前看过他们做的Agent相关研究,都是实打实的落地工作。

硅谷子
3楼 · 6小时前

这才是真正的智能助理。不是你说一步做一步,而是比你自己更早想到。

熵熵
4楼 · 6小时前

推还是不推这个问题太关键了,再好的功能弹窗多了也是骚扰。

码斯克
5楼 · 6小时前

四维价值打分:用户相关性、知识缺口、增量价值、时效性。这套框架很清晰。