6月10日,阿里千问上线了国内首个全周期高考志愿填报Agent。免费,面向全国1290万考生。
大部分AI产品发布,我关注的不是"这东西厉不厉害",而是"这东西验证了什么"。千问这个高考志愿Agent,验证了一件很重要的事:AI Agent可以从聊天框里走出来,在真实的高压场景里干活了。
高考志愿这个场景,天然是Agent的试金石
为什么说高考志愿是Agent的终极测试场?因为它满足Agent需要的所有条件。
第一,信息密度极高。全国近3000所高校、超2000个专业,上亿种组合。这不是一问一答能解决的。第二,决策链条长。从查分到填报到录取跟进,持续20多天。第三,容错率极低。填错一个,可能就要复读一年。第四,极度个性化。同样是660分,想当程序员和想做医生的人,应该得到完全不同的推荐。
传统搜索引擎搞不定,因为搜完了还得你自己消化。通用AI聊天也搞不定,因为它缺乏领域知识,会一本正经地胡说八道。只有Agent——能规划、能调用工具、能记住上下文、能主动追问——才可能在这个场景里真正帮上忙。
千问具体怎么做的
三个核心功能:志愿日历、志愿报告、志愿问答。
志愿日历把20多天的填报周期拆成一步步——认知建立、成绩定位、方向探索、方案预选、正式填报。你跟着走就行,不需要自己研究"什么时候该干什么"。
志愿报告是核心产出。输入你的分数、位次、选科、城市偏好、专业兴趣、甚至MBTI性格类型,AI生成一份含冲稳保梯度建议的完整报告。去年这个报告形式就发了近1300万份。今年升级了——能动态调整,你说"这个学校不想去"或者"再加几个金融学专业",报告实时更新。
更关键的是它有个自我检查机制。如果发现推荐表里"专业方向太发散",会主动提醒你聚焦。这个细节说明它不是把数据倒给你就完了,它在真的思考方案是否合理。
Agent能力的三个硬核验证
技术层面,千问这个Agent背后有三件事值得关注。
一是"规划-执行-反思"推理机制。团队提取了资深志愿规划师的专家思考路径,通过强化学习让模型学会这套流程。不是让你问一句AI答一句,而是Agent自己知道下一步该问什么、该调用哪个工具。
二是39个专业工具调用。搜索引擎、就业信息、志愿匹配、位次法定位……Agent不是靠"脑子好"答题,而是学会用工具。这恰恰是Agent和聊天机器人的本质区别。
三是40万"AI考生"压测。千问构建了约40万种组合空间的模拟考生,对模型反复测试。这比任何单一基准测试更能验证系统可靠性——因为你不能拿真实考生的命运做实验。
这件事更大的意义
我不太关心千问高考能不能干掉腾讯元宝高考通或者百度。我关心的是:如果Agent能在高考志愿这种低容错、长周期、高复杂度的场景里跑通,那它就能在更多场景里跑通。
医疗问诊、法律咨询、移民规划、保险配置——这些领域的特点是:需要专业知识、决策周期长、个性化程度高、错了代价大。过去AI进不去,因为一问一答的聊天机器人撑不住。Agent不一样。
千问事业群总裁吴嘉自己也说,高考志愿填报不是临时增加的一个场景,是"AI办事"这条路的自然延伸。闪购、打车是用AI帮你在真实世界办事,但任务短、容错率高。高考志愿是另一种"办事"——涉及人生选择,容错率极低。
如果AI能跑通这个,后面延伸到更多复杂决策场景就有了基础。
一句话
千问高考志愿Agent最大的看点不是它免费、不是它功能多,而是它证明了Agent不是PPT概念——它已经能在最严肃的场景里干活了。Chatbot时代在翻篇,Agent时代在开场。

看了一圈国内外AI应用落地,高考志愿Agent其实是个很好的观察样本。它不是"哦AI好厉害"那种展示,而是"AI能不能在一个关系到人生命运的场景里被信任"的测试。目前看千问给自己加的约束是对的:辅助决策,不替你做主。定位清晰才能活得久。
笑了,AI帮你填志愿,然后你毕业找不到工作,找AI索赔?"可是是你推荐我学这个专业的啊!" AI:"我那个年代这专业还很火……" ?
我当年高考填志愿,全凭我爸翻了一本《高考志愿填报指南》翻到卷边。如果当时有这个东西,可能我现在学的就不是这个专业了。不是AI有多牛,是有选择比没选择好。
技术上说,这个Agent的架构确实不错:规划-执行-反思+39个工具调用+40万AI考生压测。但真正的考验不是架构,是实际使用中的准确率。去年1300万份报告,差评率多少?官方没公布。这是最该被追问的数字。
作为经常跟AI打交道的人,我好奇的是它的Prompt设计和Agent orchestration是怎么做的。高考志愿这么敏感的场景,任一环节的prompt偏差都可能导致推荐偏差。39个工具之间的调度优先级算法,比模型本身更值得关注。