中经记者 李立 杭州报道
在互联网大厂激烈争夺的“AI高考”赛道, 阿里巴巴AI旗舰应用夸克日前公布了最新战绩。
“截至6月30日14:30,高考出分第8天,夸克累计为考生和家长生成超1000万份专业级志愿报告。”“1000万份专业报告由今年推出的志愿报告Agent生成,采用了具备‘任务规划—执行—检查—反思’能力的深度研究技术。”夸克方面表示。
在业内人士看来,今年全国高考报名人数1335万人,仅次于历史峰值。以目前夸克生成1000万份专业级志愿报告数据看,实现了截至目前深度研究的较大规模场景落地。
深度研究(Deep Research)如何应用在高考这样特殊的垂直赛道,如何进行精准数据搜集、清洗,降低幻觉率,在C端实现快速爆发,针对外界关注的诸多问题,在硝烟还未散去的“夸克高考作战室”,夸克算法负责人蒋冠军、夸克高考志愿大模型算法负责人唐亮,日前接受包括《中国经营报》在内的媒体记者采访,讲述了Deep Research应用背后的产品逻辑与技术细节。
作为阿里巴巴AI旗舰应用,这也是夸克技术团队一次罕见的低调曝光,夸克的野心远不止AI高考赛道。
数据壁垒与深度对齐
今年互联网大厂在“AI高考”赛道上的争夺尤为激烈。
此前,记者注意到,腾讯、百度、夸克、知乎等纷纷推出了相关产品。以夸克为例,2019年开始做高考产品,至今过去七年。今年进一步推出“高考深度搜索”“志愿报告”“智能选志愿”三个核心功能。作为“深度研究”技术在垂类场景中的代表应用,志愿报告Agent备受关注。
“高考对中国家庭非常重要,与原来其他通用学科围绕大模型做问答产品有非常差异化的需求。”蒋冠军接受记者采访时表示,这就要求高考提供的内容必须专业,必须准确,不能有错误信息。
如何让Agent在5—10分钟内,像专家一样,给出准确和让考生可信、可用的志愿报告?准确的数据来源和深度对齐模型训练尤为重要。
“在此前的基础上更重点强调高考专业知识库的完善。”唐亮透露,“今年夸克总共搜集了8000多个站点,高考相关权威站点99%以上,大概覆盖20多亿条数据。”
海量数据搜集背后,分类与整理更为关键。“我们根据不同数据来源进行分级,首先是考试院、教育部、省招办;其次是高校官网,每个高校数据;再次是像阳光高考、中国教育在线等企业提供的比较专业的数据。”据唐亮介绍,生成答案时,让模型优先采信最高权威度的信息来源。内部测试显示,近95%的用户问题都有权威内容覆盖。
同时推动大量线下非标文档的线上化,高校近三年的就业质量报告、本科教学质量报告,以及政府就业报告等,夸克投入了大量人力,将线下非标文档进行了线上化处理。
“除了事实性数据,志愿报告里的志愿信息其实是人工整理。”蒋冠军透露,“这部分信息绝对不能出错,比如学校每年会调整专业,通过人工去各个省教育主管部门、各个大学官网进行数据搜集再校验。”
“针对高考垂直模型,夸克做了持续训练和后链路整体对齐。”蒋冠军表示。在执行过程中,Agent通过多轮“工具调用+反思调整”的机制,动态优化志愿方案。
例如,当考生表达“倾向留在省内(广州、深圳优先)、不考虑偏远地区”时,模型会自动生成搜索指令:优先推荐广州、深圳的高校,其次考虑广东省内其他城市院校,排除偏远地区选项;若优质选项受限,Agent还能主动反思扩展搜索范围,如增加广东周边发达城市,或在高层次高校(如985)上适度放开地域限制,为考生争取冲一冲的机会。
此外,Agent具备处理复杂甚至自相矛盾诉求的能力。面对“数学成绩差,但想报考计算机”这类常见冲突,系统会触发“需求澄清”流程,提示用户这一选择可能存在的能力匹配问题。这种专家式的思考路径和策略调整,是传统工具难以实现的,也是夸克“深度研究”技术真正实现智能化决策的关键所在。
据了解,在模型训练阶段,夸克算法团队邀请了上百名资深高考志愿规划师参与,将人类专家的思考过程转化为数万条高质量推理数据。模型产出的志愿方案再经过专家多维评估,逐项打分形成反馈闭环。通过持续迭代,模型逐步获得了“像志愿专家一样思考”的能力。
“根据内部评测,高考垂直模型的幻觉率比通用模型降低了60%—70%。”蒋冠军透露。
“规模”背后的野心
为什么夸克举公司之力,深耕高考赛道长达七年?
此前有夸克内部人士向记者透露,高考项目对于夸克来说就像淘天的“双十一”。公司从三个月前就开始准备,程序员集中在“夸克高考作战室”封闭作战。
蒋冠军回应记者称:“高考产品体量足够大,也与夸客最初想做个人助手的初衷非常契合。”在其看来,第一年投入就很坚决,当时市场没多少人做,只要把市场上比较好的数据和内容做合理整合,就能给用户提供更好的产品。“持续做下来,夸克高考在市场上形成了不错的口碑,同时有助于夸克整体业务发展。”
此前夸克高考产品经理郏海峰曾透露:“监测数据显示,30%的高考老用户会再次使用夸克。”夸克公开数据显示,2024年服务了超过3000万考生和家长等用户,累计服务超过1.2亿人次。其中,50%的用户是三线城市以下考生。
上述夸克内部人士透露,夸克最早开发高考相关产品,因为每年此时都是用户使用峰值,出于用户需求开发了相关产品,随后持续升级成AI搜索。从目前看,提早布局高考市场,为夸克持续保持年轻用户增长打开了入口,三线城市以下城市占比50%,亦成为进军下沉市场的切入点。
夸克第一次出现在阿里巴巴财报中是2023年。据财报披露数据,2023年9月,夸克DAU(日活跃用户)同比增超35%。
蒋冠军此前披露,夸克平台25岁以下用户人群占比超过50%。另据易观千帆《2025年AI产业发展十大趋势》披露的数据,夸克24岁以下的年轻人占比逼近50%。
值得注意的是,年轻用户与下沉市场的占比,让夸克在阿里巴巴持续布局AI的核心战略中,位置越来越微妙。
2023年12月,散发技术气息的夸克,以“阿里四小龙”之一出道。2025年3月,夸克升级“AI超级框”,阿里巴巴对夸克的新定义是AI旗舰应用。夸克更是将品牌Slogan定义为“2亿人的AI全能助手”。夸克的定位由此变成集AI搜索、AI教育、AI写作、AI总结、AI搜题、AI网盘以及AI扫描等功能的“AI全能智能助手”。
阿里巴巴观察人士认为,字节跳动、百度等大厂都在加速布局To C的AI应用,手握年轻用户且在持续增长的夸克,有望在AI时代为阿里巴巴赢得船票。
“夸克团队从做搜索引擎开始,2018年AI技术刚开始发展,就想把夸克做成一个类似个人助手的产品。”回忆夸克迭代之路时蒋冠军表示,“大模型出现时我们非常兴奋,与此前我们想把夸克做成个人助手的初衷完美契合。可以说,夸克是非常受益大模型发展的产品或助手工具。”
“团队是做搜索引擎和工具出身,比较低调,这种特质反馈到产品上就是严谨与克制。”据蒋冠军透露,除了高考之外,在医疗、教育等对准确度要求较高的垂直赛道上,夸克也在持续深入探索中。
(编辑:吴清 审核:李正豪 校对:张国刚)