智東西(公眾號:zhidxcom)
作者 | 陳駿達
編輯 | 漠影

2025年高考成績(ji)已(yi)陸續(xu)出爐,全(quan)國各(ge)地(di)的(de)考生都面臨一個同樣的(de)問題——填志愿。除(chu)了自行查閱相關(guan)信息,或是咨詢專家之外,還有數千萬考生和家長,選擇了向AI求助。

長期提供高考信息服務的夸克今年有一個新能力爆了。截至6月30日,夸克已累計生成超過1000萬份AI志愿報告,為考(kao)生和(he)家長提供考(kao)生情況分析、填報(bao)(bao)策略設計、志愿表解讀、風險提示等覆蓋全面(mian)的信息(xi),輔助志愿填報(bao)(bao)。

夸克AI志愿報告火了!上線近1月生成1000萬份,揭秘背后深度研究能力

該報告由夸克今年新推出(chu)的(de)“志愿報告”Agent打造,底層由夸克高考志愿大模型與高考知識庫提供支(zhi)持(chi),并采用了“任(ren)務規劃—執(zhi)行—檢(jian)查—反(fan)思”的(de)深(shen)度研究邏(luo)輯。

這(zhe)一Agent能根據(ju)用(yong)戶提(ti)供的基本信息,規劃思(si)考路徑,調用(yong)搜索工具(ju)進行信息收集,并在(zai)執行過程中動態優(you)化志愿方案,甚至會主動反思(si)擴展推(tui)薦(jian)范圍。

“志愿報告”Agent展現出接近人類專家的決策思維和動態策略調整能力,這是傳統工具難以實現的。作為夸克深度研究技術在垂類場景中的代表應用,“志愿報告”Agent在經歷超過1000萬份報告的驗證之后,成為(wei)國(guo)內最(zui)大(da)規模的深(shen)度研究(jiu)應(ying)用

夸克(ke)的(de)通用深(shen)度研究功能,實際已于(yu)5月(yue)在夸克(ke)首頁正式(shi)上線。通過拆解志愿報(bao)告的(de)打造過程,我們能夠(gou)窺得(de)夸克(ke)深(shen)度研究的(de)整(zheng)體技(ji)術思路與(yu)發展方向。

一、5分鐘生成完整報告,AI也能真正像專家一樣思考

“志(zhi)愿(yuan)報(bao)告”是(shi)今年夸克針對(dui)志(zhi)愿(yuan)填報(bao)推出的(de)核心(xin)功能之(zhi)一,也是(shi)國內唯一可以生(sheng)成完整志(zhi)愿(yuan)報(bao)告的(de)Agent。在考生(sheng)提交省份(fen)、成績(ji)、興趣偏好等信(xin)息后,“志(zhi)愿(yuan)報(bao)告”Agent能在5-10分鐘內交付一份(fen)詳實的(de)報(bao)告。

這份報告能根據(ju)考(kao)生(sheng)的信息,整(zheng)理(li)出清晰的填報策略,既(ji)能考(kao)慮到分段(duan)、選科組(zu)合等硬(ying)性指(zhi)標,也能理(li)解考(kao)生(sheng)的專(zhuan)業傾向、職業規劃、地域偏好等主觀(guan)因素。

夸克AI志愿報告火了!上線近1月生成1000萬份,揭秘背后深度研究能力

“志愿報告”Agent不僅會考(kao)慮錄取率,還會綜合考(kao)量地域布局、城市發展(zhan)機會、考(kao)生(sheng)職(zhi)業發展(zhan)路(lu)徑等(deng)因素(su),給出的(de)方(fang)案全面,且具有側重點,能對(dui)重點志愿進行詳盡的(de)分析(xi)。

在執行過程中,Agent通過多輪“工具調用+反思調整”的機制,動(dong)態(tai)優(you)化(hua)志愿方案。例如,當(dang)考(kao)(kao)生表達(da)“傾向(xiang)留在(zai)省內(nei)(廣州(zhou)、深(shen)圳優(you)先(xian))、不考(kao)(kao)慮(lv)偏遠(yuan)(yuan)地(di)區(qu)”時,模型會自動(dong)生成搜(sou)索指(zhi)令:優(you)先(xian)推(tui)薦廣州(zhou)、深(shen)圳的高校,其次考(kao)(kao)慮(lv)廣東(dong)省內(nei)其他城市(shi)院(yuan)校,排除偏遠(yuan)(yuan)地(di)區(qu)選項(xiang)。

若優質選項受限,Agent還能主動反思擴展搜索范圍,如增加廣東周(zhou)邊發達城市,或在高層次高校(xiao)(如985)上(shang)適度(du)放開(kai)地(di)域限制,為考(kao)生爭取沖一沖的機(ji)會。

針對一些較為復雜、甚至自(zi)相矛盾的需求,“志愿報告”Agent會幫助用(yong)戶進一步澄清需求。例如(ru),面對“數學成績差,但(dan)想(xiang)報考計算(suan)機”這(zhe)類(lei)常見沖突,系統會提示用(yong)戶這(zhe)一選擇(ze)可(ke)能存在的能力匹(pi)配問(wen)題。

在高(gao)考志愿填報這個高(gao)決策(ce)風險、強個性化、信(xin)息復雜且動態(tai)變(bian)化的特(te)殊場景中,AI系統需要實現(xian)真(zhen)正(zheng)可靠的決策(ce)支持。下面,我們就(jiu)將深入(ru)解析夸克“志愿報告”Agent背后技(ji)術棧的核(he)心架構(gou)與(yu)創新。

二、海量可信數據+人工挑刺,揭秘“志愿報告”Agent背后技術棧

在志愿填報這一垂直場景,準確的數據是Agent做出正確決策的重要前提。

夸克高考(kao)志愿大模型的知識(shi)庫對高考(kao)相(xiang)關權威站點(dian)實現近100%覆蓋,共收集了8000多個(ge)(ge)(ge)站點(dian)的幾十億個(ge)(ge)(ge)網頁(ye),涵(han)蓋全國2900多所高校、近1600個(ge)(ge)(ge)本(ben)科專業,系統(tong)整合了院校分(fen)數(shu)線、專業設置、課程體系等(deng)核心教(jiao)學(xue)信息(xi)。

這一知識(shi)庫不僅(jin)收(shou)集(ji)H5網(wang)頁數(shu)據(ju),還投入大量人(ren)力收(shou)集(ji)非H5網(wang)頁數(shu)據(ju)(如學(xue)校官(guan)網(wang)的(de)招生信(xin)息(xi)和機(ji)構(gou)資(zi)料),以及線(xian)下(xia)專業資(zi)料,確(que)保小眾或非知名站(zhan)點(dian)的(de)權威信(xin)息(xi)也能被收(shou)錄,從而保證了數(shu)據(ju)的(de)全面(mian)性和權威性。

夸(kua)克高考知識庫還投入海量資源(yuan)對(dui)每個省份的高考政(zheng)策及權威解讀進行梳理(li)、實時更新。通過(guo)OCR提(ti)取(qu)、多源(yuan)交(jiao)叉(cha)比對(dui)與(yu)(yu)人工(gong)抽檢等多重機制,實現高可信度的數據引(yin)入與(yu)(yu)結(jie)構化治理(li),確(que)保(bao)模型所依賴(lai)的數據具備權威性(xing)和可驗證性(xing)。

此外考慮到志愿填報與未來(lai)就(jiu)(jiu)業(ye)強相關(guan),夸克高(gao)(gao)考知識庫還進(jin)一步(bu)將(jiang)高(gao)(gao)校近三年的就(jiu)(jiu)業(ye)數據(ju)(ju)、考研數據(ju)(ju)、招錄體檢(jian)要求以及行(xing)業(ye)研究(jiu)分析報告(gao)等延(yan)展(zhan)信息(xi)納入。

夸克的高考志愿大模型則是“志愿報告”Agent的大腦。

這一(yi)模(mo)型以通(tong)義千問為基座,充(chong)分利用了夸(kua)克過去7年來在高(gao)考數據(ju)方(fang)面(mian)(mian)(mian)的(de)積累。夸(kua)克高(gao)考知識(shi)庫的(de)數據(ju)一(yi)方(fang)面(mian)(mian)(mian)會(hui)應用到夸(kua)克高(gao)考志(zhi)愿大模(mo)型訓(xun)練的(de)訓(xun)練過程中,作(zuo)為訓(xun)練語料,由模(mo)型打磨、精煉相關知識(shi);另一(yi)方(fang)面(mian)(mian)(mian)也可(ke)作(zuo)為模(mo)型推理時的(de)RAG內容供給。

這一模型還通過多階段的專項訓練,獲得了對復雜規則與用戶需求的理解與推理能力。在內部測評中(zhong),高考志愿大(da)模(mo)型(xing)的(de)幻覺率(lv)相比通用模(mo)型(xing)大(da)幅降低。

在指令微調階段,夸克高考志愿大模型將數百名資深高考志愿規劃師的溝通、決策過程進行結構化。圍繞他們與考生(sheng)或家長(chang)的多輪(lun)真(zhen)實(shi)對話,提取(qu)出(chu)完(wan)整分析(xi)路徑與語言風格。通(tong)過(guo)將上萬(wan)條(tiao)真(zhen)實(shi)專(zhuan)家“推(tui)理(li)鏈”轉(zhuan)化為高質量監(jian)督數據,夸克(ke)高考志(zhi)愿大(da)模型(xing)得(de)以深(shen)度學習人(ren)類專(zhuan)家的分析(xi)過(guo)程。

后(hou)訓練階段(duan),夸克高考志(zhi)愿大模型(xing)結(jie)合使(shi)用了(le)RLVR(可(ke)驗證獎勵強(qiang)化(hua)學習)和RLHF(人類反饋強(qiang)化(hua)學習)。RLVR通(tong)過明確的事實(shi)(如院校代碼、選科要求等)進行自動化(hua)檢驗,RLHF則通(tong)過人工反饋來進行評估。這(zhe)兩種機制靈(ling)活地混合協同工作(zuo),以(yi)優化(hua)模型(xing)最(zui)終輸出的效(xiao)果。

夸克AI志愿報告火了!上線近1月生成1000萬份,揭秘背后深度研究能力

在RLHF階段,人工專(zhuan)家的評判尤為關鍵(jian)。模型生(sheng)成的志愿填報方案將被提交給多位高考志愿專(zhuan)家進行(xing)評估。評估標(biao)準包括:專(zhuan)業建議(yi)是(shi)否準確易(yi)懂、排序邏輯是(shi)否貼合考生(sheng)特征、是(shi)否兼(jian)顧分數與興趣、是(shi)否充分提示風險(xian)并給出可行(xing)應對策略(lve)等。

通過“人類挑刺 + 模型修正”的方式,夸(kua)克高(gao)考志愿大模(mo)型(xing)的輸出在專業度(du)與匹(pi)配度(du)上持續逼近專家(jia)的真實判斷標準。在交付報告(gao)后,模(mo)型(xing)還(huan)能根據用戶的后續指令進(jin)行(xing)迭代(dai)調(diao)整。

最終,夸克(ke)“志(zhi)愿報(bao)告”Agent通(tong)過構建全面(mian)、權威的高考知識庫,結(jie)合多(duo)階段專(zhuan)(zhuan)項訓練(lian)與強(qiang)化(hua)學(xue)習機制,顯(xian)著提(ti)升了報(bao)告內容的精準(zhun)度和(he)個性化(hua)水平,為考生和(he)家長提(ti)供了專(zhuan)(zhuan)業、可靠的智能(neng)決策支持。

三、真實世界千萬用戶驗證,夸克深度研究潛力盡顯

在夸克算法負責人蔣冠軍看來,志愿報告是夸克對深度研究技術的一次重要實踐。他觀察到,在很多專業領域,用戶的需求是高度復雜的,已經無法通過常規搜索或簡單總結來滿足,從這次志愿報告的應用情況來看,深度研究已經讓AI真正成為用戶身邊的“專家型助手”。

夸克AI志愿報告火了!上線近1月生成1000萬份,揭秘背后深度研究能力

夸(kua)克(ke)的(de)“志(zhi)愿報(bao)告”Agent能夠在志(zhi)愿填報(bao)領域真正做到專家(jia)級的(de)表現,這與夸(kua)克(ke)整體的(de)“深度研究”技術(shu)特點是緊密相關的(de)。

其(qi)實(shi),業內已有不少提(ti)供“深度(du)研究”類(lei)功能的(de)AI產品,雖(sui)然這(zhe)些產品都能快(kuai)速生成報(bao)告(gao),但(dan)當細究具體內容時(shi),精準性(xing)、專業度(du)仍有待提(ti)高(gao),尤其(qi)是在志愿填報(bao)這(zhe)樣的(de)垂直領域(yu)。

由于行業、領域(yu)知(zhi)識的匱(kui)乏,“深度(du)研究”功能(neng)很(hen)可(ke)能(neng)會誤讀專業術語或遺漏關鍵細節。在知(zhi)識快速更(geng)新(xin)的前(qian)沿領域(yu),還可(ke)能(neng)因為(wei)使(shi)用過時(shi)數據導致分(fen)析偏(pian)差。

大部(bu)分(fen)(fen)深度(du)研究產(chan)品的(de)專業度(du)也無法(fa)匹敵行業專家(jia)。AI雖(sui)然(ran)能整合、統計大量數據,但在(zai)分(fen)(fen)析上仍存在(zai)明顯(xian)短板,也缺乏經驗與思辨能力。

今年5月,夸克(ke)的深度研(yan)究功能正式上線,對于通用深度研(yan)究需求,夸克(ke)已面向全量用戶(hu)開啟邀測(ce),用戶(hu)可在夸克(ke)首頁(ye)輸入端找到入口。

夸克AI志愿報告火了!上線近1月生成1000萬份,揭秘背后深度研究能力

夸克深度研究可以實現結構化大綱生成、問題澄清路徑、AI工具協同和多模態結果輸出。數據(ju)顯示,在首批受邀(yao)用戶(hu)中,研究報告的(de)下載和主動分(fen)享率(lv)超過40%,這也從(cong)側面反映出用戶(hu)的(de)滿意度。

而(er)今年高考季的(de)(de)(de)“志愿報告”Agent,則集中展(zhan)現了(le)上述(shu)深度研究能力在(zai)垂直場景(jing)的(de)(de)(de)可擴展(zhan)性。針(zhen)對深度研究的(de)(de)(de)潛在(zai)問題,夸克已經在(zai)“志愿報告”Agent的(de)(de)(de)打造(zao)過程中打磨出一套可行的(de)(de)(de)方法(fa)論。

結語:人人可用的夸克深度研究,用AI打破信息壁壘

夸克此次將深度研究能力(li)應用(yong)于志愿(yuan)填報場景,也具有深遠的社會意義。長(chang)期以來(lai),優質高考(kao)志愿(yuan)填報服務作為一種(zhong)付費產品(pin),其(qi)覆蓋范圍始終(zhong)局(ju)限于部分(fen)考(kao)生群(qun)體。而夸克的介入,正在(zai)改變這一局(ju)面。

在日(ri)前舉(ju)辦的溝通會上,蔣冠軍分享(xiang)了一組有(you)趣的數(shu)據(ju),截至目前,在夸(kua)克(ke)“志愿(yuan)(yuan)報(bao)告(gao)”Agent生成的1000萬(wan)份志愿(yuan)(yuan)報(bao)告(gao)中(zhong),有(you)超過5成是三線及以下城市用(yong)戶。這(zhe)也意味著(zhu),在傳統付費服務難以觸達或用(yong)戶無力承擔的地(di)區,夸(kua)克(ke)有(you)效滿足了這(zhe)一剛性需求,為推動(dong)教育信息(xi)公平提供了一種(zhong)可行的解決方案。

回望(wang)夸(kua)克過(guo)去數年來(lai)的發展(zhan)歷程,它一(yi)直在(zai)面向用戶獲取(qu)高質量信息服務的需求,不斷(duan)擴展(zhan)自(zi)己(ji)的能(neng)力(li)。隨著(zhu)“志愿(yuan)報(bao)告”Agent和(he)其(qi)背(bei)后的“深度(du)研(yan)究”能(neng)力(li)廣泛可(ke)及,夸(kua)克再(zai)一(yi)次豐富了其(qi)信息獲取(qu)、處理和(he)生(sheng)成方面的核(he)心能(neng)力(li),讓人(ren)人(ren)都能(neng)享受到(dao)“深度(du)研(yan)究”所帶來(lai)的技術紅利。