傳統(tǒng)數(shù)據(jù)分析方法依賴人工拼接的流程,如編寫SQL、調(diào)用Python腳本及手動(dòng)解讀數(shù)據(jù),不僅耦合度高且擴(kuò)展性差,難以應(yīng)對(duì)動(dòng)態(tài)、多模態(tài)的復(fù)雜數(shù)據(jù)。而大語(yǔ)言模型與智能體的出現(xiàn),將數(shù)據(jù)分析從「規(guī)則執(zhí)行」推向「語(yǔ)義理解」,使機(jī)器能夠真正解讀數(shù)據(jù)內(nèi)在邏輯與關(guān)系,從而靈活完成查詢、建模與報(bào)告生成等多樣化任務(wù)。
近日,由上海交通大學(xué)、清華大學(xué)、微軟雷德蒙德研究院、上海 AI Lab 等機(jī)構(gòu)研究者聯(lián)合撰寫的最新綜述論文系統(tǒng)回顧了大語(yǔ)言模型在數(shù)據(jù)分析領(lǐng)域的整體演進(jìn):從傳統(tǒng)規(guī)則化流程到智能協(xié)作,從單模態(tài)到多模態(tài)融合,并提出構(gòu)建「通用數(shù)據(jù)分析智能體(General Data Analyst Agent)」的新范式。
