人民網
人民網>>國內

人工智能:努力成為值得信賴的“未來顧問”

2026年05月07日08:40 | 來源:光明日報
訂閱已訂閱已收藏收藏小字號

原標題:人工智能:努力成為值得信賴的“未來顧問”

  你能想象到的“預測技術”什麼樣兒?當通用大模型的基礎能力、專用預測模型的精准特性、外部工具的實用價值和可信機制的保障作用有機融合,人工智能那雙洞察未來的智能新慧眼,將在金融風控、氣象預報、公共治理、工業生產等關鍵領域,成為人類值得信賴的“未來顧問”,為人類社會把握未來走向提供智慧支撐,成為賦能社會發展、服務國家治理現代化的重要力量。

“預測未來”的四條技術路徑

面對現實世界中日益復雜的預測需求,科研人員圍繞大模型預測技術,走出了兩大核心主線、四種具體技術路徑。這些路徑並非相互取代的“競爭對手”,而是在不同場景下各展所長、互為補充,共同構筑起大模型預測的完整研究框架。

兩大核心主線的本質區別,在於是否為預測任務量身打造專屬模型:一條是“借船出海”,巧用現有成熟大語言模型完成預測﹔一條是“造船遠航”,重構面向預測的專用基礎模型,兩條路徑齊頭並進,適配著千差萬別的任務需求。

直接調用大語言模型,是大模型預測最易落地的“入門捷徑”。科研人員將各類預測任務轉化為通俗的自然語言問題,把歷史信息、事件背景和約束條件等悉數交由模型,讓其直接研判未來趨勢、輸出預測結果。這種方式實現門檻低,無需對模型做大幅改造,只是給現成的工具換個用法,便可在新聞事件分析、商業趨勢判斷等開放世界問題中表現亮眼。但美中不足的是,受限於大語言模型本身數值計算能力的短板、事實輸出易出現偏差的問題,它終究難以滿足氣象、金融等領域對高精度數值預測的嚴苛要求。

時間序列詞元化建模,則是跨領域的“智慧借鑒”。它將自然語言處理的經典思路巧妙引入時序數據分析,通過離散化、縮放、量化等技術手段,把連續的時間序列數據,轉化為類似語言中單詞的詞元表示,再用類語言模型的架構開展訓練。代表模型Chronos就通過將時間序列映射到固定詞表,實現了概率預測和跨數據集泛化,能直接復用成熟的語言模型架構,大幅降低研發成本。但這份便捷也伴隨著代價,數據轉化過程中難免造成數值細節的損失和量化誤差,如同給精細的零件做了一次粗略的打磨,會影響預測的精准度。

構建專用時間序列基礎模型,標志著大模型預測研究從“借勢而行”走向自主創新。科研人員不再將時間序列簡單視作偽文本,而是圍繞時序數據的本質規律和預測任務的核心需求,量身設計預訓練方案和模型架構。谷歌開發的TimesFM採用解碼器架構,展現出強大的零樣本預測能力﹔由美國多個大學和科研機構開發的Lag-Llama深耕細作,聚焦概率預測與跨領域泛化﹔美國人工智能企業開發的Moirai大膽嘗試,用統一訓練方式適配更多場景。這類模型如同為預測任務量身定制的“專屬鎧甲”,更貼合預測任務本身的特性,能實現更高精度的數值預測,成為高精度預測場景的不二之選。

大語言模型重編程與多模態融合,為大模型預測提供了低成本的思考。Time-LLM的相關研究証實,無需重新訓練動輒千億參數的超大時序模型,隻需通過重編程讓時間序列與文本原型精准對齊,就能讓“凍結”的大語言模型參與到預測任務中。這一方式為通用大模型+專用適配的技術路線,打通了可行的通道,更推動了文本、數值、上下文知識的深度聯合建模,讓預測能像人類思考一樣,綜合融合多源異構信息,更貼合現實世界中復雜多變的預測場景需求。

這四條技術路徑沒有絕對的優劣之分,它們如同不同的鑰匙,適配著不同的鎖芯。當預測任務需要結合通用知識、文本背景進行開放化趨勢判斷時,大語言模型相關路線如同萬能鑰匙,更具優勢﹔當任務追求高精度數值輸出、穩定的跨領域泛化能力時,專用時間序列基礎模型則成為精准匹配的定制鑰匙。它們在不同的研發資源條件、不同的實際任務需求下相互支撐、彼此成就,共同推動大模型預測技術穩步向前。

走向真實應用場景

在大模型預測技術的研究賽道上,國際研究起步更早,技術體系更趨系統,在基礎研究和前沿探索方面走得更深、更遠﹔國內研究雖起步稍晚,卻憑借著強勁的爆發力迎頭趕上,在場景適配、開源生態和應用落地方面形成了獨樹一幟的優勢。

國際學界的大模型預測研究,經歷了從文本推理到多元預測的精彩拓展。早期研究主要聚焦於把大語言模型用於文本推理和事件發展判斷,如同在一片小天地裡精耕細作﹔近兩年則逐步突破邊界,擴展到時間序列、時空數據乃至科學預測等更廣泛的領域,開啟了“開疆拓土”的新階段。在更復雜的科學預測領域,微軟研發的ClimaX率先搭建起天氣和氣候任務的基礎模型框架,同為微軟研發的Aurora更是將基礎模型思想延伸至地球系統,能同時處理天氣、空氣質量、海浪等多類預測任務,如同為地球裝上了智能預警系統,展現出科學基礎模型在復雜系統預測中的巨大潛力。

尤為可貴的是,國際學界始終對大模型的預測能力保持著理性審慎的態度。相關研究發現,大模型在標准化測試中的優異表現,並不等同於在真實世界未來事件判斷中的可靠性——GPT-4在開放世界預測競賽中,其概率預測表現就曾弱於中位數人類群體預測。圍繞這一核心問題,國際科研人員相繼開展競賽研究、檢索增強研究、不確定性檢測研究,讓國際研究形成了“模型能力提升+預測結果驗証+可信機制構建”三者並重的鮮明特點,為技術的落地應用筑牢了堅實的根基。

國內研究則依托通用大模型的快速發展,實現了漂亮的后發趕超,逐步形成了通用大模型快速迭代、綜述研究系統展開、應用落地穩步推進的良性發展格局。在通用模型生態建設的賽場上,各家選手各顯神通:千問3在多語種支持、推理效率優化上形成了完整體系,如同打造了一座多語言的智能橋梁﹔DeepSeek-V3實現了高性能開源模型的技術突破,讓核心技術不再高高在上﹔文心4.5則在多模態融合和工程化部署上持續精進,不斷貼近實際應用需求。這些通用大模型雖非以預測為唯一研發目標,卻為國內大模型預測研究搭建起堅實的能力底座,讓科研人員能站在“巨人”的肩膀上,開展更具針對性的研究。

在應用落地層面,國內正積極探索讓大模型預測技術走出“象牙塔”,走向千行百業的真實應用場景。有研究將專家知識與大語言模型深度融合,用於戰略征候預警,在復雜情境中精准實現趨勢判斷和風險識別﹔也有研究將大模型與氣象監測數據緊密結合,嘗試提升短期降水預測的精度和時效性。這類研究雖不完全等同於純數值的時間序列預測,卻標志著國內大模型預測技術正從理論討論走向場景落地,開始探索符合本土需求、貼合行業實際的技術路徑。

總體而言,國外在預測專用基礎模型研發、科學預測等基礎研究方面挖掘更深,如同在地下開鑿出了四通八達的隧道,形成了較為完善的技術體系﹔國內則在中文場景適配、低成本開源生態構建和行業應用落地方面更具特色,如同在地面上搭建起了貼合本土的高樓大廈。隨著國內高質量時序數據、行業專屬數據的不斷積累,以及專用評測體系的逐步完善,面向預測任務的國產基礎模型未來仍有巨大的提升空間,也必將為全球大模型預測技術的發展,貢獻獨特而珍貴的中國智慧。

“從強大到可信”仍須跨越“鴻溝”

相較傳統預測方法,大模型預測技術實現了從“單點計算”到“綜合研判”的深層次蛻變,讓原本冰冷機械的計算工具,進化為能理解背景、權衡因素、給出理性判斷的智能體。這份獨特能力源於其與生俱來的核心優勢,卻也如同成長中的新星,正朝著“從強大到可信”穩步進化,努力成為值得人類信賴的“未來顧問”。

大模型預測技術的核心優勢,是與生俱來的天賦異稟,在實際應用中尤為突出。其一,跨任務遷移能力強。傳統農業產量預測模型無法直接用於股市走勢分析,換領域便要推倒重來﹔而大模型憑借大規模預訓練的通用表示能力,能在少樣本下快速適配農業、金融、工業等不同領域,一通百通。其二,處理復雜依賴關系的潛力大。像汛期河流水位預測,受降雨、上游泄洪、地形等多重因素影響,傳統模型難以捕捉復雜關聯,而時間序列基礎模型能在上下文范圍內學習規律,如同擁有“火眼金睛”,看清數據背后的聯系。其三,多源信息融合能力優。傳統氣象預測僅依賴數值監測數據,而大模型能融合衛星雲圖、氣象文本播報、地理信息等多源內容,讓預測從“管中窺豹”變為“全景觀察”。其四,預測解釋與決策支持能力佳。它不僅能預測某隻股票的漲跌趨勢,還能闡釋背后的行業政策、市場供需等影響因素,甚至給出風控建議,成為決策者的專業智能伙伴。

盡管優勢顯著,大模型預測技術卻並非完美無缺,從實驗室到真實應用場景,仍有一道亟待跨越的“鴻溝”。首先,模型的生成、推理能力不等同於實際預測能力。有些模型在模擬的氣象預測測試中表現優異,卻在實際的強對流天氣預警中屢屢“失靈”,隻因測試答案藏在訓練數據中,而真實預測需要對未發生事件做綜合研判,紙上談兵易,“真刀真槍”難。其次,檢索增強治標不治本。為模型搭配信息檢索后,預測准確率雖有提升,卻也說明模型僅靠自身記憶的知識,如同守著舊書庫,難以跟上現實的變化,實時獲取最新知識才是關鍵。再者,幻覺與事實不穩定是核心障礙,如同隱藏的定時炸彈。此外,成本、數據與評價體系的制約,讓大規模應用舉步維艱。訓練高精度模型需要海量計算資源,研發成本居高不下﹔現實中時序數據碎片化、標注不統一,劣質原料怎麼造出精品?而現有評價體系重數值誤差、輕事實穩定性,讓不少模型看似優秀,卻難以落地。

展望未來,大模型預測技術的發展方向清晰明確,核心圍繞“從強大到可信”,打造能穩定服務現實決策的成熟技術體系。其一,通用大模型向預測專用基礎模型演進,在氣象、金融等高精度需求場景,專用模型展現更強競爭力。其二,工具增強成為重要方向,讓模型自主調用搜索、仿真等外部工具,如同為智能體裝上百寶箱,以更好應對復雜場景。其三,可信、可控、可解釋成為研究重點,未來的預測系統不僅要數值精准,更要能量化風險、追溯判斷依據,這是高風險場景落地的關鍵。其四,低成本部署和產業化落地加速,隨著推理成本下降、開源生態完善,技術將從少數機構的專屬資產,變為各行業的通用工具。其五,國內研究深耕本土化適配,結合中文語境、本土數據打造專屬模型,讓大模型在國內金融風控、政務預警等場景中更准、更穩、更可信。(呂本富 徐中濤)

(責編:木勝玉、朱紅霞)

分享讓更多人看到

返回頂部