人民網
人民網>>雲南頻道>>文旅

詞元調用量激增,算力還夠用嗎?(有事說事·詞元三問②)

2026年04月09日08:34 | 來源:人民網-人民日報海外版
訂閱已訂閱已收藏收藏小字號

原標題:詞元調用量激增,算力還夠用嗎?(有事說事·詞元三問②)

  AI時代,你提的每一個問題,“龍蝦”為你做的每一件事情,都是詞元在背后“跑腿”。

  AI工具每生成一個詞元,都需要調用數據中心的算力,並伴隨著電力消耗。

  越來越多人用上AI工具,首先迎來的是詞元調用量的激增,同步增長的,還有對算力的消耗。

  設想一下:如果你正在使用AI工具,但半天沒有收到AI的回復,你會作何感受?

  當我們看到新聞中不斷傳出消息,詞元調用量又增加了多少,相信不少人跟筆者有一樣的擔憂:照這個速度發展下去,我們的算力還夠用嗎?

  就像高速公路上的車流量——車多了,道路會擁堵。詞元調用量大了,算力也會面臨壓力。

  最近,雲廠商密集提價,紛紛調高AI算力租賃價格。背后的原因很明顯——需求激增,供給偏緊,價格跟著上漲。

  市場對GPU算力的需求持續強勁。市面上,有GPU芯片的租賃價格自2025年10月的每小時1.7美元上漲至今年3月的每小時2.35美元,漲幅近40%。

  算力的需求曲線突然陡峭起來,算力供給還沒來得及完全跟上。更聰明的AI智能體模型能執行更復雜的任務,但對算力的消耗量明顯增大,如果算力不夠,一個問題丟進去半天沒有響應,一切體驗都是空談。

  既然這樣,如何破解?

  其實,市場也已經在給出回應了。

  先說開源。

  以前,我們用的GPU芯片,許多依賴進口,也就是說,我們算力的“命門”掌握在別人手中。而現在,華為昇騰910B等國產AI芯片逐步量產,且產能不斷提升,算力硬件供給走向多元化,避免了對單一外資芯片的過度依賴。

  從這一點上看,因為硬件導致算力短缺的可能性正在慢慢降低。

  不僅是硬件在不斷突破,數據中心REITs等金融創新正在將算力資產証券化,吸引更多資本進入算力建設領域,也就是說,未來將有越來越多的算力設施能為大家服務。

  說完開源,再看節流。

  提升詞元的轉化效率,其實也是提高算力的使用效率,也是從另一個角度擴容算力“池子”。

  最近,就有人提出,要構建更高效、標准化的“詞元工廠”,提供持續穩定、規模化的詞元服務,讓頂尖模型能力高效賦能海量下游場景,盡可能提升每一個詞元的轉化效率,讓算力“花得值”。

  近期,也有不少企業加快了高性能算力的創新布局,其中以超節點為代表的架構創新,成為提升算力效率的重要路徑。

  如果再往遠一點看,未來,算力設施的智能化水平也會不斷提升,算法和算力系統之間的協同配合也會更默契,算力使用將更加高效。

  算力緊張的確存在,但在筆者看來,這是階段性的。就像剛開始普及3G的時候,大家感覺手機的流量總是不夠用,而現在,大家可以隨便刷視頻。相信隨著技術迭代、產能擴張和商業模式創新,算力的供需關系會逐步走向平衡。

  而當下,除了關注算力的規模本身,我們也要更多關注如何更高效、更公平地調度和使用算力。

(責編:木勝玉、朱紅霞)

分享讓更多人看到

返回頂部