2025 年 11 月,姚順雨穿著休閑短褲、踩著拖鞋出現在騰訊的一場內部會上。這位 27 歲的 OpenAI 前研究員、提出過 ReAct 范式的技術天才剛被騰訊以重金招入麾下不久。
入職后,他的一項重要任務是幫騰訊找到混元大模型長期表現欠佳的原因,并將情況直接上報給集團總裁劉熾平;姚順雨細致地檢查每一個環節,不時和同事、實習生交流至半夜——這些是他的前任們很少會做的。很快他成為了騰訊大語言模型的一號位。
“混元的評測出了大問題。” 一位在場人士轉述姚順雨在會上發言,意思是模型過度追逐在榜單上的成績,將打榜的語料放入訓練集以致數據被污染,盡管模型很會答題,在真實場景里的表現卻不穩定。他希望團隊以后不要打榜,也不要盯著榜單做事。會上,混元的相關負責人也提到了模型過去在數據、預訓練、infra 上的問題。
過去兩年多,這家中國市值最高、掌握著最大流量入口的互聯網公司,在 AI 上的節奏相對謹慎——無論是投入力度,還是組織與產品推進速度,都落后于阿里巴巴與字節跳動。直到 2025 年,這種狀態開始改變:高薪招攬技術人才、大規模重組模型與 AI 產品團隊、持續向 “元寶” 傾斜資源。姚順雨的到來,成為這一系列變化中最明確的拐點。
“把以前的節奏和慣性徹底打亂,才是回到正軌的第一步。” 一位混元大模型人士說。
騰訊在重振旗鼓,阿里則想試圖定義 AI 敘事。
阿里提出了一個新概念:通云哥——通義實驗室、阿里云與平頭哥,即 AI、云計算和芯片三位一體發展。阿里認為自己是中國為數不多擁有全棧式 AI 能力——從芯片、大模型、云服務到產品的科技公司。這也是 Google 講的故事。
三大互聯網巨頭中,阿里的主業賺錢效率最低。據報道,今年前三季度字節跳動的凈利潤在 400 億美元左右;同期,騰訊與阿里的凈利潤為 300 億美與 100 億美元左右(自然年口徑)。但這沒有影響它投入的決心。
一位知情人士透露,阿里正考慮將未來三年投入到 AI 基建與云計算上的 3800 億元提升至 4800 億。在國內,阿里有自研的芯片真武 810E;在海外,它也在 “用一輛輛卡車來運采購的 GPU。” 一位知情人士說。最激進的時候,“連 RTX 4090 這類消費級顯卡也大量買入,用來搭建推理集群、補充推理吞吐。”
2025 年 12 月,千問 App、螞蟻旗下的靈光、阿福每天的拉新投放費用都在 1000 萬元以上;千問 App 的單日投放峰值一度達到 1500 萬元。
對字節跳動來說,“AI 是一件能影響整個世界的機會。” 一位接近字節跳動高層人士說。從 TopBuzz、TikTok 到 TikTok Shop,成立以后這家公司一直在尋找這樣的機會,“越接近世界中心的事情探索價值才越大。”
相比騰訊與阿里分別在模型與產品上有劣勢,字節跳動的能力更綜合。豆包在 2025 年底成為了國內第一個日活躍用戶數破億的 AI 產品;豆包大模型的日均 Token 處理量達到 63 萬億,半年增長超 200%。
2023 年,字節跳動創始人張一鳴曾說,當下這個時代的操作系統級機會就是 AI + 計算。
2026 年字節會全面加速 AI 業務的全球化,東南亞等地區是重點,美國暫時不會進入。據了解,字節的目標是在大模型上至少成為全球第三。截至 2025 年底,豆包的海外版本 Dola 全球日活躍用戶數突破 1000 萬。
中國的這一輪大模型熱潮始于 2023 年。在明星創業公司最受關注的早期階段,互聯網巨頭們并不算顯眼。三家選擇了不同的路徑:騰訊更重視 AI 的應用落地,因此相對低調地等待模型能力成熟;阿里將大模型推向開源,押注于做大生態,從而為云業務打開增量空間;字節跳動起步較晚,只能通過飽和式投入,盡快補齊技術短板。
直到 2025 年初, DeepSeek 為整個行業重新畫了一條起跑線,巨頭活躍了起來,戰場有了硝煙的味道。
2026 年春節成為了這場戰爭的引爆點。