專注于推理 GPU 的曦望(Sunrise)昨日發(fā)布新一代推理 GPU 芯片啟望S3,并披露其圍繞推理場(chǎng)景構(gòu)建的算力產(chǎn)品體系及共建推理云生態(tài)計(jì)劃。這也是曦望在近一年累計(jì)完成約30億元戰(zhàn)略融資后的首次集中公開亮相。

曦望聯(lián)席CEO王勇在發(fā)布會(huì)上表示,AI行業(yè)正在進(jìn)入以應(yīng)用落地為核心的下半場(chǎng),推理逐步超越訓(xùn)練,成為主要算力消耗場(chǎng)景。相比訓(xùn)練階段的一次性高投入,推理更強(qiáng)調(diào)長(zhǎng)期交付能力、單位成本和系統(tǒng)穩(wěn)定性,這也正在改變GPU的競(jìng)爭(zhēng)邏輯。
據(jù)王勇透露,啟望S3芯片內(nèi)部研發(fā)基本已經(jīng)完成,將于今年年中流片年底回片量產(chǎn),啟望S3會(huì)是一款2026年上市的極具性價(jià)比,具有十倍以上性價(jià)比提升的推理型GPU。
“按照量產(chǎn)一代發(fā)布一代預(yù)研一代的節(jié)奏。未來(lái)兩年,我們還會(huì)推出高性能啟望S4推理GPU以及安全可控啟望S5-GPU芯片。”
以下是曦望聯(lián)席CEO王勇演講實(shí)錄:

王勇:我覺(jué)得曦望這家公司特別讓我感觸很深,因?yàn)槲覀冊(cè)谏虦杏藥啄曛螅置撎Q骨成為曦望。
今天我在這里給大家?guī)?lái)我們啟望S3以及相關(guān)產(chǎn)品,這將是開啟推理GPU里程碑式的產(chǎn)品。
大家都知道大模型已經(jīng)進(jìn)入了下半場(chǎng),就像剛才冰總講的,最初的時(shí)候,大模型從ChatGPT的llama開始。隨著去年DeepSeek,尤其是DeepSeek滿血版帶來(lái)特別驚艷表現(xiàn)的開源大模型以來(lái),那大模型在各類垂域場(chǎng)景應(yīng)用非常廣泛。過(guò)去一年推理的token增長(zhǎng)了100倍,也就是說(shuō),在云端,在邊緣側(cè),在端側(cè),推理的業(yè)務(wù)大大超過(guò)了訓(xùn)練。我們曦望認(rèn)為推理超越信任現(xiàn)在成為案例的核心驅(qū)動(dòng)力。
隨著最近AI agent以及飛利浦AI這一系列熱門應(yīng)用進(jìn)一步普及。我們曦望看到,推理token仍然會(huì)以幾十倍的速度去往前成長(zhǎng)。隨著這個(gè)成長(zhǎng),我們認(rèn)為曦望 All In推理這件事兒就變得特別正確。行業(yè)在過(guò)去一年,大多數(shù)的用于推理的芯片仍然是訓(xùn)推一體的,那么訓(xùn)推一體的芯片,它面臨的幾個(gè)大的困境。首先芯片的成本高昂,供應(yīng)不穩(wěn)定。第二,使用成本也高,能耗和算力比不經(jīng)濟(jì),最后它的適配和運(yùn)維投入非常大。
對(duì)于曦望來(lái)說(shuō),針對(duì)這些行業(yè)的痛點(diǎn),我們提出了自己前瞻性進(jìn)行了布局,戰(zhàn)略性地選擇了專注于研發(fā)推理GPU。過(guò)去幾年在集團(tuán)孵化的過(guò)程中,我們的產(chǎn)品都是從真實(shí)的場(chǎng)景需求出發(fā),依托對(duì)AI行業(yè)的深度洞察,在不斷地滿足極致的需求的過(guò)程中迭代出來(lái)的。
我們說(shuō)曦望是一家更懂AI也更懂芯片的公司。我們有一群平均超過(guò)15年行業(yè)經(jīng)驗(yàn)的芯片老兵,同時(shí)還有一群天才的大模型架構(gòu)師和研究員組成。我們能夠更加準(zhǔn)確地切中行業(yè)的痛點(diǎn),為行業(yè)提供曦望的解決方案。
我們擁有全棧資源的GPGU架構(gòu),覆蓋從自研的指令集到GPGUIP到SOC到硬件系統(tǒng)。經(jīng)過(guò)過(guò)去S1、S2從研發(fā)到產(chǎn)品的打磨,以及S3研發(fā)的打磨,顯示出我們的研發(fā)團(tuán)隊(duì)有極強(qiáng)的芯片研發(fā)能力和架構(gòu)迭代能力。因?yàn)楦瓵I,所以貼近用戶需求,我們更早提出了用大容量的DDR來(lái)替代HBM, 用高性價(jià)比的大模型推理芯片來(lái)替代訓(xùn)推一體芯片的概念。在戰(zhàn)略上率先all in推理GPU市場(chǎng)。
接下來(lái),我來(lái)介紹一下我們的產(chǎn)品路線圖。從2018年開始,我們就開始著力研發(fā)第一代S1推理芯片。在2020年量產(chǎn)取得了上萬(wàn)片的場(chǎng)景落地。
從2020年開始,我們著力打造了啟望S2高性能的GPGU架構(gòu)芯片。這款芯片我們對(duì)標(biāo)了當(dāng)時(shí)行業(yè)最頭部的GPU企業(yè)最有競(jìng)爭(zhēng)力的產(chǎn)品,自定義的指令集,自研的GPGPU架構(gòu)和相應(yīng)的IP,這款芯片在2021年流片,在2023年取得了非常好的產(chǎn)品化的路徑。最終在之江實(shí)驗(yàn)室的送測(cè)上也取得了非常好的國(guó)內(nèi)一線的性能指標(biāo)。尤其在去年,DeepSeek滿血版的適配,顯示這款芯片的技能居于國(guó)內(nèi)頭部的地位。
今天我們要發(fā)布的是依托我們all in推理的理念,做了一款極致性價(jià)比的GPU芯片——啟望S3。這款芯片目前內(nèi)部研發(fā)基本已經(jīng)完成,將于今年年中流片年底回片量產(chǎn),啟望S3會(huì)是一款2026年上市的極具性價(jià)比,具有十倍以上性價(jià)比提升的推理型GPU。
