緣起:從代碼初心到算力革命
在硅谷工程師為云端 AI 算力賬單焦頭爛額時(shí),上海的一位設(shè)計(jì)師已通過(guò)端腦云,用附近網(wǎng)吧的閑置顯卡完成了幾百?gòu)埜咔瀹?huà)面的實(shí)時(shí)渲染。這個(gè)連接全球分散 PC 的算力網(wǎng)絡(luò),正以 “螞蟻雄兵” 的方式,向中心化算力發(fā)起挑戰(zhàn)。
從技術(shù)理念到商業(yè)模式,這家深圳公司都散發(fā)著學(xué)術(shù)底蘊(yùn)與產(chǎn)業(yè)洞察相結(jié)合的獨(dú)特氣質(zhì)。端腦科技核心創(chuàng)始人兼 CEO 丁燁博士畢業(yè)于香港科技大學(xué),是深圳市海外高層次人才,并擔(dān)任國(guó)家自然科學(xué)基金項(xiàng)目評(píng)審專(zhuān)家。
2023 年 5 月公司于南山區(qū)成立第一天,他就在內(nèi)部立下目標(biāo),端腦科技將用學(xué)術(shù)的深度和產(chǎn)業(yè)的廣度,讓算力像電力一樣,隨處可得,人人可用。
這樣的愿景在算力被寡頭壟斷的今天,聽(tīng)起來(lái)像是不切實(shí)際的理想主義。不止一位投資人表達(dá)過(guò)類(lèi)似的看法:一個(gè)算力創(chuàng)業(yè)公司在 2024 年,如果不依附于某個(gè)云巨頭,反而想用分布式模式去顛覆它,那簡(jiǎn)直是天方夜譚。
但在全球算力焦慮蔓延的當(dāng)下,這種 “以下克上” 的創(chuàng)造力更顯珍貴,與 Think·志同道合的理念不謀而合。ThinkPad 始終是同行者的忠實(shí)伙伴,真正的創(chuàng)造力從不屈服于配置的桎梏,而在思考的深度。
2024 年 8 月,端腦 AI 更新!全面支持 FLUX 模型。
破局:用分布式架構(gòu)挑戰(zhàn)算力壟斷
2022 年,當(dāng) ChatGPT 橫空出世,引爆全球 AI 軍備競(jìng)賽時(shí),《經(jīng)濟(jì)學(xué)人》曾憂(yōu)心忡忡地評(píng)論道,AI 的未來(lái),正被禁錮在少數(shù)幾家公司的數(shù)據(jù)中心里。贊譽(yù)背后的現(xiàn)實(shí)是,以云計(jì)算普及為標(biāo)志的數(shù)字化浪潮十幾年后,全球算力總量雖飛速增長(zhǎng),但其分配方式卻日益集中——頂尖大模型的訓(xùn)練成本突破千萬(wàn)美元,且以每年翻倍的速度持續(xù)增長(zhǎng),無(wú)數(shù)中小開(kāi)發(fā)者和研究機(jī)構(gòu)被無(wú)情地?fù)踉陂T(mén)外。
端腦科技提出的 “共享算力” 構(gòu)想,正是對(duì)這一現(xiàn)狀的回應(yīng)。但要將理想變?yōu)楝F(xiàn)實(shí),需要可靠的技術(shù)支撐。
“創(chuàng)業(yè)初期,端腦科技經(jīng)歷過(guò)一次產(chǎn)品上線(xiàn)前的致命 Bug 危機(jī)。” 丁燁回憶道,“那是 2023 年底的一個(gè)深夜,端腦科技的調(diào)度系統(tǒng)出現(xiàn)了一個(gè)難以復(fù)現(xiàn)的偶發(fā)故障。正是 ThinkPad P 系列的強(qiáng)悍性能,支撐我連續(xù)工作 36 小時(shí),最終在最后一刻定位并修復(fù)了問(wèn)題,幫團(tuán)隊(duì)闖過(guò)生死關(guān)。”
這份在關(guān)鍵時(shí)刻展現(xiàn)的可靠性,讓 ThinkPad 從 “辦公伙伴” 升級(jí)為端腦云分布式網(wǎng)絡(luò)中的核心節(jié)點(diǎn)。在端腦科技的辦公室里,幾十臺(tái) ThinkPad P 系列移動(dòng)工作站在特制機(jī)架上 7x24 小時(shí)不間斷運(yùn)行,成為這支 “算力民兵” 的技術(shù)基石。
很長(zhǎng)一段時(shí)間中,分布式計(jì)算領(lǐng)域由 Folding@home 等公益項(xiàng)目主導(dǎo)。這些項(xiàng)目依靠全球志愿者的愛(ài)心貢獻(xiàn),缺乏穩(wěn)定、可持續(xù)的商業(yè)模型。但丁燁清楚傳統(tǒng)模式的局限,純粹依賴(lài)奉獻(xiàn)精神的模式,無(wú)法支撐起一個(gè)穩(wěn)定可靠的商業(yè)算力網(wǎng)絡(luò)。端腦科技必須用經(jīng)濟(jì)模型和技術(shù)創(chuàng)新,讓分享算力變得有利可圖且簡(jiǎn)單可靠。
2023 年 10 月,端腦云 Cephalon.cloud V1.2 版本上線(xiàn)。
技術(shù)基石:ThinkPad 與英特爾的硬核支撐
丁燁特別強(qiáng)調(diào) ThinkPad P 系列的技術(shù)優(yōu)勢(shì):“在分布式算力網(wǎng)絡(luò)中,每個(gè)節(jié)點(diǎn)都需要具備企業(yè)級(jí)的可靠性和穩(wěn)定性。ThinkPad P 系列不僅提供了強(qiáng)大的本地算力,其軍工級(jí)的穩(wěn)定性和 ECC 內(nèi)存糾錯(cuò)能力,更是確保了節(jié)點(diǎn)在長(zhǎng)時(shí)間高負(fù)載運(yùn)行下的可靠性。”
丁燁進(jìn)一步解釋?zhuān)四X科技的測(cè)試數(shù)據(jù)顯示,ThinkPad P 系列在連續(xù)運(yùn)行 30 天后,其性能衰減率不超過(guò) 3%。這種穩(wěn)定性對(duì)于構(gòu)建可靠的算力網(wǎng)絡(luò)至關(guān)重要。
在硬件架構(gòu)層面,ThinkPad P 系列搭載的英特爾®酷睿™ Ultra 處理器的混合架構(gòu)設(shè)計(jì),恰恰契合了分布式算力的核心理念。其 NPU、GPU 和 CPU 的協(xié)同計(jì)算能力,讓單個(gè)節(jié)點(diǎn)能夠在不同場(chǎng)景下發(fā)揮最大效能。在實(shí)際測(cè)試中,這種異構(gòu)計(jì)算架構(gòu)讓我們的節(jié)點(diǎn)效率提升了 40% 以上。
這種架構(gòu)層面的創(chuàng)新,為構(gòu)建彈性算力網(wǎng)絡(luò)提供了堅(jiān)實(shí)的硬件基礎(chǔ)。2023 年 10 月,端腦云 Cephalon.cloud V1.2 版本上線(xiàn),標(biāo)志著這一技術(shù)架構(gòu)的初步成熟。
實(shí)踐驗(yàn)證:從理想走向現(xiàn)實(shí)
2024 年中,端腦云發(fā)布了新一代調(diào)度引擎。測(cè)試數(shù)據(jù)顯示,相對(duì) Kubernetes+Ray 的速度提升了 75%,大幅降低 50% 的算力成本。這一技術(shù)突破,讓端腦云在 2024 年下半年獲得了第一批企業(yè)客戶(hù),收入從零突破百萬(wàn)元。
實(shí)際應(yīng)用案例更是令人振奮。設(shè)計(jì)工作室客戶(hù)面臨 “48 小時(shí)渲染數(shù)百?gòu)埜呔葓D紙” 的緊急需求,本地設(shè)備頻繁崩潰,項(xiàng)目瀕臨中斷。最終,端腦云調(diào)度 ThinkPad P 系列算力集群,僅用 36 小時(shí)就完成交付,成本僅為傳統(tǒng)云服務(wù)的三分之一。