經(jīng)濟觀察網(wǎng) 記者 沈怡然 1月15日,科大訊飛(002230.SZ)推出了國內(nèi)首個基于全國產(chǎn)算力平臺訓(xùn)練的深度推理大模型X1。這既是科大訊飛在大模型能力上的突破,也是國產(chǎn)算力能力的突破。
AI的演進方向就是模擬人腦的認(rèn)知和思維過程,使機器能夠更自然、更高效地處理信息和解決問題。深度推理模型是實現(xiàn)這一目標(biāo)的重要工具之一。
在發(fā)布會上,科大訊飛一位工作人員讓X1解一道數(shù)學(xué)題,X1模型能夠?qū)?fù)雜問題拆解為多個步驟進行思考推理,并向用戶詳細展示思考過程。同時,X1模型如果在某一解題方法上遇到問題會重新規(guī)劃另一路徑。
深度推理能力也是ChatGPT演進的一個重要方向,GPT更新至3.5版本已經(jīng)展現(xiàn)出相關(guān)能力,至4.0版本首次將輸入模態(tài)從單一文本擴展到圖文雙模態(tài),顯著增強了解決復(fù)雜任務(wù)的能力。
不過,科大訊飛的X1模型并非業(yè)內(nèi)首個,此前智譜AI、商湯科技、月之暗面都將基礎(chǔ)大模型完成了類似的升級。X1模型的特殊之處在于,它是首個在全國產(chǎn)算力上開發(fā)的大模型。
所謂全國產(chǎn)算力,主要是指基于國產(chǎn)GPU搭建的數(shù)據(jù)中心所提供的算力。目前,英偉達(NVDA.US)占據(jù)全球GPU市場的90%份額,國內(nèi)大型數(shù)據(jù)中心所用的GPU幾乎依賴進口。
科大訊飛表示,國產(chǎn)算力確實在單卡性能和生態(tài)上都與國際領(lǐng)先水平有差距,與華為的合作也經(jīng)歷了一番磨合與挑戰(zhàn)。在開發(fā)訊飛星火X1模型的過程中,他們開辟了一條全新的技術(shù)路徑,包括在訓(xùn)練和推理過程中實現(xiàn)強交互和跨任務(wù)數(shù)據(jù)傳輸,促進了不同任務(wù)間的知識共享和高效協(xié)同,同時,他們克服了國產(chǎn)硬件在帶寬性能上的限制,確保數(shù)據(jù)傳輸?shù)母咝院蜏?zhǔn)確性。
這次合作為國產(chǎn)算力提供了實踐機會,有助于實現(xiàn)國產(chǎn)算力從硬件到軟件的自主可控。合作也提升了國產(chǎn)大模型在政企服務(wù)中的信譽,隨著國家政策的引導(dǎo),基于國產(chǎn)算力的大模型正成為政府采購的首選。