科大訊飛發(fā)布首個基于純國產(chǎn)算力的深度推理大模型

沈怡然2025-01-15 22:13

經(jīng)濟觀察網(wǎng) 記者沈怡然 1月15日，科大訊飛（002230.SZ）推出了國內(nèi)首個基于全國產(chǎn)算力平臺訓(xùn)練的深度推理大模型X1。這既是科大訊飛在大模型能力上的突破，也是國產(chǎn)算力能力的突破。

AI的演進方向就是模擬人腦的認(rèn)知和思維過程，使機器能夠更自然、更高效地處理信息和解決問題。深度推理模型是實現(xiàn)這一目標(biāo)的重要工具之一。

在發(fā)布會上，科大訊飛一位工作人員讓X1解一道數(shù)學(xué)題，X1模型能夠?qū)?fù)雜問題拆解為多個步驟進行思考推理，并向用戶詳細展示思考過程。同時，X1模型如果在某一解題方法上遇到問題會重新規(guī)劃另一路徑。

深度推理能力也是ChatGPT演進的一個重要方向，GPT更新至3.5版本已經(jīng)展現(xiàn)出相關(guān)能力，至4.0版本首次將輸入模態(tài)從單一文本擴展到圖文雙模態(tài)，顯著增強了解決復(fù)雜任務(wù)的能力。

不過，科大訊飛的X1模型并非業(yè)內(nèi)首個，此前智譜AI、商湯科技、月之暗面都將基礎(chǔ)大模型完成了類似的升級。X1模型的特殊之處在于，它是首個在全國產(chǎn)算力上開發(fā)的大模型。

所謂全國產(chǎn)算力，主要是指基于國產(chǎn)GPU搭建的數(shù)據(jù)中心所提供的算力。目前，英偉達（NVDA.US）占據(jù)全球GPU市場的90%份額，國內(nèi)大型數(shù)據(jù)中心所用的GPU幾乎依賴進口。

科大訊飛表示，國產(chǎn)算力確實在單卡性能和生態(tài)上都與國際領(lǐng)先水平有差距，與華為的合作也經(jīng)歷了一番磨合與挑戰(zhàn)。在開發(fā)訊飛星火X1模型的過程中，他們開辟了一條全新的技術(shù)路徑，包括在訓(xùn)練和推理過程中實現(xiàn)強交互和跨任務(wù)數(shù)據(jù)傳輸，促進了不同任務(wù)間的知識共享和高效協(xié)同，同時，他們克服了國產(chǎn)硬件在帶寬性能上的限制，確保數(shù)據(jù)傳輸?shù)母咝院蜏?zhǔn)確性。

這次合作為國產(chǎn)算力提供了實踐機會，有助于實現(xiàn)國產(chǎn)算力從硬件到軟件的自主可控。合作也提升了國產(chǎn)大模型在政企服務(wù)中的信譽，隨著國家政策的引導(dǎo)，基于國產(chǎn)算力的大模型正成為政府采購的首選。