郭晨凱 制圖
“剛剛我還在用DeepSeek-R1模型測試本地知識庫,它的文本生成能力比預(yù)期的更好?!?月6日,心動公司媒體公關(guān)總監(jiān)陳承對上海證券報記者說。
1月20日,DeepSeek正式發(fā)布DeepSeek-R1模型,并同步開源模型權(quán)重。DeepSeek模型的橫空出世掀起行業(yè)浪潮,多家公司迎來“破圈時刻”:在軟件端,一批上市公司宣布接入DeepSeek,加速自身AI應(yīng)用產(chǎn)品升級;在硬件端,端側(cè)AI迎來加速發(fā)展契機,2025年或?qū)⒊霈F(xiàn)一波AI硬件創(chuàng)業(yè)浪潮。
在昆侖萬維董事長兼CEO方漢看來,DeepSeek的高性價比模型證明了,只要算法先進,訓(xùn)練成本跟推理成本都可以大幅度下降。這將會刺激整個大模型行業(yè)快速落地,對于整個行業(yè)非常有益。從行業(yè)長期發(fā)展來看,DeepSeek對下游應(yīng)用落地起到很好的促進作用,所有和編程、數(shù)理推斷相關(guān)的行業(yè),如金融、互聯(lián)網(wǎng)、法律等領(lǐng)域,都會得到極大發(fā)展。
中小企業(yè)涌入 AI迎來“破圈時刻”
據(jù)了解,DeepSeek-R1的訓(xùn)練費用不到OpenAI GPT-4o的十分之一,且API定價僅為OpenAI o1的三十分之一。這意味著中小企業(yè)和個人開發(fā)者也能夠輕松使用這種高性能的人工智能技術(shù)。
蟻智島科技采用DeepSeek的服務(wù)已有半年之久,見證了其版本從v1到v3再到R1的更迭。蟻智島科技CEO隋闊認為,DeepSeek最核心的影響是讓AI“破圈”了,憑借產(chǎn)品硬實力,很多圈外人得以迅速了解這一產(chǎn)品形態(tài)?!按汗?jié)回來后不少老板主動聯(lián)系我,想加速推動AI在企業(yè)的落地。雖然還是有理解上的差異,但是DeepSeek接受度大大提高?!?/p>
市場對于DeepSeek的濃厚興趣,也體現(xiàn)在各行各業(yè)的加速布局中。
上海鋼聯(lián)在2月5日發(fā)布的調(diào)研紀要中提到,DeepSeek-R1開源推理模型成本低、推理能力強,對大宗商品語義理解的復(fù)雜性,能有更好的處理能力。公司表示,希望盡快把基于DeepSeek的“小鋼”做出來,在一季度借助DeepSeek-R1快速蒸餾出全新的“宗師”模型,并切換“小鋼”的基座模型。
2月6日,智云健康宣布將DeepSeek-R1模型接入公司自研醫(yī)療人工智能系統(tǒng)“智云大腦”。這一舉措將增強智云醫(yī)療大腦的數(shù)據(jù)挖掘能力,提高慢病管理效率。
中信證券發(fā)布研報稱,DeepSeek是國內(nèi)AI生態(tài)級的突圍,有望帶動國內(nèi)AI全產(chǎn)業(yè)的快速發(fā)展。同時,其開源與低成本的特性亦有望賦能AI應(yīng)用廠商,加速推動端側(cè)AI落地。
也有專家提出,未來,大部分的企業(yè)或個人都可以輕松地本地化部署DeepSeek,隨后DeepSeek對于AIGC類公司的影響將逐漸下降。企業(yè)的競爭力依然取決于自身的AI應(yīng)用場景與產(chǎn)品。
“行業(yè)需要在算法迭代與芯片制造和設(shè)計上更進一步,才能真正進入世界先進水平之列。”方漢告訴記者。
隋闊表示,DeepSeek的“破圈”是一個利好,隨著算力、算法、數(shù)據(jù)等其他環(huán)節(jié)的迭代優(yōu)化,會有更大的應(yīng)用前景。DeepSeek開源了R1的訓(xùn)練方法和流程,大幅提升了訓(xùn)練效率,但如果企業(yè)要訓(xùn)練依舊是“天價”。蒸餾模型依舊更適合企業(yè),高質(zhì)量數(shù)據(jù)依舊是核心。
端側(cè)AI加速跑激活硬件生態(tài)
事實上,相較于AI軟件,此次由DeepSeek帶動的端側(cè)AI加速發(fā)展,有望大幅激活A(yù)I硬件的商業(yè)化生態(tài)。
受訪的業(yè)內(nèi)人士告訴記者,端側(cè)AI能優(yōu)化硬件性能,提高運算速度、降低延遲,同時實現(xiàn)更復(fù)雜任務(wù)與增強交互,并支持更多離線等應(yīng)用場景,全面提升AI硬件的能力與價值。2025年將是AI眼鏡、AI玩具等AI硬件行業(yè)發(fā)展的重要一年。
從技術(shù)層面來看,DeepSeek模型采用改進的算法和架構(gòu),實現(xiàn)了算法、框架和硬件的優(yōu)化協(xié)同,提高了模型在端側(cè)設(shè)備上的運行效率,使端側(cè)AI部署變得更加具有普惠性。同時,通過知識蒸餾,將大模型的能力高效遷移到輕量化模型上,開發(fā)者可快速將其AI能力部署至硬件設(shè)備并針對場景定制化,降低了智能產(chǎn)品的AI功能集成門檻。
Rokid投資者關(guān)系負責人方雨晴表示,在智能眼鏡行業(yè),企業(yè)是否接入大模型主要取決于Token(詞元)價格、平臺穩(wěn)定性和響應(yīng)速度等因素。企業(yè)可以在前期選擇多個AI大模型供用戶自由選擇。從行業(yè)來看,AI軟硬件公司普遍期待DeepSeek等國產(chǎn)或開源大模型能有更好的發(fā)展,有助于降低行業(yè)開發(fā)周期和投入。據(jù)介紹,Rokid專注于AR智能眼鏡的軟硬件研發(fā),并已與通義千問等多模態(tài)大模型建立合作關(guān)系。
華安證券研報表示,目前不少國內(nèi)手機整機廠商推出端側(cè)AI功能?;贒eepSeek-R1在推理能力上表現(xiàn)出色,該模型若能進入AI智能終端,將形成具有強大AI功能的產(chǎn)品,有望提升用戶體驗,增強產(chǎn)品吸引力,在與其他廠商的競爭中更具優(yōu)勢。
從產(chǎn)業(yè)鏈來看,DeepSeek也有利于SoC芯片和存儲等行業(yè)的發(fā)展。
“從行業(yè)的長期發(fā)展來說,DeepSeek會催生上游的推理芯片跟訓(xùn)練芯片的大幅進步?!狈綕h說。
泰凌微副總經(jīng)理、COO金海鵬對記者表示,隨著蒸餾技術(shù)的成熟,可以預(yù)見在泰凌微AI芯片上運行的模型也會更強大。不過,這些目標無法在短期內(nèi)達到,需要時間的積累。公司未來或?qū)⒃诩夹g(shù)適配與優(yōu)化、應(yīng)用場景融合與生態(tài)合作方面與DeepSeek有交集。從行業(yè)來看,DeepSeek推動端側(cè)AI成本降低,使整個端側(cè)AI市場需求增長,從而將帶動端側(cè)AI芯片公司的市場拓展。
在AI硬件的商業(yè)化落地中,有了DeepSeek也并非高枕無憂。
人形機器人被視為AI硬件應(yīng)用的終極集成形態(tài)。DeepSeek如果被植入人形機器人中,是否會迎來更大的商機?對此,國內(nèi)一家機器人公司的相關(guān)負責人認為,DeepSeek屬于ChatGPT的大類別,目前還無法深度驅(qū)動人形機器人。
陳承也表示,DeepSeek盡管在文本處理方面十分突出,但目前多模態(tài)功能尚屬短板,因而使用場景更聚焦于文本處理及其衍生場景。