一石激起千層浪。
今年初,DeepSeek的橫空出世不僅顛覆了AI行業(yè)格局,更激起一股人工智能產(chǎn)業(yè)發(fā)展浪潮。
各地政務(wù)系統(tǒng)和大型企事業(yè)單位,紛紛開(kāi)展AI大模型的培訓(xùn)、對(duì)接和應(yīng)用;很多省市密集出臺(tái)相關(guān)政策,全力推動(dòng)人工智能產(chǎn)業(yè)發(fā)展。無(wú)論地區(qū)層面,還是企業(yè)層面,都積極行動(dòng)起來(lái),學(xué)AI、用AI,因地制宜發(fā)展AI,不甘落后、時(shí)不我待的緊迫感越來(lái)越強(qiáng),帶動(dòng)人工智能產(chǎn)業(yè)發(fā)展進(jìn)程陡然提速。
在撲面而來(lái)的時(shí)代浪潮中,一場(chǎng)人工智能產(chǎn)業(yè)發(fā)展競(jìng)速賽正在拉開(kāi)帷幕。如何在AI新賽道上迎頭趕上,乃至打贏這場(chǎng)競(jìng)速賽?
“要學(xué)會(huì)當(dāng)博導(dǎo)”
3月18日晚上7點(diǎn),一堂名為《從DeepSeek看人工智能發(fā)展趨勢(shì)》的公開(kāi)課,在浙江省委黨?;馃衢_(kāi)講。主講人、中國(guó)工程院院士王堅(jiān),面對(duì)浙江近30萬(wàn)干部,首先拋出一句靈魂拷問(wèn),“未來(lái)十年,不懂AI的領(lǐng)導(dǎo),還帶得動(dòng)浙江嗎?”
這是浙江省人工智能通識(shí)及應(yīng)用網(wǎng)絡(luò)專(zhuān)題培訓(xùn)的開(kāi)班第一課。聽(tīng)課的有浙江各級(jí)黨政班子成員,也有省市縣三級(jí)黨校春季學(xué)期主體班次學(xué)員,還有鎮(zhèn)村干部。據(jù)統(tǒng)計(jì),在線(xiàn)聽(tīng)課總?cè)藬?shù)達(dá)29.6萬(wàn)。
對(duì)于此次培訓(xùn),浙江高度重視,由省委主要領(lǐng)導(dǎo)提出明確要求并審定方案。培訓(xùn)從3月到6月連開(kāi)10期,均在晚上進(jìn)行,從通用知識(shí)、產(chǎn)業(yè)應(yīng)用、相關(guān)政策、企業(yè)案例等方面,深度解讀人工智能相關(guān)知識(shí)。課程包括“DeepSeek大模型實(shí)操”“AI政務(wù)案例分析”“產(chǎn)業(yè)智能化轉(zhuǎn)型”等硬核內(nèi)容,甚至要求學(xué)員現(xiàn)場(chǎng)用AI生成公文、制作PPT、剪輯視頻。當(dāng)?shù)孛襟w形容,干部“夜學(xué)AI,如臨大考”。
“面對(duì)新技術(shù)、新業(yè)態(tài)、新知識(shí),許多干部不同程度地存在‘本領(lǐng)恐慌’,干部對(duì)學(xué)習(xí)、理解、運(yùn)用人工智能有著迫切的需要?!闭憬∥M織部相關(guān)工作人員表示。
不僅是浙江,今年以來(lái),安徽、山東、河南等多地“一把手”帶頭開(kāi)展集體學(xué)習(xí)。蘇州、鄭州等城市以“新春第一課”的形式,組織領(lǐng)導(dǎo)干部學(xué)習(xí)DeepSeek。
深圳人工智能培訓(xùn)起步更早。去年10月,深圳就啟動(dòng)了覆蓋全員、分級(jí)分類(lèi)、訓(xùn)戰(zhàn)結(jié)合的人工智能培訓(xùn),并將“AI夜?!鞭k到了基層社區(qū),在全市掀起“萬(wàn)名干部用AI,百萬(wàn)居民學(xué)AI”的新風(fēng)尚。
培訓(xùn)熱潮的出現(xiàn),是時(shí)代發(fā)展的必然要求。學(xué)AI、用AI不僅可以緩解“AI焦慮”,更能讓干部迅速掌握與人工智能發(fā)展相匹配的素質(zhì)能力。
從各地設(shè)立的培訓(xùn)目標(biāo)來(lái)看,僅僅會(huì)用還不夠,而是要“努力在人工智能科技創(chuàng)新和產(chǎn)業(yè)發(fā)展上走在前列”。這就要求領(lǐng)導(dǎo)干部要從“被動(dòng)使用者”轉(zhuǎn)變?yōu)椤爸鲃?dòng)創(chuàng)新者”,成為AI的領(lǐng)導(dǎo)者,才能抓住時(shí)代機(jī)遇,掌握人工智能發(fā)展和治理的主動(dòng)權(quán)。
未來(lái)十年,將是AI時(shí)代到來(lái)的關(guān)鍵期。正如王堅(jiān)院士所言,“AI不是一次工具的革命,而是一次科學(xué)革命的工具。”“當(dāng)人們意識(shí)到AI可以作為革命的工具時(shí),一輪偉大的變革將會(huì)到來(lái)。”
在這場(chǎng)變革中,各地既面臨前所未有的機(jī)遇,也面臨嚴(yán)峻挑戰(zhàn)。是落后于人還是迎頭趕上,將決定一個(gè)地區(qū)發(fā)展的未來(lái)。在這種背景下,通過(guò)學(xué)習(xí)和培訓(xùn),掌握人工智能這一“革命的工具”尤為重要。
“當(dāng)有博士生水平的AI出現(xiàn)時(shí),要學(xué)會(huì)當(dāng)博導(dǎo),這樣才不會(huì)出現(xiàn)‘AI焦慮’?!睂?zhuān)家說(shuō)。
搶抓下一階段“風(fēng)口”
最近,武漢模態(tài)躍遷科技有限公司尤其忙碌。自DeepSeek發(fā)布以來(lái),已有美國(guó)、日本、新加坡的20多家企業(yè)主動(dòng)尋求合作,希望給大模型應(yīng)用匹配一個(gè)基座方案。
“大模型基座是離千行百業(yè)應(yīng)用最近的環(huán)節(jié)。以DeepSeek為代表的通用大模型,在產(chǎn)業(yè)應(yīng)用落地,需要很多工具和相關(guān)硬件,這就是模型基座要完成的工作。我們?cè)谌蚍秶鷥?nèi)都屬于前列乃至于領(lǐng)先的水平?!蹦B(tài)躍遷公司首席運(yùn)營(yíng)官常元和說(shuō)。
很難想象,作為企業(yè)創(chuàng)始人,常元和今年才23歲。其團(tuán)隊(duì)平均年齡不到25歲,大多來(lái)自武漢大學(xué)。
2023年,模態(tài)躍遷成立時(shí),這幫年輕人意氣風(fēng)發(fā),因?yàn)閳F(tuán)隊(duì)上一個(gè)項(xiàng)目剛被收購(gòu),新項(xiàng)目又獲得投資,技術(shù)、人脈、資金樣樣不缺。手握先進(jìn)的AI模型,他們滿(mǎn)懷信心地叩響近400家電商企業(yè)的大門(mén),但現(xiàn)實(shí)卻給了他們“當(dāng)頭一棒”:所有企業(yè)都只停留在“試用”階段,沒(méi)有一家愿意掏錢(qián)。產(chǎn)品無(wú)人問(wèn)津,團(tuán)隊(duì)很快陷入困境。
“技術(shù)再厲害,若不能融入產(chǎn)業(yè),也稱(chēng)不上真正的成功?!庇谑?,他們放下“極客”的驕傲,不再埋頭搞技術(shù),而是積極走出去,2024年一整年都在跑應(yīng)用場(chǎng)景和路演現(xiàn)場(chǎng)。
沒(méi)想到,今年就迎來(lái)了轉(zhuǎn)機(jī)。模態(tài)躍遷研發(fā)的模型在某機(jī)器人企業(yè)成功應(yīng)用,還在國(guó)內(nèi)率先將大模型引入游戲電競(jìng)行業(yè)。
春江水暖鴨先知。相對(duì)于地方上的焦慮,行業(yè)內(nèi)企業(yè)更多的是興奮與期待。DeepSeek改變大模型發(fā)展格局的同時(shí),更掀起了人工智能應(yīng)用熱潮,讓業(yè)界看到了AI時(shí)代“風(fēng)口”到來(lái)的巨大機(jī)遇。
過(guò)去,“百模大戰(zhàn)”拼的是技術(shù)和性能,參數(shù)量越大越好,計(jì)算能力越強(qiáng)越好,逐漸淪為少數(shù)巨頭的“燒錢(qián)游戲”。DeepSeek以開(kāi)源和低成本,極大降低了AI進(jìn)入門(mén)檻,加速了AI商業(yè)化落地進(jìn)程,讓眾多開(kāi)發(fā)者和企業(yè)可以一起參與其中,形成更為活躍的AI產(chǎn)業(yè)生態(tài)。
百度創(chuàng)始人李彥宏說(shuō):“人類(lèi)真正邁入AI時(shí)代的標(biāo)志不在于誕生眾多大模型,而在于涌現(xiàn)出大量的AI原生應(yīng)用。只有應(yīng)用直接創(chuàng)造價(jià)值?!贝竽P汀傲』ⅰ敝弧㈦A躍星辰副總裁李璟也預(yù)判:“商業(yè)化和應(yīng)用落地接下來(lái)決定行業(yè)的競(jìng)爭(zhēng)格局?!?
當(dāng)前,AI產(chǎn)業(yè)發(fā)展已從科學(xué)家推動(dòng)轉(zhuǎn)為應(yīng)用驅(qū)動(dòng),大模型逐漸向行業(yè)垂直深入。下一階段,機(jī)會(huì)將在行業(yè)大模型、垂類(lèi)大模型,已成為行業(yè)共識(shí)。
中國(guó)工業(yè)體系完備、產(chǎn)業(yè)規(guī)模龐大、應(yīng)用場(chǎng)景豐富,為AI應(yīng)用提供了廣闊空間。未來(lái)在工業(yè)制造、醫(yī)療教育、城市金融等領(lǐng)域,都有可能涌現(xiàn)出一批在全國(guó)具有領(lǐng)先地位的垂類(lèi)模型。這對(duì)有雄厚產(chǎn)業(yè)基礎(chǔ)和海量應(yīng)用場(chǎng)景的地區(qū)來(lái)說(shuō),是發(fā)展AI產(chǎn)業(yè)的絕佳機(jī)會(huì)。各地應(yīng)推動(dòng)大模型在更多的場(chǎng)景中實(shí)現(xiàn)商業(yè)應(yīng)用,力爭(zhēng)在行業(yè)細(xì)分領(lǐng)域打造一批“AI冠軍”。
目前,各行各業(yè)的垂類(lèi)大模型競(jìng)相涌現(xiàn)。專(zhuān)家預(yù)判:2025年將是AI大模型商業(yè)應(yīng)用元年,真正的競(jìng)爭(zhēng)才剛剛開(kāi)始。對(duì)于大部分地區(qū)來(lái)說(shuō),幾乎都處于同一起跑線(xiàn)。新賽道上機(jī)遇無(wú)限,無(wú)需焦慮,只要找準(zhǔn)時(shí)代的“風(fēng)口”。
打通AI應(yīng)用“最后一公里”
從事技術(shù)咨詢(xún)服務(wù)的深圳藍(lán)海優(yōu)利科技發(fā)展有限公司創(chuàng)始人李自軍發(fā)現(xiàn),2025年春節(jié)期間DeepSeek火爆出場(chǎng)后,很多企業(yè)也陷入焦慮之中,擔(dān)心如果導(dǎo)入大模型晚了,會(huì)不會(huì)喪失競(jìng)爭(zhēng)優(yōu)勢(shì)。但進(jìn)入第二季度,這種喧囂有所減弱。
因?yàn)榈谝惠唽?dǎo)入大模型的企業(yè),反饋的消息似乎并不太樂(lè)觀(guān)。除了少數(shù)行業(yè)如文案生成、內(nèi)容生成類(lèi)的,可以產(chǎn)生立竿見(jiàn)影的效果,大多數(shù)行業(yè)導(dǎo)入大模型的試點(diǎn),往往陷入泥潭。相對(duì)于政務(wù)領(lǐng)域,企業(yè)導(dǎo)入大模型迅速進(jìn)入冷靜期。
從實(shí)地調(diào)研情況看,目前大模型應(yīng)用還是以日常效率提升為主,真正要在工業(yè)領(lǐng)域得到深入應(yīng)用,還存在算法精度低、通用性差、專(zhuān)業(yè)數(shù)據(jù)不足、應(yīng)用能力有限等問(wèn)題。特別對(duì)于中小企業(yè)而言,算力成本、部署成本、試錯(cuò)成本高,投入產(chǎn)出比低。
“從企業(yè)角度,普遍期望擁有一個(gè)可以通用千行百業(yè)、快速?gòu)?fù)制的大模型,以降低成本。然而,由于各行業(yè)存在巨大差異,不同場(chǎng)景下開(kāi)發(fā)的模型難以直接應(yīng)用于其他場(chǎng)景,這使得定制化人工智能解決方案的成本居高不下,難以形成可持續(xù)的商業(yè)閉環(huán)。”專(zhuān)家分析指出,高成本、低回報(bào)的局面嚴(yán)重阻礙了企業(yè)采用AI技術(shù)的積極性。
如何破解這些痛點(diǎn)與難題,打通AI應(yīng)用“最后一公里”,各地都在積極探索。目前來(lái)看,有兩種代表性的創(chuàng)新路徑:一是推動(dòng)大模型與重點(diǎn)行業(yè)結(jié)合,在行業(yè)細(xì)分領(lǐng)域打造特色適用大模型,讓行業(yè)大模型成為制造業(yè)的“新基建”。
比如,山東省最近實(shí)施大模型產(chǎn)業(yè)“雙百工程”培育行動(dòng),聚焦“一行業(yè)一模型”開(kāi)展揭榜掛帥,加快培育“100+”特色大模型企業(yè),打造“100+”優(yōu)秀的行業(yè)級(jí)大模型、場(chǎng)景級(jí)大模型。
行業(yè)大模型建成后,可以通過(guò)開(kāi)放接口,以“云”的形式為行業(yè)內(nèi)的中小企業(yè)服務(wù),分享大模型建設(shè)成果。中小企業(yè)只需要付出少許費(fèi)用,便可以享受到行業(yè)頂尖企業(yè)的模型搭建、算法優(yōu)化等服務(wù),從而破解中小企業(yè)在AI應(yīng)用中的痛點(diǎn)。
二是從算力、算法、語(yǔ)料等關(guān)鍵要素方面破題,構(gòu)建助推垂類(lèi)大模型應(yīng)用落地的功能性平臺(tái),降低大模型使用門(mén)檻。在這方面,上海已經(jīng)率先開(kāi)始探索。
今年初,上海發(fā)布人工智能“模塑申城”實(shí)施方案,核心舉措是聚焦重點(diǎn)行業(yè)應(yīng)用,打造算力、語(yǔ)料、大模型評(píng)測(cè)與驗(yàn)證中心,以及人才和融資五大公共服務(wù)平臺(tái),為各類(lèi)創(chuàng)新主體提供便捷、優(yōu)質(zhì)、普惠的公共服務(wù),降低AI應(yīng)用落地成本。
算力和語(yǔ)料是大模型最重要的“燃料”。隨著AI大規(guī)模應(yīng)用,模型后訓(xùn)練和推理需求可能很快會(huì)超過(guò)預(yù)訓(xùn)練算力需求。為了提前做好算力保障和穩(wěn)定供應(yīng)的準(zhǔn)備,上海市設(shè)立國(guó)資的算力平臺(tái),一方面強(qiáng)化規(guī)?;撬慵航ㄔO(shè),另一方面提供“訓(xùn)推一體、混合部署”的智算云服務(wù),在保障垂類(lèi)應(yīng)用的同時(shí),降低算力成本。
在AI應(yīng)用中,語(yǔ)料質(zhì)量直接決定模型的性能。上海市組建了中國(guó)第一家人工智能語(yǔ)料公司,按照“一業(yè)一方法”建設(shè)行業(yè)語(yǔ)料庫(kù),提供一站式高質(zhì)量語(yǔ)料服務(wù),讓開(kāi)發(fā)垂類(lèi)模型的中小企業(yè)能夠零門(mén)檻使用數(shù)據(jù),從而大幅降低AI應(yīng)用成本。
除了算力、語(yǔ)料等顯性成本,大模型垂類(lèi)應(yīng)用還存在基座選型、開(kāi)發(fā)工具鏈與中間件、評(píng)估驗(yàn)證、工程化落地等諸多環(huán)節(jié)。在這個(gè)過(guò)程中,企業(yè)常常會(huì)“踩坑”“交學(xué)費(fèi)”。對(duì)此,上海市整合各方資源,在重點(diǎn)行業(yè)打造大模型評(píng)測(cè)與驗(yàn)證中心,減少大模型試驗(yàn)成本,幫助企業(yè)高效實(shí)現(xiàn)產(chǎn)品化,“企業(yè)選擇應(yīng)用就像入店試衣、按需購(gòu)買(mǎi)”。
在政府推動(dòng)、各方共同努力下,大模型有望實(shí)現(xiàn)從通用場(chǎng)景向行業(yè)特定場(chǎng)景、從單點(diǎn)應(yīng)用向多元化應(yīng)用的跨越,加速邁向全面應(yīng)用新階段,人工智能產(chǎn)業(yè)發(fā)展將迎來(lái)歷史性機(jī)遇。
延長(zhǎng)線(xiàn):什么是大模型?
大模型是大規(guī)模人工智能模型的簡(jiǎn)稱(chēng)。人工智能(AI)是涵蓋所有模擬人類(lèi)智能技術(shù)的總稱(chēng),包括機(jī)器學(xué)習(xí)、機(jī)器視覺(jué)、自然語(yǔ)言處理等方向。大模型是AI中基于深度學(xué)習(xí)、海量數(shù)據(jù)和算力構(gòu)建的特定技術(shù)形態(tài),屬于AI技術(shù)的一種高級(jí)實(shí)現(xiàn)形式。
傳統(tǒng)AI專(zhuān)注于單一任務(wù),如語(yǔ)音識(shí)別、圖像分類(lèi)等,而大模型通過(guò)參數(shù)規(guī)模(通常達(dá)百億至萬(wàn)億級(jí)別)、多模態(tài)能力(語(yǔ)言、視覺(jué)、跨領(lǐng)域推理等)突破了任務(wù)邊界,被認(rèn)為是邁向通用人工智能(AGI)的關(guān)鍵路徑。
根據(jù)輸入數(shù)據(jù)(模態(tài))類(lèi)型不同,可分為語(yǔ)言大模型、視覺(jué)大模型、多模態(tài)大模型等。
語(yǔ)言大模型是指基于海量文本數(shù)據(jù)訓(xùn)練、具備廣義自然語(yǔ)言理解與生成能力的大規(guī)模人工智能模型。在一般的認(rèn)知中,大模型被認(rèn)為是通用大語(yǔ)言模型的簡(jiǎn)稱(chēng)。這是因?yàn)樽匀徽Z(yǔ)言處理(NLP)是大模型技術(shù)發(fā)展的核心驅(qū)動(dòng)力,早期的AI研究主要集中在文本理解和生成任務(wù)上。此外,語(yǔ)言模型的通用性又使其成為其他領(lǐng)域大模型的基礎(chǔ)。
視覺(jué)大模型是指通過(guò)大規(guī)模圖像數(shù)據(jù)進(jìn)行訓(xùn)練,通常用于圖像處理和分析的人工智能模型。
多模態(tài)大模型是指能夠同時(shí)處理和理解多種類(lèi)型數(shù)據(jù)的模型,如文本、圖像、音頻、視頻、3D等。核心是模仿人類(lèi)多感官協(xié)同認(rèn)知的能力,突破單一模態(tài)的局限性,實(shí)現(xiàn)更復(fù)雜的交互與應(yīng)用。未來(lái)隨著AI技術(shù)的進(jìn)步,多模態(tài)大模型將成為醫(yī)療、教育、娛樂(lè)等領(lǐng)域的核心基礎(chǔ)設(shè)施。
根據(jù)應(yīng)用場(chǎng)景和功能不同,可分為通用大模型、行業(yè)大模型和垂直大模型。
通用大模型是指可以在多個(gè)領(lǐng)域和任務(wù)上通用的模型,通過(guò)在大規(guī)模無(wú)標(biāo)注數(shù)據(jù)上進(jìn)行訓(xùn)練,以尋找特征并發(fā)現(xiàn)規(guī)律,進(jìn)而形成“舉一反三”的強(qiáng)大泛化能力,可在不進(jìn)行微調(diào)或少量微調(diào)的情況下完成多場(chǎng)景任務(wù),相當(dāng)于AI完成了“通識(shí)教育”。
行業(yè)大模型是指針對(duì)特定行業(yè)或領(lǐng)域的大模型,通常使用行業(yè)相關(guān)的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練或微調(diào),以提高在該領(lǐng)域的性能和準(zhǔn)確度,相當(dāng)于“行業(yè)專(zhuān)家”。
垂直大模型是指針對(duì)特定任務(wù)或場(chǎng)景的大模型,通常使用任務(wù)相關(guān)的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練或微調(diào),以提高在該任務(wù)上的性能和效果,相當(dāng)于“一線(xiàn)員工”。
根據(jù)運(yùn)行載體不同,可分為端側(cè)大模型和云側(cè)大模型。
端側(cè)大模型是能夠直接在終端設(shè)備上本地化運(yùn)行的模型,如手機(jī)、平板、智能汽車(chē)等,無(wú)需依賴(lài)云端服務(wù)器進(jìn)行計(jì)算。
云側(cè)大模型是部署在云端服務(wù)器集群上的模型,依賴(lài)云計(jì)算資源進(jìn)行訓(xùn)練和推理,通過(guò)應(yīng)用程序接口(API)或云服務(wù)向終端用戶(hù)提供服務(wù)。絕大多數(shù)用戶(hù)直接使用的都是云側(cè)大模型。
根據(jù)開(kāi)源性質(zhì)不同,可分為開(kāi)源大模型、閉源大模型和半開(kāi)源模型。
開(kāi)源大模型是將模型架構(gòu)、訓(xùn)練代碼、權(quán)重參數(shù)等核心技術(shù)資源公開(kāi),允許開(kāi)發(fā)者自由使用。
閉源大模型僅通過(guò)API提供服務(wù),技術(shù)細(xì)節(jié)不公開(kāi)。
半開(kāi)源模型是公開(kāi)部分權(quán)重或訓(xùn)練方法,但完整數(shù)據(jù)和代碼未開(kāi)放。