首頁 >快訊 >

2023年中國AIGC產(chǎn)業(yè)全景報告

AIGC丨研究報告

核心摘要:


(資料圖)

古人有云:日就月將,學有緝熙于光明。人類對人工智能學的潛心鉆研終于再度獲得重大突破,大模型的涌現(xiàn)能力與AIGC的應用普及為那不一定是AGI但一定更AI的未來提供了確定性的加速度。AI2.0時代的加速到來,不僅是把AI能力融入到現(xiàn)有應用中,更是未來產(chǎn)業(yè)范式的再塑造。AI正跳躍式地加速滲透進各行各業(yè),推動一場新的生產(chǎn)力與創(chuàng)造力革命。AI產(chǎn)業(yè)鏈各環(huán)節(jié)參與者的角色功能、產(chǎn)品服務和應用生態(tài)可能將發(fā)生變化。

對此,艾瑞發(fā)布《AIGC系列報告——中國AIGC產(chǎn)業(yè)全景報告》,作為AIGC系列首發(fā),報告將展開對AIGC產(chǎn)業(yè)的全景洞察、探究生成式AI技術對數(shù)字產(chǎn)業(yè)的影響變化、繪制“中國AIGC產(chǎn)業(yè)全景圖譜”、分析主流參與廠商類型與格局策略、各類型廠商發(fā)展路徑和能力要求變化等,為市場辨析產(chǎn)業(yè)發(fā)展價值與空間。

報告研究范圍 - AIGC

AIGC與大模型將引領“AI產(chǎn)業(yè)”與“產(chǎn)業(yè)AI”發(fā)展

AIGC(AI-Generated Content)指利用人工智能技術(生成式AI路徑)來生成內(nèi)容的新型內(nèi)容生產(chǎn)方式。2022年11月上線的AIGC應用ChatGPT,憑借其在語義理解、文本創(chuàng)作、代碼編寫、邏輯推理、知識問答等領域的卓越表現(xiàn),以及自然語言對話的低門檻交互方式,迅速獲得大量用戶,于23年1月突破1億月活,打破前消費級應用的增速記錄。微軟稱其在GPT-4(ChatGPT Plus背后運行的大模型)中看到了AGI(通用人工智能)的雛形。大眾的生活工作日常出現(xiàn)了Midjourney等新形態(tài)的各類AIGC應用,各行業(yè)的智能化升級也看到了新的可能性,“AI產(chǎn)業(yè)”與“產(chǎn)業(yè)AI”的想象空間進一步拓展。AIGC應用創(chuàng)新的技術支撐為“生成對抗網(wǎng)絡(GAN)/擴散模型(Diffusion)”與Transformer預訓練大模型”的兩類大模型分支。在國外AIGC應用展示出大模型的能量的同時,我國企業(yè)也加強了相關產(chǎn)品技術布局,云廠商、AI大廠、創(chuàng)企、各行業(yè)公司及技術服務商等產(chǎn)業(yè)各領域玩家紛紛發(fā)布大模型或基于大模型的應用產(chǎn)品及各類技術服務。相較于一般AI應用,大模型應用的訓練及推理需要更強的算力支持。綜上,本報告將圍繞模型、應用、算力三個角度對AIGC產(chǎn)業(yè)的發(fā)展進行探討,試圖在討論開源閉源、垂直通用、知識幻覺等大模型未來發(fā)展的各種不確定性的同時,為AIGC應用的迭代升級、產(chǎn)業(yè)的智能化應用,提供盡可能多的研究輔助,為那個不一定是AGI但一定更AI的未來提供確定性的加速度。

中國AIGC產(chǎn)業(yè)市場規(guī)模

市場規(guī)模呈指數(shù)級增長,突破規(guī)?;R界點攫取萬億產(chǎn)業(yè)價值

根據(jù)第50次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》,截至2022年6月,中國互聯(lián)網(wǎng)普及率已高達74.4%。在網(wǎng)民規(guī)模持續(xù)提升、網(wǎng)絡接入環(huán)境日益多元、企業(yè)數(shù)字化進程不斷加速的宏觀環(huán)境下,AIGC技術作為新型內(nèi)容生產(chǎn)方式,有望滲透人類生產(chǎn)生活,為千行百業(yè)帶來顛覆變革,開辟人類生產(chǎn)交互新紀元。艾瑞咨詢預測,2023年中國AIGC產(chǎn)業(yè)規(guī)模約為143億元,隨后進入大模型生態(tài)培育期,持續(xù)打造與完善底層算力基建、大模型商店平臺等新型基礎設施,以此孕育成熟技術與產(chǎn)品形態(tài)的對外輸出。2028年,中國AIGC產(chǎn)業(yè)規(guī)模預計將達到7202億元,中國AIGC產(chǎn)業(yè)生態(tài)日益穩(wěn)固,完成重點領域、關鍵場景的技術價值兌現(xiàn),逐步建立完善模型即服務產(chǎn)業(yè)生態(tài),2030年中國AIGC產(chǎn)業(yè)規(guī)模有望突破萬億元,達到11441億元。

中國AIGC產(chǎn)業(yè)投融資情況

模型創(chuàng)業(yè)初抬頭,多模態(tài)、跨模態(tài)備受青睞,資本扎堆優(yōu)質(zhì)項目

2021年至2023年7月期間AIGC賽道共發(fā)生280筆投融資,展現(xiàn)了其高熱度與高成長性。從產(chǎn)業(yè)細分維度,應用層創(chuàng)業(yè)機會最多,模型層創(chuàng)業(yè)受到ChatGPT影響,在2023年集中涌現(xiàn);在獲投的應用與模型層創(chuàng)業(yè)項目中,文本、影像、語音平分秋色,但相比單一模態(tài),多模態(tài)和跨模態(tài)的應用前景更加為資本所看好。從投融資輪次維度,70%左右的項目仍處于A輪及以前階段,同時有高達14.6%的比例屬于股權、戰(zhàn)略融資,說明賽道雖然處于起步期,但其戰(zhàn)略價值已被公認。在全部獲投的170家公司中,獲投3次及以上公司約占17%。同一標的的高頻融資,從企業(yè)需求側(cè)反映AIGC前期創(chuàng)業(yè)所需大量資金支持,從資方供給側(cè)表明優(yōu)質(zhì)創(chuàng)業(yè)項目仍非常稀缺。

中國AIGC產(chǎn)業(yè)圖譜全景圖

預訓練大模型分類與介紹

基于兩大類基礎架構衍生出各類大模型;多模態(tài)已成趨勢

預訓練大模型按照模態(tài)可以分為文本、圖像、視頻、代碼、音樂生成等多種,但從底層架構上都分屬兩類。Transformer是一種編解碼模型框架,適用于處理文本、代碼這類強連續(xù)性生成任務;Diffusion、GAN、NeRF等框架善于處理圖像生成類任務。疊加文-圖轉(zhuǎn)換技術可以形成文生圖模型。由單模態(tài)模型在實際訓練時融合其他模態(tài)技術,可形成多模態(tài)、跨模態(tài)大模型,如GPT-4、文心一言、 Mid journey等,由于多模態(tài)模型可接受文本、圖像等不同輸入輸出形式,對應用場景能夠更廣泛適配,著力發(fā)展多模態(tài)模型成為產(chǎn)研兩界共同趨勢。

預訓練大模型的路徑探討

了解人工智能時代的“iOS”與“安卓”,閉源與開源市場將并存互補

在以OpenAI為代表的閉源模型廠商開放對外技術服務后,開源模型廠商也在加緊發(fā)力,以Meta的Llama模型為代表陸續(xù)開源迭代,意圖進一步實現(xiàn)生態(tài)層面的跑馬圈地,2023年上半年LLM與數(shù)據(jù)集迎來開源季。大模型的開源可根據(jù)開源程度分為“可研究”與“可商用”級別。2023年2月,Meta發(fā)布了開源大模型LLM的第一個版本Llama,授予“可研究”用途。2023年7月進一步發(fā)布“可商用”的Llama2版本,雖然有日活超過7億產(chǎn)品需額外申請、不能服務于其他模型調(diào)優(yōu)等的商用限制,但海外很多中小企業(yè)已可用Llama2的模型來做私有化部署,基于Llama2開源模型訓練出定制化的可控模型。由于Llama2基本不支持中文,對中國的大模型商用生態(tài)暫時不會產(chǎn)生實質(zhì)性變化,中國仍需開發(fā)培育適配于中文數(shù)據(jù)土壤的開源生態(tài)。閉源LLM可為B端用戶和C端消費者持續(xù)提供優(yōu)質(zhì)的模型開發(fā)及應用服務;開源LLM可從研究角度促進廣大開發(fā)者和研究者的探索創(chuàng)新,從商用角度加速大模型的商業(yè)化進程與落地效果。未來,開源和閉源的LLM會并存和互補,為大模型發(fā)展共同創(chuàng)造出多元協(xié)作的繁榮生態(tài)。

著力打造中國AIGC開源社區(qū)生態(tài)

輕量級模型陸續(xù)開源,助力開源生態(tài)建設,千億級模型暫以閉源路徑開展

AIGC開源社區(qū)的建設可以吸納更多的開發(fā)者及擁有定義用戶的主導權,以AI開源創(chuàng)新平臺為杠桿,帶動支撐底層AI芯片、智算中心及云服務等基礎設施發(fā)展。從供給側(cè)邏輯來看,大模型開源早期由高校和機構推動,如清華大學的ChatGLM-6B、復旦大學的MOSS,陸續(xù)有頭部云廠商加入,如百度的文心系列與阿里的通義系列,共同為中國AIGC開源社區(qū)的建設“增磚添瓦”,以阿里云魔塔社區(qū)、百度云飛槳社區(qū)為代表的開源社區(qū)建設成果初現(xiàn),而千億級模型暫以閉源路徑開展,憑借穩(wěn)定、優(yōu)質(zhì)效、完整工具鏈等產(chǎn)品特點定位應用市場;從商業(yè)化路徑來看,參考海外明星開源社區(qū)Hugging Face的商業(yè)模式,中國AI開源社區(qū)同樣會先免費提供基礎算力,為客戶提供免費的社區(qū)體驗、demo部署及測試,并進一步通過付費服務推送輕量級遷移的微調(diào)推理服務或深度開發(fā)的訓練調(diào)優(yōu)平臺,提升模型產(chǎn)品性能,通過開源社區(qū)吸引開發(fā)者、企業(yè)客戶完成更多部署應用資源的引流變現(xiàn)。

大模型落地將帶來新一輪AI產(chǎn)業(yè)化擴散

大模型的落地將提速AI工業(yè)化生產(chǎn),并充分釋放AI產(chǎn)業(yè)潛在市場空間

大模型類似于一個能力全面且突出的“完全體”,不僅通用性強,且能力相比小模型有較大提升。因此,用大模型做應用開發(fā),可以采用“預訓練+微調(diào)”開發(fā)范式,只需要針對具體任務,對大模型進行二次開發(fā)、微調(diào)甚至只是單純以領域知識庫做輔助,就可以快速賦能應用。相比獨立分散的小模型開發(fā),標準化、流程化程度更高,在開發(fā)效率和運維成本上都有較大改善,有效促進了AI的工業(yè)化生產(chǎn)。同時,模型能力的提升使得更多AI服務可以落地,有效擴展了AI的應用范圍,這些共同促進AI供需兩側(cè)潛力釋放。

MaaS是大模型能力落地輸出的新業(yè)態(tài)

打造大模型商店,為下游提供低門檻、低成本的模型使用與開發(fā)支持

MaaS(Model-as-a-Service),模型即服務,是指以云計算為基礎,將大模型作為一項服務提供給用戶使用的新業(yè)態(tài)。如今,MaaS模式已成為各家云巨頭廠商發(fā)展第一戰(zhàn)略優(yōu)先級,把模型作為重要的生產(chǎn)元素,依托于既有IaaS設施與PaaS平臺架構,為下游客戶提供以大模型為核心的數(shù)據(jù)處理、特征工程、模型訓練、模型調(diào)優(yōu)、推理部署等服務。未來,順應大模型開源趨勢,MaaS服務商將著力打造大模型商店平臺,發(fā)力大模型生態(tài)建設,納入更多允許商用的開源模型,提升平臺的基模類型及能力,并豐富工具鏈產(chǎn)品服務,通過業(yè)務積累、數(shù)據(jù)回流、模型迭代逐步形成壁壘,在拉高云服務營收天花板的同時進一步塑造廠商的核心競爭力。

大模型成為AI應用開發(fā)的操作系統(tǒng)

模型即服務(MaaS)構建新型AI基礎設施,重構AI開發(fā)部署范式

隨著企業(yè)上云進程中智能化轉(zhuǎn)型需求的逐步增多和傳統(tǒng)行業(yè)領域數(shù)據(jù)的不斷積累,AI應用開發(fā)過程中逐漸面臨大量細分領域的深耕、非典型客戶需求,對算法的通用性和延展性提出了較高要求。傳統(tǒng)“小模型”范式的AI應用開發(fā)流程一般針對單一場景,獨立完成模型選擇-數(shù)據(jù)處理-模型優(yōu)化-模型迭代等一系列開發(fā)環(huán)節(jié)。因此,AI應用在定制化需求、長尾需求下的開發(fā)效率較低,且模型精度、性能、可擴展性等指標質(zhì)量也會受到影響。隨著AI產(chǎn)業(yè)深入及智能化需求增加,AI在研發(fā)門檻及開發(fā)效率的問題日益凸顯?!邦A訓練大模型”應運而生,其將數(shù)據(jù)中蘊含的知識通過無監(jiān)督或者自監(jiān)督學習方式提取出來,存儲在具有大量參數(shù)的神經(jīng)網(wǎng)絡模型中。AI應用開發(fā)流程轉(zhuǎn)變?yōu)?,調(diào)用通用流程-結合行業(yè)經(jīng)驗-解決實際問題。未來,大模型將成為AI產(chǎn)業(yè)的操作系統(tǒng),其基礎設施特性可為AI應用開發(fā)做好底座,將AI模型變得可維護、可擴展、可迭代,極大降低AI應用的開發(fā)門檻。從需求側(cè)來看,客戶能通過更低成本、高效率的MaaS(Model As a Service)路徑獲得AI能力,完成AIGC應用的個性化開發(fā)、優(yōu)化及部署,持續(xù)兌現(xiàn)大模型的技術紅利,將AI能力應用滲透到各行各業(yè)的場景業(yè)務中。

市場需評估基礎通用大模型產(chǎn)品服務能力

艾瑞提出EPS-EPD評估體系,定位大模型產(chǎn)品的基模性能與商業(yè)能力

大模型能力評測意義重大,評測結果可讓供需兩側(cè)了解各家大模型能力的優(yōu)勢與不足,做出更好的產(chǎn)品調(diào)優(yōu)與應用選擇。隨著大模型產(chǎn)業(yè)的發(fā)展迭代,評測基準體系也在不斷完善。艾瑞判斷,未來大模型的產(chǎn)品服務能力評測將作為一項工具包,打包在大模型平臺中為客戶提供產(chǎn)品服務。對此,艾瑞提出EPS-EPD評估體系,以其為核心構建一系列評測集,對市面公開大模型能力展開測評,全維度定位大模型產(chǎn)品的基模性能與商業(yè)能力,為業(yè)內(nèi)各界對模型評估有結果需求的客戶提供信息參考。

基模落地因需求差異展開產(chǎn)業(yè)路徑分化

大模型需以行業(yè)級、企業(yè)級大模型方式支撐上層應用

基礎大模型落地面臨兩大難題,一是終端客戶對算力成本的接受能力,二是大模型雖擅長通用領域問題,但往往在垂直行業(yè)任務中表現(xiàn)欠佳。因此,基礎大模型會通過領域數(shù)據(jù)或?qū)僦R庫進行訓練和調(diào)優(yōu),形成垂直領域的行業(yè)大模型或業(yè)務大模型;此外,部分企業(yè)還具有深度定制、私有化部署的需求,需要在行業(yè)大模型基礎上,進一步加入企業(yè)專有數(shù)據(jù)進行訓練或微調(diào),形成企業(yè)級大模型。從商業(yè)化布局角度來看,如今基礎大模型廠商可分為三類參與者,分別為云巨頭廠商、人工智能公司、學術研究機構及創(chuàng)業(yè)公司,在定位有通用能力基座的同時打通向上商業(yè)化路徑。其中,云巨頭廠商將借助云服務及數(shù)據(jù)庫資源,更強調(diào)MaaS能力輸出。AI公司或創(chuàng)業(yè)公司將借助業(yè)務積累或生態(tài)資源錨定幾個典型行業(yè)或業(yè)務場景展開商業(yè)占領。從開閉源角度來看,基模廠商普遍采用前文所述的“輕量級開源、千億級閉源”的發(fā)展路徑,而向上分化的垂直領域廠商將基于開源模型或基模平臺開發(fā)部署細分領域模型產(chǎn)品,廠商優(yōu)勢在垂類數(shù)據(jù)與業(yè)務理解。若客戶,如金融行業(yè),對模型的開源性及私有化部署有明確要求,則開源路徑會是該類需求的典型落地形態(tài)。

如何連接模型能力與應用需求是落地關鍵

數(shù)據(jù)準備、ROI衡量、 Prompt工程是連接模型層與應用層的落地三要素

在本輪大模型推動的技術浪潮下,如何連接模型能力與上層應用,完成商業(yè)化變現(xiàn),構建人工智能應用主導的生態(tài)系統(tǒng)是AIGC各層廠商重點關注的課題。艾瑞認為,數(shù)據(jù)準備,ROI衡量與Prompt工程能力是連接模型層與應用層落地的核心三要素。由于AI研究進展緩于國外、中文數(shù)據(jù)集論文發(fā)表難度高、NLP算法改進驗證與數(shù)據(jù)集語言類型關聯(lián)度低等歷史性原因,目前中文NLP數(shù)據(jù)集語料庫在數(shù)量與質(zhì)量方面仍有較大差距。從可行性、性價比與時間角度出發(fā),追趕期間同步發(fā)展典型行業(yè)應用數(shù)據(jù)集是彌補中文NLP數(shù)據(jù)集短板的有效策略;從需求側(cè)角度出發(fā),大模型能力應用化需結合業(yè)務場景與成本效益選擇大模型的應用方式及調(diào)用形式,若基于安全隱私性需求要求私有化部署則投入成本更高,客戶端的ROI衡量是決定其能力商業(yè)化進程的關鍵;提示(prompt)是觸發(fā)AI 模型生成內(nèi)容的寬泛指令,提示工程則可進一步開發(fā)和優(yōu)化提示,從指令拆解到調(diào)用能力多維度融合大模型LLM來處理各類需求,是未來影響影響交互效果與應用體驗的關鍵。

廠商合作關系演化及周邊工具服務發(fā)展

模型層與應用層邊界漸弱,帶動數(shù)據(jù)層、開發(fā)平臺等工具服務高效發(fā)展

伴隨大模型通用性的提升,模型開發(fā)廠商可能因其模型被廣泛使用調(diào)用匯聚多維場景數(shù)據(jù)、積累行業(yè)場景認知并集成部分垂類功能特性,進而向上延伸拓展至完整功能應用;原有垂類應用,為鞏固市場地位,可能探索開源甚至自研模型,憑借既有資源、經(jīng)驗積淀及領域聚焦,同樣打造模型開發(fā)及應用服務的閉環(huán)迭代,因此模型層、應用層有交錯發(fā)展之勢。此外,企業(yè)客戶參差的數(shù)字化基礎及個性化的軟件、流程需求依然需要解決方案廠商定制優(yōu)化并部署實施,而AI開發(fā)平臺也將與大模型合力,通過“稀疏、蒸餾、剪裁”等手段助力大模型解決訓練、推理部署困難問題,進一步實現(xiàn)“低門檻、低成本、高效率”的開發(fā)部署與應用。數(shù)據(jù)標注、 安全合規(guī)等周邊工具服務亦是促進AIGC產(chǎn)品高效開發(fā)、產(chǎn)業(yè)有序發(fā)展的可觀商機。

工具層成為AIGC產(chǎn)業(yè)新熱點

工具層的AI Agent與模型服務平臺可以更好匹配應用需求與模型能力

艾瑞認為,大模型的中間層-工具層構成可分為AI代理-Agent角色與AI微調(diào)-大模型服務兩類。AI Agent是繼大模型、AIGC后進一步火爆的中間層產(chǎn)品,可看作能感知環(huán)境及需求、進行決策和執(zhí)行動作的智能體。如代表性產(chǎn)品,AutoGPT即是利用GPT-4編寫自身代碼并執(zhí)行Python自動化腳本,持續(xù)完成GPT對問題的自我迭代與完善。目前代理角色產(chǎn)品仍處于初代階段,未來將與實際場景、垂類數(shù)據(jù)結合,更加作為調(diào)度中心完成對應用層需求指令的規(guī)劃、記憶及工具調(diào)用(引用自OpenAI的Lilian Weng論文觀點)。大模型服務平臺則是為企業(yè)提供模型訓練、推理、評測、精調(diào)等全方位平臺服務,并基于供給側(cè)能力與需求側(cè)要求進行B端私有化部署(創(chuàng)業(yè)公司切入點)或平臺資源調(diào)用(云廠商切入點),模型與用戶將呈現(xiàn)明顯雙邊效應。總體來看,作為模型能力與應用需求的鏈接,中間層價值前景廣袤,或作為另一核心入口建設起工具生態(tài),但從另一角度出發(fā),中間層仍嫁接于模型層之上,受限于模型層能力,“合格”的大模型能力底座將為中間層發(fā)展開拓提供更優(yōu)渥土壤。

AI Agent更廣闊的角色價值與發(fā)展空間

進入AI智能體文明,讓生產(chǎn)力大幅提升,沉淀垂類數(shù)據(jù)與業(yè)務理解是關鍵

早在20世紀80年代,計算機科學家已著手探索開發(fā)一個能與人類交互的智能軟件,類似于AI Agent的雛形應用一直在被構思討論。當下大模型的涌現(xiàn)能力成功賦予AI Agent更多想象與落地空間。一方面,大模型的語料資源包含了大量的人類行為數(shù)據(jù),填補了AI Agent可行性與合理性的關鍵要素。另一方面,大模型涌現(xiàn)出優(yōu)秀的上下文學習能力、復雜推理能力,在接受目標及設定后,可自發(fā)性將其拆解成簡單細化的子任務,無需人類干預去完成剩下的全部工作。目前AI Agent已成為繼大模型之后,更有想象空間卻也更貼近應用的下一爆點。海外亞馬遜、OpenAI及國內(nèi)高校、云巨頭廠商都熱情滿滿,陸續(xù)發(fā)布AI Agent的學術研究成果及產(chǎn)品應用。未來,人與AI的協(xié)作交流或進一步由Agents作為智能媒介實現(xiàn),每個人都可以使用各類AI Agent完成現(xiàn)實任務的處理執(zhí)行,人類由此進入龐大復雜的AI智能體文明。而要想實現(xiàn)這些,將寶貴的垂類數(shù)據(jù)與業(yè)務理解集成到Agent框架之中,保證大模型應用在執(zhí)行任務時可以訪問到正確的信息并高效執(zhí)行產(chǎn)出,是未來AI Agent能發(fā)揮出實際效用的關鍵。相較于模型層,AI Agents將留給創(chuàng)業(yè)者更多機會。

AIGC產(chǎn)業(yè)化價值與影響

內(nèi)容生產(chǎn)和人機交互兩條主線并駕齊驅(qū),拉開變革大幕

本章節(jié)所探討的AIGC應用,是以大模型為技術主體,同時涵蓋其他AIGC技術(如語音合成、策略生成)的應用范圍??傮w來看,大模型基于其在內(nèi)容生成、總結、邏輯推理等方面的能力,已在多種AI服務的技術開發(fā)環(huán)節(jié)中展開融合替代。其中,內(nèi)容生成與理解是大模型的核心能力,AIGC的產(chǎn)業(yè)價值主要體現(xiàn)在以此為核心的“變革內(nèi)容生產(chǎn)方式”與“變革人機交互方式”兩方面。大模型對內(nèi)容理解和內(nèi)容生成的雙向能力使其既能以極低門檻實現(xiàn)多模態(tài)內(nèi)容生成,也可脫離內(nèi)容生產(chǎn)核心場景泛化為一種人機對話的媒介。未來,全行業(yè)將借助大模型能力衍生出的大量AI生產(chǎn)工具,實現(xiàn)內(nèi)容生產(chǎn)效率的飛躍,并進一步降低數(shù)字生態(tài)的人機交互門檻。

生產(chǎn)力變革帶動海量下游應用優(yōu)化

生活領域充分釋放用戶創(chuàng)新能力,生產(chǎn)領域全面革新交互體驗和效率

以大模型為標志,生成式AI是一次新的技術革命,同時還具有極強的普適性,能夠?qū)θ祟惿a(chǎn)、生活的方方面面進行改造與升級。在生活領域,AIGC將通過進一步下放內(nèi)容創(chuàng)作權,激發(fā)UGC創(chuàng)作熱情,加速內(nèi)容裂變。加之社區(qū)玩法在部分內(nèi)容平臺的良好盈利表現(xiàn),內(nèi)容消費領域從技術到商業(yè)模式的路徑已全線打通,以社區(qū)形式,通過用戶自發(fā)交流自主創(chuàng)作形成粘性,是各類平臺的發(fā)力方向。在生產(chǎn)領域,大模型能從研發(fā)流程、產(chǎn)品能力和交互上全方位為企服軟件帶來提升,也充分開拓了新的服務場景,因此各類企業(yè)數(shù)字化廠商都將圍繞大模型尋找自身優(yōu)勢空間與定位。

AIGC將在全行業(yè)引發(fā)深度變革

線上化程度、數(shù)字化基礎、行業(yè)內(nèi)容占比等影響AIGC應用前景與滲透速度

總體而言,AIGC主要影響內(nèi)容創(chuàng)作與人機交互,因此價值鏈線上化程度越高,內(nèi)容在價值鏈中占比越高,AIGC對其顛覆效應越明顯;另一方面,行業(yè)自身的數(shù)據(jù)、知識、監(jiān)管要求等特點也會深刻影響到AIGC技術的滲透速度。比如電商、游戲、廣告、影視傳媒等以內(nèi)容生產(chǎn)為價值核心的行業(yè),以及電商、金融等研發(fā)設計、營銷等環(huán)節(jié)在行業(yè)價值鏈中地位較高的行業(yè),能夠快速看到AIGC應用對原有生產(chǎn)工具的替代和業(yè)務流程的變革。

內(nèi)容消費賽道:內(nèi)容分發(fā)平臺為核心的AIGC布局

現(xiàn)階段AIGC主要在UGC與PGC中進行滲透

內(nèi)容分發(fā)平臺一端鏈接創(chuàng)作者,一端綁定大量用戶,擁有最為完整的內(nèi)容消費生態(tài),也天然成為了AIGC內(nèi)容消費的布局核心。原本,內(nèi)容消費市場按照創(chuàng)作者和商業(yè)模式可大致分為PGC和UGC。PGC專業(yè)性強,以內(nèi)容付費為主要盈利模式,需要快速大量推出新內(nèi)容刺激用戶購買,因此PGC平臺的主要戰(zhàn)略是前向打通內(nèi)容制作環(huán)節(jié),并為了提高用戶粘性同步發(fā)展UGC;UGC內(nèi)容相對生活化,本質(zhì)是販賣流量,需要將內(nèi)容質(zhì)量保持在可持續(xù)吸引用戶注意力的水平。因此,兩類平臺均在積極布局面向UGC的AI創(chuàng)作工具。由于線上社交需求持續(xù)增長,社交業(yè)務也展現(xiàn)出超強的盈利能力,是內(nèi)容分發(fā)平臺變現(xiàn)的新方向,如網(wǎng)易云音樂2022年在社交娛樂板塊收入已大大超出其音樂服務收入。各大內(nèi)容平臺也都在布局社群業(yè)務,盤活手中用戶,其中應用到AIGC技術支撐的營銷文案、電商圖片甚至評論的自動生成中。此外,在各大內(nèi)容、電商平臺的后臺普遍有大量精準推薦、智能客服等系統(tǒng),平臺也在逐步使用大模型替換和補充原AI技術棧,但這部分應用并不能直接產(chǎn)生內(nèi)容消費,因而艾瑞將其歸為AIGC企業(yè)服務賽道而非AIGC內(nèi)容消費賽道。

創(chuàng)作工具賽道:模型能力為核心,文、圖發(fā)展路徑將分化

短期內(nèi)模型—應用不分家,圖像生成領域尚有模型自研機會

與傳統(tǒng)內(nèi)容創(chuàng)作工具相比,AIGC內(nèi)容創(chuàng)作工具的最大特點為“底層模型重、前端輕”,因此產(chǎn)品競爭的核心要素也從功能設計變成模型能力。在這種情況下,是否擁有自研SOTA模型將成為AIGC應用廠商的關鍵分水嶺?;诨A大模型的研發(fā)投入、使用現(xiàn)有模型開發(fā)高質(zhì)量應用的可行性這兩個核心要素來看,文本類應用和圖像類應用的發(fā)展路徑差異明顯:大語言模型成熟度高,自研壁壘高,直接基于現(xiàn)有模型開發(fā)應用更為現(xiàn)實;而圖像生成模型成熟度低,自研成本可控,因此吸引更多創(chuàng)業(yè)者聚集。

企業(yè)服務賽道:產(chǎn)品化價值與商業(yè)變現(xiàn)

AIGC融入既有應用降本效果明顯,營收增長主要依靠服務新場景

AIGC帶動中國算力產(chǎn)業(yè)發(fā)展機遇總覽

重點關注“芯片硬件、服務器、應用模式、能源散熱”等算力模塊

全球?qū)⒋罅Πl(fā)展算力基礎設施建設

算力支撐與模型需求存在gap,AIGC的大算力需求讓供需結構進一步承壓

自2017年谷歌提出Transformer架構后,人工智能發(fā)展逐步邁入預訓練大模型時代。2018年6月,OpenAI的GPT模型參數(shù)量已經(jīng)達到1.17億,模型參數(shù)量開始實現(xiàn)億級基底的飛越發(fā)展,平均每3-4個月即呈現(xiàn)翻倍態(tài)勢,由此帶來訓練算力需求也“水漲船高”。算力正在成為影響國家綜合實力和經(jīng)濟發(fā)展的關鍵性要素。浪潮信息發(fā)布的相關報告表明,計算力指數(shù)平均每提高1個點,數(shù)字經(jīng)濟和GDP將分別增長千分之3.3和千分之1.8。面對算力層的供需結構矛盾,各國積極發(fā)展算力層基礎設施建設。在計算力指數(shù)國家排名中,美國坐擁全球最多超大規(guī)模數(shù)據(jù)中心,以75分位列國家計算力指數(shù)排名第一,中國獲得66分位列第二,隨后為日本、德國、英國等國,算力建設已然成為國家高質(zhì)量發(fā)展的戰(zhàn)略級方針。2022年末,在OpenAI的GPT模型涌現(xiàn)能力后,AI產(chǎn)業(yè)迅速進入以大模型為技術支撐的AIGC時代,巨量訓推算力需求讓本就供需不平的算力產(chǎn)業(yè)結構進一步承壓。目前中國各地正加快新一批數(shù)據(jù)中心與智算建設,持續(xù)優(yōu)化算力資源,滿足未來高速發(fā)展的大算力需求。

算力產(chǎn)業(yè)模式將在AIGC時代有所演變

智能算力資源或?qū)⒏喑休d于云服務產(chǎn)品,以MaaS模式服務千行百業(yè)

過去數(shù)據(jù)中心以租賃與自建為主,算力需求方基于自身業(yè)務量級、財務預算情況、數(shù)據(jù)隱私要求等情況進行選擇租賃或自建。在AIGC時代背景下,數(shù)據(jù)中心將配置更多AI服務器滿足日益劇增的智能算力需求,云廠商更是提出MaaS(Model as a Service)模型即服務的商業(yè)模式,將云計算、智能算力、模型能力等資源做高度融合,客戶可以直接在云端調(diào)用、開發(fā)與部署模型,更好適配于客戶的個性化需求。未來,更多長尾企業(yè)的需求體量將擁抱MaaS商業(yè)模式。相較于云端算力發(fā)展,端側(cè)大模型雖然發(fā)展較緩,仍是各家終端廠商發(fā)展的技術焦點,如從蘋果招聘信息中可觀測到其對“在端側(cè)實現(xiàn)推理和加速大語言模型功能“的人才需求及產(chǎn)品規(guī)劃。未來,隨著大模型輕量級開源版本的發(fā)布,大模型有望進行進一步剪裁優(yōu)化,將推理能力部署在端側(cè),并帶動手機、機器人等端側(cè)芯片發(fā)展。

數(shù)據(jù)中心需對高速巨量運轉(zhuǎn)需求做出應對

大模型時代下,數(shù)據(jù)中心將進一步優(yōu)化網(wǎng)絡帶寬、能源消耗與散熱運維等

預訓練大模型的訓練推理需要巨量數(shù)據(jù)資源與高性能計算機的全天候高速運轉(zhuǎn),對數(shù)據(jù)中心的網(wǎng)絡帶寬、能源消耗與散熱運維等能力提出更高要求。首先,網(wǎng)絡是數(shù)據(jù)中心最為重要的組成部分,隨著數(shù)據(jù)量與計算量的飛漲,數(shù)據(jù)中心需優(yōu)化網(wǎng)絡帶寬,實現(xiàn)數(shù)據(jù)在節(jié)點內(nèi)與節(jié)點間的高吞吐低延遲的傳輸與連接,并進一步優(yōu)化計算集群的架構與設計,保證數(shù)據(jù)中心的高效利用率;其次,能源消耗與碳排放問題是數(shù)據(jù)中心亟需關注的重點問題。普通服務器的標準功耗一般在750~1200W,而AI模型運行時會產(chǎn)生更多的能耗,以CPU+AI芯片(搭載4卡/8卡)異構服務器為例,系統(tǒng)功耗一般會達到1600W~6500W。根據(jù)斯坦福大學發(fā)布的《2023年AI指數(shù)報告》數(shù)據(jù)顯示,GPT-3模型訓練耗費的電力可供一個美國家庭使用數(shù)百年,CO?排放量也相當于一個家庭排放近百年;另一方面,基于大模型算力需求的高能耗運行,其熱量釋放呈現(xiàn)倍增態(tài)勢。為了確保服務器能夠長期處于適合的工作溫度,數(shù)據(jù)中心將更注重系統(tǒng)設計和散熱技術的發(fā)展應用。大模型散熱需求加速由風冷到液冷的技術升級,進一步提升經(jīng)濟性、節(jié)能效果和散熱效率等。散熱也將更貼近發(fā)熱源,由機柜級散熱、服務器級到芯片級發(fā)展。目前,中國大力推進“東數(shù)西算” 工程,并發(fā)布《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021-2023年)》等政策性文件,引導新型數(shù)據(jù)中心實現(xiàn)集約化、高密化、智能化建設,在AIGC時代下完成中國算力產(chǎn)業(yè)在規(guī)模、網(wǎng)絡帶寬、算力利用率、綠色能源使用率等方面的全方位提升。

AI芯片是算力皇冠,關注其性能與利用率

為服務于大模型的訓推,AI芯片需進一步升級內(nèi)存、帶寬、互聯(lián)等能力

算力是評價AI芯片的核心要素,而除了運算次數(shù)外,芯片的性能衡量還需考慮運算精度?;谶\算數(shù)據(jù)精度不同,算力可分為雙精度算力(FP64)、單精度算力(FP32)、半精度算力(FP16)及整型算力(INT8、INT4)。數(shù)字位數(shù)越高,代表運算精度越高,可支持的運算復雜程度越高,以此適配更廣泛的AI應用場景。為了適配大模型的訓練及推理,AI芯片要求有更大的內(nèi)存訪問帶寬并減少內(nèi)存訪問延遲,由此帶動由GDDR到HBM的技術升級,另一方面需要更高的片間互聯(lián)甚至片內(nèi)互聯(lián)能力以滿足AI加速器訪存、交換數(shù)據(jù)的需求。最后,大集群不等于大算力,在大規(guī)模集群部署下,集群訓練會引入額外通信成本,節(jié)點數(shù)越多算力利用率越低,且單點故障影響全局運行。因此,同比增加GPU卡數(shù)或計算節(jié)點,不能線性提升算力收益,中國面臨的單卡芯片性能差距將更難通過堆料等方式解決。

中國算力產(chǎn)業(yè)將堅持自主創(chuàng)新道路

英偉達能否延續(xù)強者恒強?中國何時迎來自主創(chuàng)新芯片曙光?

作為AIGC產(chǎn)業(yè)的基建層,算力是AIGC生產(chǎn)力卡脖子的關鍵環(huán)節(jié)。對此,算力生產(chǎn)商紛紛發(fā)力,如AMD、英特爾等追趕型企業(yè)針對AIGC的產(chǎn)品新品動作頻頻。對標英偉達的Grace Hopper,AMD推出“CPU+GPU”雙架構的Instinct MI 300進軍AI訓練端。英特爾即將在2025年發(fā)布Falcon Shores GPU,將其混合架構改為純GPU解決方案。目前,國內(nèi)大模型訓練芯片仍以英偉達GPU為主,且英偉達作為首批訓推部署框架成品及平臺生態(tài)將進一步鞏固其在生成式AI的優(yōu)勢地位,但國內(nèi)客戶正積極與海內(nèi)外追趕型企業(yè)如AMD接觸,意圖打破英偉達的溢價與壟斷體系。自2018年以來,美國陸續(xù)對中國企業(yè)實行貿(mào)易管制,進入到美方黑名單上的中國企業(yè)已達到了千余家,尤其在半導體、人工智能等先進科技領域,國產(chǎn)芯片實現(xiàn)自主創(chuàng)新迫在眉睫,中國科技部也陸續(xù)出臺政策推動人工智能公共算力平臺建設。目前國產(chǎn)芯片雖在成片進度有所突破,但整體還尚未進入成熟期。以適配AIGC大模型訓練角度出發(fā),國產(chǎn)產(chǎn)品會出現(xiàn)宕機、兼容性差、AI框架支持度低及核心IP受限等過渡性問題。在AIGC浪潮下,AI芯片發(fā)展路徑更加聚焦于AISC品類,中國算力層也會進一步嘗試脫離對頭部廠商英偉達的依賴,以“云巨頭自研自用+獨立/創(chuàng)業(yè)公司服務于信創(chuàng)、運營商等To G與To B市場”為兩條主線發(fā)展路徑,靜待國產(chǎn)替代曙光,實現(xiàn)國產(chǎn)“算力+應用”的正循環(huán)。

AIGC的技術發(fā)展:科研與產(chǎn)業(yè)兩端突圍

中短期基于Transformer算法和結構優(yōu)化仍是主流,長期可能被替代

學術界將通過擴大模型參數(shù)量、調(diào)整模型結構、局部算法優(yōu)化等方式,進一步探索大模型的能力天花板,觸碰AGI可能性;以各大企業(yè)為代表的產(chǎn)業(yè)側(cè),一方面從商業(yè)化落地角度追求更小模型參數(shù)下的高模型能力維持,以及解決大模型出現(xiàn)的知識幻覺問題,一方面也在積極研發(fā)探索新模型架構可能性,呈現(xiàn)“對外模型名稱為廠商能力代號,但內(nèi)含技術架構隨時可能改變”的發(fā)展特征。產(chǎn)業(yè)與科研兩側(cè)的需求都已經(jīng)暴露標準Transformer架構的巨大瓶頸,即“不可能三角”。各大機構與開發(fā)團隊對Transformer架構的成功改進在快速推進,未來極有可能會出現(xiàn)具備推廣價值的新Transformer架構。

AIGC的應用前景:軟硬一體化

大模型低參版本的端側(cè)應用,推動手機、機器人等物聯(lián)網(wǎng)應用的升級進化

大模型在端側(cè)的應用,軟硬一體的結合帶來廣闊的應用場景。端側(cè)的應用首先需要將大模型進行剪枝、稀疏化等處理,降低參數(shù)到十億級規(guī)模,同時根據(jù)場景進行專屬知識的訓練和微調(diào)以適配專門的終端設備和軟件。這對終端設備的功耗、內(nèi)存、延遲、成本等都提出了新的要求。具體來看,目前在手機拍照、多終端語音助手、機器人具身智能(指從第一人稱視角出發(fā),具備理解、推理、并與物理世界互動的智能系統(tǒng))等方面表現(xiàn)出應用前景,推動物聯(lián)網(wǎng)應用的升級與進化。2023年8月,華為推出鴻蒙4引入盤古AI大模型,在消費電子領域賦能;小米官宣13億參數(shù)手機大模型;OPPO預計將與阿里云聯(lián)合打造OPPO大模型基礎設施。手機廠商紛紛入局輕量化手機大模型市場,以期為用戶帶來全方位智能化體驗提升,也許不久將來大模型應用將成為用戶體驗變革換代的“新觸點”。

AIGC的社會影響:新一波自動化浪潮

AI成為基礎設施,部分基礎工作被替代,社會人力結構和分配方式重塑

技術的躍遷、生產(chǎn)效率的提升并不會自然帶來社會整體福利水平的提升,相反往往以犧牲部分人的利益為前提,進而引發(fā)社會結構、分配方式的重塑。AIGC交互界面的用戶友好性、大模型開源及API價格的降低、插件服務帶來的應用生態(tài)繁榮等,都使得AI技術或?qū)⒊蔀橄袼?、電、網(wǎng)絡一樣的基礎設施,滲透并改變千行萬業(yè)。然而,大模型具有認知、分析、推理能力,不同于自動化浪潮下對藍領的沖擊,AIGC時代受AI影響最大的可能是初級專業(yè)人士和技術人員,即部分白領。據(jù)麥肯錫數(shù)據(jù)預測,到2045年左右,有50%的工作將被AI替代,比此前的估計加速了10年。與此同時,具有創(chuàng)造力、深度思考等高階智力的人才,將享受到AIGC帶來的效率優(yōu)勢,成為AI的駕馭者,相應的工作需求也會增加。智力要素重要性的提升、附加值的提高,都將推動社會資源和財富向頂尖人才和組織聚集,但社會是一個整體,生產(chǎn)效率的提升并不代表著購買力的提升,被替代的普通職工才是購買力的最大來源,為了維持供需平衡,分配制度需要重塑。如美國總統(tǒng)競選人楊安澤提出向大企業(yè)征收增值稅,并向公民發(fā)放補貼,以及OpenAI創(chuàng)始人Sam Altman提出的世界幣均等分配等,都通過反思并調(diào)整現(xiàn)有的分配方式,以驅(qū)動社會向更美好的方向演進。

AIGC的監(jiān)管展望:寬松鼓勵與整頓規(guī)范

鼓勵AIGC研究,放寬內(nèi)容容錯率,強調(diào)AI生成標識,推動公開數(shù)據(jù)建設

自AIGC逐漸應用以來,引發(fā)了知識幻覺、數(shù)據(jù)安全、個人隱私、道德倫理等諸多問題和討論,新生的行業(yè)亟需監(jiān)管措施的跟進和健康發(fā)展引導。2023年7月,網(wǎng)信辦等七個部門正式發(fā)布了《生成式人工智能服務管理暫行辦法》(以下簡稱《辦法》),距離征求意見稿發(fā)布僅隔三個月,且監(jiān)管要求更為寬松,反復強調(diào)了鼓勵發(fā)展的態(tài)度。具體來看,《辦法》主要規(guī)范公共服務環(huán)節(jié),不包含有關專業(yè)機構的研發(fā)和應用環(huán)節(jié),鼓勵企業(yè)在自研自用范圍加強技術攻關;其次,《辦法》不強求生成內(nèi)容的真實、準確性,放寬了容錯率,對前期探索的企業(yè)帶來一定利好,但同時也提高了用戶辨別的時間和成本。同時,《辦法》要求提供者對AI生成內(nèi)容進行顯著標識,有望從根本上杜絕AI生成內(nèi)容難以辨別的問題,但也可能影響用戶對內(nèi)容的價值判斷,對企業(yè)帶來負面影響。最后,國家以立法的形式打造數(shù)據(jù)和算力協(xié)同共享的平臺,最大化促進資源利用,有利于為中小型企業(yè)減負,降低研發(fā)成本?!掇k法》發(fā)布后,即引發(fā)了蘋果應用商店對ChatGPT、訊飛星火等AIGC相關App的下架整改行動,行業(yè)整頓步伐進一步加速。

中國企業(yè)人事管理| 中國企業(yè)服務研究

企業(yè)直播服務行業(yè) | 企業(yè)級無代碼開發(fā)

中國薪稅服務研究 | 中國信創(chuàng)產(chǎn)業(yè)研究

歡迎關注艾瑞數(shù)智獲取更多內(nèi)容

點擊閱讀原文

免費查看及下載PDF高清完整版報告

關鍵詞:

責任編輯:Rex_23