21世紀(jì)經(jīng)濟(jì)報(bào)道 記者郭美婷 蔡姝越 實(shí)習(xí)生胡暄悅 麥子浩 廣州、上海報(bào)道
(資料圖片)
編者按:
在2023年過(guò)去的幾個(gè)月里,各大公司搶灘大模型、GPT商用化探索、算力基礎(chǔ)設(shè)施看漲……如同15世紀(jì)開(kāi)啟的大航海時(shí)代,人類交往、貿(mào)易、財(cái)富有了爆炸性增長(zhǎng),空間革命席卷全球。變革同時(shí),也帶來(lái)了秩序的挑戰(zhàn),數(shù)據(jù)泄露、個(gè)人隱私風(fēng)險(xiǎn)、著作權(quán)侵權(quán)、虛假信息......此外,AI帶來(lái)的后人類主義危機(jī)已然擺在桌面,人們?cè)撘院畏N姿態(tài)迎接人機(jī)混雜帶來(lái)的迷思?
此刻,尋求AI治理的共識(shí)、重塑新秩序成了各國(guó)共同面對(duì)的課題。南財(cái)合規(guī)科技研究院將推出AI契約論系列報(bào)道,從中外監(jiān)管模式、主體責(zé)任分配、語(yǔ)料庫(kù)數(shù)據(jù)合規(guī)、AI倫理、產(chǎn)業(yè)發(fā)展等維度,進(jìn)行剖析,以期為AI治理方案提供一些思路,保障負(fù)責(zé)任的創(chuàng)新。
在AIGC高速成長(zhǎng)的浪潮下,其關(guān)聯(lián)產(chǎn)業(yè)鏈上的各環(huán)節(jié)均在醞釀著一場(chǎng)技術(shù)“質(zhì)變”。
“賣鏟人”英偉達(dá)近期成了這波技術(shù)浪潮下的最大贏家之一。由于其主營(yíng)產(chǎn)品GPU(圖形處理器)在生成式AI應(yīng)用中提供不可或缺的底層硬件動(dòng)力,英偉達(dá)在近日交出的一季報(bào)中預(yù)測(cè),其在2024財(cái)年Q2的銷售額或?qū)⑦_(dá)到110億美元。年初至今,這家美國(guó)公司股價(jià)漲幅已猛增166%,市值逼近萬(wàn)億。
“這一切的引爆點(diǎn)皆是生成式AI技術(shù)。”英偉達(dá)CEO黃仁勛在接受媒體采訪時(shí)表示。他同時(shí)指出,目前,CPU(中央處理器)的發(fā)展速度已經(jīng)放緩,加速計(jì)算(Accelerated Computing)成為了未來(lái)探索的大方向。
“緊接著,殺手級(jí)應(yīng)用出現(xiàn)了。”黃仁勛說(shuō)。
回過(guò)頭來(lái)看,今年以來(lái),各路AI大模型紛紛涌現(xiàn),搭載大模型的ChatGPT、Bard、New Bing、文心一言、通義千問(wèn)等生成式AI應(yīng)用亦層出不窮。
雖然這些應(yīng)用是否已成為“Killer App”還有待商榷,但不可否認(rèn)的是,ChatGPT在推出僅兩月后便交出了日活突破1億的成績(jī)單,足以證明AIGC應(yīng)用的商業(yè)價(jià)值和發(fā)展前景已被市場(chǎng)認(rèn)可。
不過(guò),盡管生成式AI技術(shù)以革新產(chǎn)業(yè)的面貌席卷了科技界,催化了生產(chǎn)流程升級(jí)轉(zhuǎn)型,行業(yè)也在密切關(guān)注,在這項(xiàng)技術(shù)“野蠻生長(zhǎng)”的背后,它的產(chǎn)業(yè)鏈具體是由哪些環(huán)節(jié)構(gòu)成?在各層級(jí)產(chǎn)業(yè)鏈深入探索這項(xiàng)技術(shù)的過(guò)程中,可能會(huì)遇上哪些“暗礁”?
嚴(yán)格來(lái)說(shuō),業(yè)內(nèi)熱議的AI大模型實(shí)際上分為兩類:決策式AI和生成式AI。
決策式AI主要應(yīng)用于推薦系統(tǒng)和風(fēng)控系統(tǒng)的輔助決策、用于自動(dòng)駕駛和機(jī)器人的決策智能體,生成式AI則通過(guò)學(xué)習(xí)歸納已有數(shù)據(jù)后生成全新的內(nèi)容,也能解決判別問(wèn)題。而掀起這輪AI技術(shù)浪潮的正是后者。
“AIGC”又稱“生成式AI”(Generative AI)AIGC(AI-Generated Content)即人工智能自動(dòng)生成內(nèi)容,被認(rèn)為是繼專業(yè)生產(chǎn)內(nèi)容(PGC)、用戶生產(chǎn)內(nèi)容(UGC)之后的新型內(nèi)容創(chuàng)作方式。其萌芽可以追溯到上世紀(jì)50年代。
彼時(shí),人們開(kāi)始探索如何利用人工智能技術(shù)來(lái)生成各種類型的內(nèi)容,但受制于所在時(shí)代的科技水平,AIGC的應(yīng)用始終停留在實(shí)驗(yàn)室中。
2006年,深度學(xué)習(xí)算法取得巨大突破。接下來(lái)人工智能技術(shù)的持續(xù)進(jìn)步,AIGC逐漸被應(yīng)用于電影、游戲、音樂(lè)等多個(gè)領(lǐng)域,并在2021年底ChatGPT的嶄露頭角而進(jìn)入大規(guī)模爆發(fā)時(shí)代。
發(fā)展至今, AIGC產(chǎn)業(yè)鏈已經(jīng)逐漸成形。業(yè)內(nèi)普遍將其分為四層架構(gòu):數(shù)據(jù)層、算力層、算法/模型層、商業(yè)化應(yīng)用層。
(AIGC產(chǎn)業(yè)鏈圖譜。制圖/南財(cái)合規(guī)科技研究院、21世紀(jì)經(jīng)濟(jì)報(bào)道記者)
數(shù)據(jù)層包括數(shù)據(jù)提供、數(shù)據(jù)分析以及標(biāo)注等環(huán)節(jié)。AIGC的誕生需要海量的數(shù)據(jù)資源,公開(kāi)資料顯示,ChatGPT基于8000億個(gè)單詞的語(yǔ)料庫(kù)(或45TB的文本數(shù)據(jù)),包含了1750億個(gè)參數(shù)。8000億是ChatGPT的訓(xùn)練數(shù)據(jù),1750億是它從這些訓(xùn)練數(shù)據(jù)中所學(xué)習(xí)、沉淀下來(lái)的內(nèi)容。
算力層指AI訓(xùn)練的基礎(chǔ)設(shè)施,包括數(shù)據(jù)中心、服務(wù)器,以及高性能的AI芯片。據(jù)華泰證券測(cè)算,訓(xùn)練一次ChatGPT模型(13億參數(shù))需要的算力約27.5PFlop/s-day,即以1萬(wàn)億次每秒的速度進(jìn)行計(jì)算,需要耗時(shí)27.5天;而ChatGPT單月運(yùn)營(yíng)需要算力約4874.4PFlop/s-day。
算法/模型層主要包括自然語(yǔ)言處理(NLP)、計(jì)算機(jī)視覺(jué)(CV)、音視頻、多模態(tài)等各種大模型和算法。當(dāng)前,國(guó)內(nèi)正在上演“百模大戰(zhàn)”,百度、阿里巴巴、騰訊等大廠紛紛在大模型領(lǐng)域持續(xù)發(fā)力。
商業(yè)化應(yīng)用層則涵蓋文本、音頻、圖片、影片的生成等,目前更多地與互聯(lián)網(wǎng)行業(yè)結(jié)合,未來(lái)或?qū)⑦M(jìn)一步賦能傳統(tǒng)行業(yè)的數(shù)字化轉(zhuǎn)型。
人工智能公司亮風(fēng)臺(tái)高級(jí)產(chǎn)品總監(jiān)魏超群告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,若將AIGC整體產(chǎn)業(yè)鏈架構(gòu)比作一家工廠,那么生產(chǎn)的原材料就是大數(shù)據(jù),算力充當(dāng)著日夜運(yùn)轉(zhuǎn)的機(jī)器,算法或模型是忙忙碌碌的工人,最終生產(chǎn)出來(lái)的產(chǎn)品是AIGC在各場(chǎng)景下的應(yīng)用。
“這幾個(gè)層次相互制約、相互促進(jìn)?!?/strong>魏超群提到,從發(fā)展歷程來(lái)看,最初制約AI發(fā)展的是算力上的不足,在算力獲得突破后,模型才得以繼續(xù)訓(xùn)練。后來(lái),算法又成為了瓶頸,而數(shù)據(jù)是破題良方。隨著喂養(yǎng)數(shù)據(jù)量的提高,算法的性能也隨之提升。
因此,AIGC的火熱出圈,也為其背后的產(chǎn)業(yè)鏈打開(kāi)了一片市場(chǎng)。據(jù)東吳證券預(yù)計(jì),AIGC在內(nèi)容生成中的滲透率將快速提升,應(yīng)用規(guī)??焖贁U(kuò)增,預(yù)計(jì)2030年AIGC市場(chǎng)規(guī)模將超過(guò)萬(wàn)億元人民幣。
新的機(jī)遇已然出現(xiàn)。“雖然目前產(chǎn)業(yè)鏈的部分賽道已經(jīng)形成了贏者通吃的局面,如CPU和GPU的行業(yè)龍頭已經(jīng)出現(xiàn)。在大模型層面,各家的優(yōu)劣還無(wú)法做出比較,估計(jì)未來(lái)也很難形成贏者通吃的局面,因?yàn)楣雀璋l(fā)展多年的AI,結(jié)果最后被微軟超過(guò)了。所以目前市場(chǎng)的局面還不太明朗?!蔽撼罕硎?。
除了目前仍處于風(fēng)口浪尖的AI大模型的開(kāi)發(fā)外,亮風(fēng)臺(tái)預(yù)判,算力基礎(chǔ)設(shè)施企業(yè)跟隨著AI行業(yè)發(fā)展,能夠保持一定增長(zhǎng),但不會(huì)為非常熱門(mén)的投資方向,其盈利能力也較為有限。但AI大模型的提升亟需更加精準(zhǔn)的數(shù)據(jù),從事數(shù)據(jù)清洗、轉(zhuǎn)換、分類等的企業(yè)也可能成為下一個(gè)風(fēng)口。
單從技術(shù)上看,天使投資人、知名互聯(lián)網(wǎng)專家郭濤認(rèn)為,我國(guó)硬件基礎(chǔ)設(shè)施發(fā)展迅速,政策支持和資金扶持力度都較大,但技術(shù)發(fā)展相對(duì)歐美仍有一定落后。當(dāng)然,在某些垂直領(lǐng)域,如人臉識(shí)別等大規(guī)模應(yīng)用場(chǎng)景和生態(tài)支撐相關(guān)的技術(shù),我國(guó)又是超前的。同時(shí),我國(guó)的應(yīng)用落地速度也更快,AIGC的技術(shù)在客服、數(shù)字人、制造、設(shè)計(jì)等領(lǐng)域已經(jīng)有一定規(guī)模的應(yīng)用。
另外,AI大模型和大數(shù)據(jù)處理分別作為當(dāng)下和未來(lái)下一個(gè)行業(yè)風(fēng)口,同時(shí)也是最容易帶來(lái)安全和倫理風(fēng)險(xiǎn)的環(huán)節(jié)。
多位受訪專家提到了數(shù)據(jù)層的數(shù)據(jù)安全和隱私保護(hù)問(wèn)題。而訓(xùn)練數(shù)據(jù)的不合規(guī),也往往將進(jìn)一步引發(fā)后續(xù)模型及其所生成內(nèi)容的倫理風(fēng)險(xiǎn)。
北京大成律師事務(wù)所高級(jí)合伙人肖颯認(rèn)為,當(dāng)前數(shù)據(jù)層根據(jù)AI在訓(xùn)練、測(cè)試、生成等階段受到監(jiān)管規(guī)定的不同,而存在不同的風(fēng)險(xiǎn)和義務(wù)。數(shù)據(jù)收集時(shí),存在侵犯?jìng)€(gè)人信息或他人數(shù)據(jù)權(quán)益的風(fēng)險(xiǎn);在數(shù)據(jù)處理階段,存在使用、泄漏商業(yè)秘密之風(fēng)險(xiǎn);在數(shù)據(jù)跨境階段,存在數(shù)據(jù)跨境流通違法的風(fēng)險(xiǎn)。
北京理工大學(xué)法學(xué)院助理教授裴軼則向21記者指出,與互聯(lián)網(wǎng)平臺(tái)中的“推薦算法”不同,生成式算法可以從頭開(kāi)始生成全新的數(shù)據(jù),而不僅僅是基于已有數(shù)據(jù)的推薦或預(yù)測(cè),通常需要大量的訓(xùn)練數(shù)據(jù)來(lái)學(xué)習(xí)數(shù)據(jù)的分布。
這種特性給AIGC產(chǎn)業(yè)鏈上的企業(yè)及消費(fèi)者均帶來(lái)了不確定性。對(duì)于利用AI大模型生成內(nèi)容的消費(fèi)者而言,由于AIGC生成的內(nèi)容可能缺乏人工審核和驗(yàn)證,存在信息準(zhǔn)確性和可信度的問(wèn)題,可能對(duì)消費(fèi)者造成誤導(dǎo)和損害;同時(shí),在AIGC應(yīng)用中,消費(fèi)者的個(gè)人信息可能被用于生成個(gè)性化內(nèi)容。這可能涉及到個(gè)人隱私和數(shù)據(jù)安全的風(fēng)險(xiǎn),例如未經(jīng)授權(quán)的數(shù)據(jù)收集、濫用個(gè)人信息等;此外,AIGC算法的訓(xùn)練數(shù)據(jù)和算法本身可能存在偏見(jiàn),導(dǎo)致生成的內(nèi)容偏向特定人群或產(chǎn)生歧視性結(jié)果。這可能對(duì)用戶的體驗(yàn)、公平性和社會(huì)平等性產(chǎn)生負(fù)面影響。
面向企業(yè),裴軼表示,企業(yè)在使用AIGC技術(shù)時(shí),需要確保遵守適用的法律法規(guī),尤其是涉及用戶數(shù)據(jù)和隱私保護(hù)的規(guī)定;此外,企業(yè)應(yīng)對(duì)使用AIGC技術(shù)所產(chǎn)生的內(nèi)容質(zhì)量和準(zhǔn)確性承擔(dān)責(zé)任,如果生成的內(nèi)容存在錯(cuò)誤、冒犯性言論或不當(dāng)信息,可能損害企業(yè)的形象和聲譽(yù);版權(quán)和知識(shí)產(chǎn)權(quán)同樣值得關(guān)注,使用AIGC技術(shù)生成的內(nèi)容可能涉及他人的版權(quán)和知識(shí)產(chǎn)權(quán);最后,還要關(guān)注AIGC技術(shù)應(yīng)用過(guò)程中可能存在的人工智能失控的風(fēng)險(xiǎn),如果算法出現(xiàn)錯(cuò)誤、意外的結(jié)果或者被濫用,可能導(dǎo)致不可預(yù)見(jiàn)的后果和潛在的法律責(zé)任。
(AIGC各產(chǎn)業(yè)鏈環(huán)節(jié)中可能存在的風(fēng)險(xiǎn)。制圖/南財(cái)合規(guī)科技研究院、21世紀(jì)經(jīng)濟(jì)報(bào)道記者)
統(tǒng)籌:王俊
記者:郭美婷 蔡姝越 胡暄悅 麥子浩
制圖:蔡姝越
凡本網(wǎng)注明“XXX(非汪清新聞網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和其真實(shí)性負(fù)責(zé)。
在2023年過(guò)去的幾個(gè)月里,各大公司搶灘大模型、GPT商用化探索、算力基礎(chǔ)設(shè)施看漲……如同15世紀(jì)開(kāi)啟的大航
2023-05-31 20:16
來(lái)源:5月31日《新華每日電訊》作者:新華每日電訊記者 張建松5月30日,長(zhǎng)征二號(hào)F遙十六運(yùn)載火箭點(diǎn)火起
2023-05-31 19:13
孩子王公告,全資子公司天津童聯(lián)供應(yīng)鏈管理有限公司擬投資不超過(guò)人民幣6億元建設(shè)“孩子王華北智慧物流基地
2023-05-31 18:29
1、板材的應(yīng)用范圍很廣,板材的作用很多,可以看見(jiàn)不管是家裝還是公裝都有板材的身影,畢竟板材的種類還是
2023-05-31 14:57
1、沒(méi)有關(guān)系的。2、只需要你通過(guò)司法考試證明你具有專業(yè)知識(shí),然后在律所實(shí)習(xí)滿一年并由律所開(kāi)具你已經(jīng)實(shí)習(xí)
2023-05-31 14:32
海南省七屆人大二次會(huì)議勝利閉幕馮飛當(dāng)選海南省人大常委會(huì)主任劉小明當(dāng)選海南省省長(zhǎng)5月31日上午,海南省第
2023-05-31 13:57
大家好,董興泉,關(guān)于董興泉的簡(jiǎn)介很多人還不知道,現(xiàn)在讓我們一起來(lái)看看吧!1、董興泉,筆名遼河雁、千里
2023-05-31 13:34
記者張晨為準(zhǔn)確適用法律,規(guī)范人民法院開(kāi)展家庭教育指導(dǎo)工作,切實(shí)保護(hù)未成年人,最高人民法院會(huì)同全國(guó)婦聯(lián)
2023-05-31 13:12
截至2022年底,中國(guó)網(wǎng)絡(luò)文學(xué)海外市場(chǎng)規(guī)模超過(guò)30億元,累計(jì)向海外輸出網(wǎng)文作品16000余部,海外用戶超1 5億人
2023-05-31 12:54
2023年5月30日,神舟十六號(hào)載人飛船成功發(fā)射并??恐袊?guó)空間站徑向?qū)涌?,?biāo)志著我國(guó)空間交會(huì)對(duì)接GNC(制導(dǎo)
2023-05-31 12:36