進(jìn)入5月,國(guó)產(chǎn)大模型的風(fēng)口非但沒有熄火,反倒越燒越旺。過去一個(gè)星期,就有多家企業(yè)發(fā)布AI大模型相關(guān)產(chǎn)品:
(資料圖片)
5月5日,網(wǎng)易有道發(fā)布了基于“子曰”大模型開發(fā)的AI口語老師劇透視頻,介紹其基于教育場(chǎng)景的類ChatGPT產(chǎn)品布局;5月6日,科大訊飛發(fā)布認(rèn)知大模型“訊飛星火”,董事長(zhǎng)劉慶峰表示有信心超越ChatGPT;同日,淘云科技發(fā)布“國(guó)內(nèi)首個(gè)”兒童認(rèn)知大模型“阿爾法蛋”……
在上述公司之外,還有很多企業(yè)宣布進(jìn)軍大模型,類ChatGPT產(chǎn)品正在密鑼緊鼓研發(fā)中,預(yù)計(jì)不久便會(huì)正式上線。企業(yè)的熱情毋庸置疑,AI大模型似乎已經(jīng)不是一條選擇題,而是必做題。
然而,狂熱背后不乏擔(dān)憂。大模型技術(shù)應(yīng)用范圍雖廣,目前落地的場(chǎng)景畢竟有限。而這群入局大模型的企業(yè),分別來自游戲、教育、動(dòng)漫等諸多行業(yè),和大模型的應(yīng)用場(chǎng)景離得很遠(yuǎn)。
當(dāng)國(guó)產(chǎn)大模型變得泛濫,我們?cè)撊绾畏直鎯?yōu)劣?
沒技術(shù)不要緊,有公司靠“外援”搗鼓大模型
要評(píng)判一個(gè)大模型的優(yōu)劣,首先看技術(shù),其中最核心的是算法和算力,即訓(xùn)練參數(shù)量。因?yàn)閰?shù)量越大,系統(tǒng)的知識(shí)面就會(huì)越廣,表現(xiàn)也會(huì)越穩(wěn)定。資料顯示,openAI在2020年推出的ChatGPT-3參數(shù)量已經(jīng)達(dá)到1750億,谷歌在一年后發(fā)布的PaLM則達(dá)到5400億,更不用說最新的ChatGPT-4了。
參照此技術(shù)標(biāo)準(zhǔn),我們可以精準(zhǔn)識(shí)別一批蹭熱點(diǎn)的企業(yè):它們要么確實(shí)拿出了產(chǎn)品,但參數(shù)量和ChatGPT等有較大差距,功能也較單一;更有甚者,套用別家公司的硬件、數(shù)據(jù)庫來預(yù)訓(xùn)練參數(shù),本身缺乏核心技術(shù)。
當(dāng)中的代表,有昆侖萬維。
4月10日,昆侖萬維宣布聯(lián)合奇點(diǎn)智源研發(fā)“天工3.5”國(guó)產(chǎn)大語言模型。根據(jù)發(fā)布會(huì)上的介紹,“天工3.5”定位為“中國(guó)第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)”的大模型產(chǎn)品,具備智能問答、聊天互動(dòng)、文本生成等多種應(yīng)用功能以及豐富的科學(xué)、技術(shù)、文化、藝術(shù)和歷史知識(shí)儲(chǔ)備。
根據(jù)官方資料,昆侖萬維最早在2020年布局AIGC業(yè)務(wù),投入數(shù)億元組建研發(fā)團(tuán)隊(duì)。去年12月,“昆侖天工”首次亮相,初代產(chǎn)品提供圖像、音樂、文本及代碼AI生成功能。作為對(duì)比,大模型領(lǐng)頭羊 openAI在2019年發(fā)布ChatGPT-1,每一代產(chǎn)品的研發(fā)周期都在一年左右。
乍一看,昆侖萬維的“天工3.5”功能全面對(duì)標(biāo)ChatGPT,比起百度“文心一言”、阿里“通義千問”等國(guó)產(chǎn)大模型毫不遜色。在研發(fā)速度上,昆侖萬維也領(lǐng)先于大多數(shù)國(guó)內(nèi)同行。不過昆侖萬維的缺點(diǎn)也很突出——“天工3.5”是和阿里云合作的產(chǎn)物,后者的參數(shù)、硬件設(shè)備幫了昆侖萬維很大忙。
事實(shí)上,昆侖萬維一直抱緊阿里云的大腿。資料顯示,過去幾年昆侖萬維的海外數(shù)據(jù)基本都在使用阿里云公有云儲(chǔ)存服務(wù),2020年布局AIGC時(shí)也是在阿里云的協(xié)助下建立算力集群。在“天工3.5”發(fā)布后,還有媒體爆出昆侖萬維缺乏文本生成、數(shù)據(jù)處理專利的消息,和百度、阿里形成鮮明對(duì)比。
同樣遭遇技術(shù)質(zhì)疑的,還有“AI四小龍”之一的商湯科技。
商湯科技在4月10日發(fā)布了自研大模型系統(tǒng)“日日新SenseNova”,內(nèi)含AI數(shù)字人視頻生成平臺(tái)“如影”,3D內(nèi)容生成平臺(tái)“瓊宇”和“格物”,類ChatGPT產(chǎn)品“SenseChat”等產(chǎn)品。別人都是發(fā)布單個(gè)產(chǎn)品,商湯科技一次過拿出一套“全家桶”,可見其野心之大。
然而,商湯的大模型全家桶在發(fā)布那天就有翻車跡象。演示視頻公布后,就有媒體和網(wǎng)友發(fā)現(xiàn)商湯“妙畫”生成的圖片和AI網(wǎng)站Civitai的圖片撞車,甚至還有來自Civitai的文字注釋。SenseChat則在一些基礎(chǔ)問題上表達(dá)含糊不清,其訓(xùn)練參數(shù)量也遭到質(zhì)疑。
在價(jià)值研究所看來,缺乏數(shù)據(jù)源,是昆侖萬維和商湯科技共同的命門。
“文心一言”背后有百度的海量搜索數(shù)據(jù)和語料庫,阿里的“通義千問”則有來自電商、云計(jì)算等領(lǐng)域的語料庫,流量大、用戶覆蓋面廣,能提供足夠的參數(shù)。缺乏面向C端用戶的通用產(chǎn)品、沒有參數(shù)積累,強(qiáng)行上馬大模型,昆侖萬維和商湯科技的尷尬處境完全可以預(yù)料。
沒應(yīng)用場(chǎng)景又如何?這些企業(yè)硬要和AI攀關(guān)系
除了缺乏核心技術(shù)、產(chǎn)品缺陷明顯的昆侖萬維等企業(yè),另一類企業(yè)的行為更讓人迷惑:在缺乏應(yīng)用場(chǎng)景的情況下,硬要給自身產(chǎn)品貼上大模型標(biāo)簽、 “硬蹭”熱點(diǎn)。
這一類企業(yè),以專注C端服務(wù)的互聯(lián)網(wǎng)公司為主,尤其是近年來處境不佳的教育、科技金融、游戲公司。
比如專注于智能教育硬件研發(fā)的淘云科技,在5月6日發(fā)布了首個(gè)兒童認(rèn)知大模型“阿爾法兒童認(rèn)知大模型”和GPT機(jī)器人,并宣布把平臺(tái)的兒童原始語料加入科大訊飛的“訊飛星火”大模型中。同樣來自教育領(lǐng)域的學(xué)而思,也在近日宣布研發(fā)數(shù)學(xué)大模型MathGPT,目前已取得階段性成果,預(yù)計(jì)年內(nèi)推出。
這類企業(yè)最大的問題在于,大模型的應(yīng)用場(chǎng)景、目標(biāo)用戶和它們的業(yè)務(wù)有巨大差異。強(qiáng)推大模型,根本無法為它們的用戶帶來多少幫助。
根據(jù)淘云科技董事長(zhǎng)劉慶升的說法,“阿爾法兒童認(rèn)知大模型”基于兒童場(chǎng)景提供更貼近幼兒理解力的生成式內(nèi)容,讓兒童用戶在輕松的氛圍下積累新知識(shí)。問題在于,類ChatGPT應(yīng)用仍無法保證100%準(zhǔn)確率,常識(shí)性的錯(cuò)誤屢見不鮮。對(duì)于認(rèn)知能力有限的兒童來說,并不穩(wěn)定的大模型反倒可以帶來反作用。
當(dāng)然,上面這些公司蹭熱點(diǎn)的目的雖然很明確,但好歹拿出了實(shí)打?qū)嵉漠a(chǎn)品或規(guī)劃。還有一些企業(yè),不僅業(yè)務(wù)場(chǎng)景和大模型相去甚遠(yuǎn),甚至還沒有拿出實(shí)際產(chǎn)品就開始往自己臉上貼金。
比如定位于“國(guó)漫IP孵化平臺(tái)和漫畫分享社區(qū)”的快看漫畫,就在4月27日宣布成立AIGC事業(yè)部。創(chuàng)始人兼CEO陳安妮更是在內(nèi)部信中表示,AI將會(huì)給內(nèi)容產(chǎn)業(yè)帶來“顛覆式”生態(tài)變革。
再比如最近一邊搗鼓直播電商、一邊忙著進(jìn)軍本地生活的小紅書,也沒忘記籌備大模型團(tuán)隊(duì)。根據(jù)36氪報(bào)道,小紅書在今年3月開始組建研發(fā)團(tuán)隊(duì),主要成員來自廣告NLP技術(shù)部門。4月,小紅書悄悄上線了一款名為“Trik”的AI創(chuàng)作應(yīng)用,主打AI繪畫,但沒有大規(guī)模宣傳,至今沒有引發(fā)多少關(guān)注。
總的來說,這兩類企業(yè)的大模型布局都經(jīng)不起推敲。但蹭上大模型風(fēng)口,確實(shí)為其帶來了可觀的流量,也掀起資本市場(chǎng)的狂歡。前面提到昆侖萬維,在發(fā)布“天工3.5”次日股價(jià)暴漲16%?;蛟S正因?yàn)槭袌?chǎng)過于狂熱,才會(huì)反過來迫使這些企業(yè)主動(dòng)迎合熱點(diǎn)。
可惜這種熱度是無法持續(xù)的,而且還會(huì)遭到監(jiān)管機(jī)構(gòu)的重點(diǎn)關(guān)照。在“天工3.5”發(fā)布次日,昆侖萬維就收到了深交所的關(guān)注函,要求前者結(jié)合項(xiàng)目研發(fā)進(jìn)度、行業(yè)政策風(fēng)險(xiǎn)、對(duì)公司財(cái)務(wù)的影響等情況,說明該業(yè)務(wù)可能面臨的風(fēng)險(xiǎn)。
雖然深交所沒有把話挑明,但明眼人都看得出這封關(guān)注函寫滿對(duì)昆侖萬維蹭熱點(diǎn)的懷疑。在價(jià)值研究所看來,蹭熱點(diǎn)的行為正在損壞行業(yè)生態(tài)。給大模型降降火、讓市場(chǎng)回歸理性,對(duì)踏實(shí)搞研發(fā)的企業(yè)來說非常重要。
追趕ChatGPT,一場(chǎng)艱苦的馬拉松競(jìng)賽
不可否認(rèn),除了上面這些蹭熱點(diǎn)的公司外,國(guó)內(nèi)有不少企業(yè)在認(rèn)真打磨大模型產(chǎn)品,也有一定的技術(shù)積累和豐富的應(yīng)用場(chǎng)景。不過從百度、阿里,再到360,幾乎所有頭部企業(yè)都承認(rèn)自己的技術(shù)不如openAI的ChatGPT。
5月7日,周鴻祎應(yīng)邀來到東方甄選直播間,和俞敏洪、董宇輝大談國(guó)內(nèi)的大模型創(chuàng)業(yè)熱潮。周鴻祎直言,openAI比國(guó)內(nèi)企業(yè)領(lǐng)先至少兩年,國(guó)產(chǎn)大模型有機(jī)會(huì)在一年內(nèi)追上ChatGPT-3.5,但openAI已經(jīng)開始訓(xùn)練ChatGPT-5了。
“上來就說能超越ChatGPT,那叫吹牛?!?/p>
周鴻祎最后這番話,不少媒體認(rèn)為是在影射5月6日發(fā)布“訊飛星火”認(rèn)知大模型的科大訊飛??拼笥嶏w董事長(zhǎng)劉慶峰在發(fā)布會(huì)上表示,“訊飛星火”在文本生成、知識(shí)問答、數(shù)學(xué)能力上已經(jīng)超過ChatGPT,目標(biāo)是到今年10月,通用認(rèn)知能力對(duì)標(biāo)ChatGPT,并在中文上超越ChatGPT。
周鴻祎是否意有所指不得而知,可以肯定的是,投資者、用戶對(duì)國(guó)產(chǎn)大模型的耐心正在流失,要求變得更加苛刻,外部的競(jìng)爭(zhēng)也更加激烈——留給國(guó)產(chǎn)大模型的時(shí)間已經(jīng)不多了。
5月4日,微軟宣布Bing預(yù)覽版全面開放,該系統(tǒng)此前已接入openAI的ChatGPT-4;一天后,谷歌也宣布向所有擁有Wordspace賬號(hào)的用戶開放Bard AI工具訪問權(quán)限。
微軟和谷歌先后走向開放,意味著新一輪用戶爭(zhēng)奪戰(zhàn)正式打響。一旦它們滲透進(jìn)國(guó)內(nèi)市場(chǎng),面對(duì)技術(shù)上的差距,國(guó)產(chǎn)大模型并沒有太多應(yīng)對(duì)方法。比起那群蹭熱點(diǎn)的企業(yè),追趕openAI的骨干力量更值得我們關(guān)注——特別是百度、阿里、騰訊三巨頭,周鴻祎治下的360,疑似被其揶揄的科大訊飛實(shí)力也不容小覷。
這幾家公司的優(yōu)勢(shì)是相似的:雄厚的資金儲(chǔ)備;擁有諸多面向用戶的產(chǎn)品/服務(wù),語料庫十分豐富;主營(yíng)業(yè)務(wù)貼近大模型應(yīng)用場(chǎng)景,如百度和360的搜索,騰訊的社交媒體,阿里的云計(jì)算和電商,科大訊飛的智慧辦公等。現(xiàn)階段,這些企業(yè)的產(chǎn)品距離ChatGPT當(dāng)然還有一定差距,但并非沒有追趕的機(jī)會(huì)。
要知道,即便是技術(shù)領(lǐng)跑全行的openAI,也有自己的苦惱。過去一年,隨著ChatGPT走紅openAI的估值也是一路走高,成為全球范圍內(nèi)升值最快的獨(dú)角獸——可惜隨之飆升的,還有虧損額。
據(jù)外媒報(bào)道,openAI上一財(cái)年凈虧損達(dá)到5.4億美元,同比幾乎放大一倍。每一次預(yù)訓(xùn)練參數(shù)都要耗費(fèi)巨資,要提升系統(tǒng)穩(wěn)定性又必須不斷加大參數(shù)量和預(yù)訓(xùn)練頻次,虧損自然成為無解難題。國(guó)盛證券的研報(bào)指出,通過測(cè)算,2800億參數(shù)量的大模型預(yù)訓(xùn)練成本約為200萬美元/次,谷歌的PaLM號(hào)稱擁有5400億參數(shù),單次預(yù)訓(xùn)練成本將高達(dá)1200萬美元。
今年2月推出的付費(fèi)版ChatGPT和其他商業(yè)化嘗試收效甚微,短時(shí)間內(nèi)不可能覆蓋預(yù)訓(xùn)練所需成本。CEO Sam Altman曾暗示,公司未來幾年可能需要籌集約1000億美元的資金,才能進(jìn)一步提升技術(shù),打磨下一代產(chǎn)品。
openAI的經(jīng)歷表明,AI大模型研發(fā)如同一場(chǎng)漫長(zhǎng)且艱難的馬拉松——不要總是奢望彎道超車,踏踏實(shí)實(shí)和參數(shù)打交道是成功的基礎(chǔ)。
水能載舟亦能覆舟,狂熱的市場(chǎng)氛圍既給企業(yè)帶來了資金和關(guān)注度,也帶來了難以預(yù)估的風(fēng)險(xiǎn)。近段時(shí)間,證監(jiān)會(huì)等監(jiān)管機(jī)構(gòu)已經(jīng)加大管控力度,不少公司也主動(dòng)出面自證清白:據(jù)不完全統(tǒng)計(jì),4月底至今已有世紀(jì)天鴻、萬興科技、中科信息、唐德影視等多家上市企業(yè)發(fā)布股票交易異常波動(dòng)公告,澄清自身業(yè)務(wù)和AI、大模型的關(guān)系。
經(jīng)過移動(dòng)互聯(lián)時(shí)代的洗禮,蹭熱點(diǎn)、追風(fēng)口的情況太過常見了。似乎任何一個(gè)風(fēng)口都逃不過從萌芽到爆發(fā),再走向混亂、重塑秩序的過程。但在亂戰(zhàn)過后,有的風(fēng)口出清泡沫、置之死地而后生;有的賽道卻徹底沉淪,如一顆流星般結(jié)束自己絢爛卻短暫的一生。
走在時(shí)代前沿的AI大模型,似乎更有可能成為前者,不過需要所有從業(yè)者、監(jiān)管機(jī)構(gòu)的共同努力才能保證健康發(fā)展。大模型是一條技術(shù)門檻、資金門檻都很高的賽道,蹭熱點(diǎn)的企業(yè)注定無法長(zhǎng)久。加強(qiáng)監(jiān)管、凈化行業(yè)環(huán)境、驅(qū)逐不良玩家可能會(huì)帶來短期混亂,但對(duì)行業(yè)的長(zhǎng)期發(fā)展肯定是有益的。
凡本網(wǎng)注明“XXX(非汪清新聞網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和其真實(shí)性負(fù)責(zé)。
今天,在中央第一環(huán)境保護(hù)督察組向吉林省反饋督察情況后,省委書記巴音朝魯立即主持召開省委常委會(huì)議,聽取關(guān)于中央環(huán)保督察反饋問題整改工
2017-12-29 14:30
新浪科技訊 12月28日消息,由空間瞭望智庫、《國(guó)際太空》和《衛(wèi)星應(yīng)用》雜志,以及中國(guó)太空網(wǎng)聯(lián)合組織的2017年全球十大航天新聞和中國(guó)十大
2017-12-28 21:47
保潔人員先用馬桶刷子刷茶杯,隨后用同一把馬桶刷子刷馬桶。緊接著,她用浴巾擦杯子,再蘸了馬桶水擦地,最后將浴巾放在地上整理。馬桶刷刷
2017-12-28 21:12
近日,國(guó)家發(fā)改委、住建部、商務(wù)部、工信部、交通部等部委密集召開年度工作會(huì)議,貫徹落實(shí)中央經(jīng)濟(jì)工作會(huì)議精神,部署2018年的重點(diǎn)工作,在
2017-12-27 21:40
根據(jù)中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)的《生態(tài)文明建設(shè)目標(biāo)評(píng)價(jià)考核辦法》和國(guó)家發(fā)展改革委、國(guó)家統(tǒng)計(jì)局、環(huán)境保護(hù)部、中央組織部印發(fā)的《
2017-12-26 16:34
21年前的12月25日,這一天是圣誕節(jié),雖然是西方的節(jié)日,但隨著夜幕降臨,歡樂的節(jié)日氣氛也隨之而來。當(dāng)晚,八點(diǎn)多鐘,長(zhǎng)春市寬城區(qū)的一家藥
2017-12-15 22:18
十九大報(bào)告再次明確創(chuàng)新的地位:創(chuàng)新是引領(lǐng)發(fā)展的第一動(dòng)力,是建設(shè)現(xiàn)代化經(jīng)濟(jì)體系的戰(zhàn)略支撐。2017年,我省創(chuàng)新成果豐碩,形成了跟跑、齊跑
2017-12-12 10:34
每到關(guān)鍵節(jié)點(diǎn),人們總是根據(jù)一些重要信號(hào)來判斷一項(xiàng)工作的走勢(shì)。十九大閉幕后的首月,人們熟悉的打虎節(jié)奏和信息如約而至,中央紀(jì)委監(jiān)察部網(wǎng)
2017-12-08 12:32
長(zhǎng)春、通化、白山、遼源入選東北地區(qū)民營(yíng)經(jīng)濟(jì)發(fā)展改革示范城市,在政策環(huán)境、金融環(huán)境、創(chuàng)新環(huán)境、促進(jìn)民營(yíng)經(jīng)濟(jì)轉(zhuǎn)型升級(jí)及人才隊(duì)伍建設(shè)等方
2017-12-08 12:21
11月,全國(guó)300城市土地市場(chǎng)供求回落,但各線城市土地成交均價(jià)環(huán)同比繼續(xù)上漲。綜合前11個(gè)月來看,年度土地出讓收入整體保持同比上漲勢(shì)態(tài)。6
2017-12-07 18:43