您現(xiàn)在的位置：首頁 > 文章 > 正文

瘋狂的大模型：蹭熱點的多，真能打的鳳毛麟角

時間：2023-05-08 19:15:26 來源：鈦媒體APP

進入5月，國產大模型的風口非但沒有熄火，反倒越燒越旺。過去一個星期，就有多家企業(yè)發(fā)布AI大模型相關產品：

(資料圖片)

5月5日，網(wǎng)易有道發(fā)布了基于“子曰”大模型開發(fā)的AI口語老師劇透視頻，介紹其基于教育場景的類ChatGPT產品布局；5月6日，科大訊飛發(fā)布認知大模型“訊飛星火”，董事長劉慶峰表示有信心超越ChatGPT；同日，淘云科技發(fā)布“國內首個”兒童認知大模型“阿爾法蛋”……

在上述公司之外，還有很多企業(yè)宣布進軍大模型，類ChatGPT產品正在密鑼緊鼓研發(fā)中，預計不久便會正式上線。企業(yè)的熱情毋庸置疑，AI大模型似乎已經(jīng)不是一條選擇題，而是必做題。

然而，狂熱背后不乏擔憂。大模型技術應用范圍雖廣，目前落地的場景畢竟有限。而這群入局大模型的企業(yè)，分別來自游戲、教育、動漫等諸多行業(yè)，和大模型的應用場景離得很遠。

當國產大模型變得泛濫，我們該如何分辨優(yōu)劣？

沒技術不要緊，有公司靠“外援”搗鼓大模型

要評判一個大模型的優(yōu)劣，首先看技術，其中最核心的是算法和算力，即訓練參數(shù)量。因為參數(shù)量越大，系統(tǒng)的知識面就會越廣，表現(xiàn)也會越穩(wěn)定。資料顯示，openAI在2020年推出的ChatGPT-3參數(shù)量已經(jīng)達到1750億，谷歌在一年后發(fā)布的PaLM則達到5400億，更不用說最新的ChatGPT-4了。

參照此技術標準，我們可以精準識別一批蹭熱點的企業(yè)：它們要么確實拿出了產品，但參數(shù)量和ChatGPT等有較大差距，功能也較單一；更有甚者，套用別家公司的硬件、數(shù)據(jù)庫來預訓練參數(shù)，本身缺乏核心技術。

當中的代表，有昆侖萬維。

4月10日，昆侖萬維宣布聯(lián)合奇點智源研發(fā)“天工3.5”國產大語言模型。根據(jù)發(fā)布會上的介紹，“天工3.5”定位為“中國第一個真正實現(xiàn)智能涌現(xiàn)”的大模型產品，具備智能問答、聊天互動、文本生成等多種應用功能以及豐富的科學、技術、文化、藝術和歷史知識儲備。

根據(jù)官方資料，昆侖萬維最早在2020年布局AIGC業(yè)務，投入數(shù)億元組建研發(fā)團隊。去年12月，“昆侖天工”首次亮相，初代產品提供圖像、音樂、文本及代碼AI生成功能。作為對比，大模型領頭羊 openAI在2019年發(fā)布ChatGPT-1，每一代產品的研發(fā)周期都在一年左右。

乍一看，昆侖萬維的“天工3.5”功能全面對標ChatGPT，比起百度“文心一言”、阿里“通義千問”等國產大模型毫不遜色。在研發(fā)速度上，昆侖萬維也領先于大多數(shù)國內同行。不過昆侖萬維的缺點也很突出——“天工3.5”是和阿里云合作的產物，后者的參數(shù)、硬件設備幫了昆侖萬維很大忙。

事實上，昆侖萬維一直抱緊阿里云的大腿。資料顯示，過去幾年昆侖萬維的海外數(shù)據(jù)基本都在使用阿里云公有云儲存服務，2020年布局AIGC時也是在阿里云的協(xié)助下建立算力集群。在“天工3.5”發(fā)布后，還有媒體爆出昆侖萬維缺乏文本生成、數(shù)據(jù)處理專利的消息，和百度、阿里形成鮮明對比。

同樣遭遇技術質疑的，還有“AI四小龍”之一的商湯科技。

商湯科技在4月10日發(fā)布了自研大模型系統(tǒng)“日日新SenseNova”，內含AI數(shù)字人視頻生成平臺“如影”，3D內容生成平臺“瓊宇”和“格物”，類ChatGPT產品“SenseChat”等產品。別人都是發(fā)布單個產品，商湯科技一次過拿出一套“全家桶”，可見其野心之大。

然而，商湯的大模型全家桶在發(fā)布那天就有翻車跡象。演示視頻公布后，就有媒體和網(wǎng)友發(fā)現(xiàn)商湯“妙畫”生成的圖片和AI網(wǎng)站Civitai的圖片撞車，甚至還有來自Civitai的文字注釋。SenseChat則在一些基礎問題上表達含糊不清，其訓練參數(shù)量也遭到質疑。

在價值研究所看來，缺乏數(shù)據(jù)源，是昆侖萬維和商湯科技共同的命門。

“文心一言”背后有百度的海量搜索數(shù)據(jù)和語料庫，阿里的“通義千問”則有來自電商、云計算等領域的語料庫，流量大、用戶覆蓋面廣，能提供足夠的參數(shù)。缺乏面向C端用戶的通用產品、沒有參數(shù)積累，強行上馬大模型，昆侖萬維和商湯科技的尷尬處境完全可以預料。

沒應用場景又如何？這些企業(yè)硬要和AI攀關系

除了缺乏核心技術、產品缺陷明顯的昆侖萬維等企業(yè)，另一類企業(yè)的行為更讓人迷惑：在缺乏應用場景的情況下，硬要給自身產品貼上大模型標簽、 “硬蹭”熱點。

這一類企業(yè)，以專注C端服務的互聯(lián)網(wǎng)公司為主，尤其是近年來處境不佳的教育、科技金融、游戲公司。

比如專注于智能教育硬件研發(fā)的淘云科技，在5月6日發(fā)布了首個兒童認知大模型“阿爾法兒童認知大模型”和GPT機器人，并宣布把平臺的兒童原始語料加入科大訊飛的“訊飛星火”大模型中。同樣來自教育領域的學而思，也在近日宣布研發(fā)數(shù)學大模型MathGPT，目前已取得階段性成果，預計年內推出。

這類企業(yè)最大的問題在于，大模型的應用場景、目標用戶和它們的業(yè)務有巨大差異。強推大模型，根本無法為它們的用戶帶來多少幫助。

根據(jù)淘云科技董事長劉慶升的說法，“阿爾法兒童認知大模型”基于兒童場景提供更貼近幼兒理解力的生成式內容，讓兒童用戶在輕松的氛圍下積累新知識。問題在于，類ChatGPT應用仍無法保證100%準確率，常識性的錯誤屢見不鮮。對于認知能力有限的兒童來說，并不穩(wěn)定的大模型反倒可以帶來反作用。

當然，上面這些公司蹭熱點的目的雖然很明確，但好歹拿出了實打實的產品或規(guī)劃。還有一些企業(yè)，不僅業(yè)務場景和大模型相去甚遠，甚至還沒有拿出實際產品就開始往自己臉上貼金。

比如定位于“國漫IP孵化平臺和漫畫分享社區(qū)”的快看漫畫，就在4月27日宣布成立AIGC事業(yè)部。創(chuàng)始人兼CEO陳安妮更是在內部信中表示，AI將會給內容產業(yè)帶來“顛覆式”生態(tài)變革。

再比如最近一邊搗鼓直播電商、一邊忙著進軍本地生活的小紅書，也沒忘記籌備大模型團隊。根據(jù)36氪報道，小紅書在今年3月開始組建研發(fā)團隊，主要成員來自廣告NLP技術部門。4月，小紅書悄悄上線了一款名為“Trik”的AI創(chuàng)作應用，主打AI繪畫，但沒有大規(guī)模宣傳，至今沒有引發(fā)多少關注。

總的來說，這兩類企業(yè)的大模型布局都經(jīng)不起推敲。但蹭上大模型風口，確實為其帶來了可觀的流量，也掀起資本市場的狂歡。前面提到昆侖萬維，在發(fā)布“天工3.5”次日股價暴漲16%。或許正因為市場過于狂熱，才會反過來迫使這些企業(yè)主動迎合熱點。

可惜這種熱度是無法持續(xù)的，而且還會遭到監(jiān)管機構的重點關照。在“天工3.5”發(fā)布次日，昆侖萬維就收到了深交所的關注函，要求前者結合項目研發(fā)進度、行業(yè)政策風險、對公司財務的影響等情況，說明該業(yè)務可能面臨的風險。

雖然深交所沒有把話挑明，但明眼人都看得出這封關注函寫滿對昆侖萬維蹭熱點的懷疑。在價值研究所看來，蹭熱點的行為正在損壞行業(yè)生態(tài)。給大模型降降火、讓市場回歸理性，對踏實搞研發(fā)的企業(yè)來說非常重要。

追趕ChatGPT，一場艱苦的馬拉松競賽

不可否認，除了上面這些蹭熱點的公司外，國內有不少企業(yè)在認真打磨大模型產品，也有一定的技術積累和豐富的應用場景。不過從百度、阿里，再到360，幾乎所有頭部企業(yè)都承認自己的技術不如openAI的ChatGPT。

5月7日，周鴻祎應邀來到東方甄選直播間，和俞敏洪、董宇輝大談國內的大模型創(chuàng)業(yè)熱潮。周鴻祎直言，openAI比國內企業(yè)領先至少兩年，國產大模型有機會在一年內追上ChatGPT-3.5，但openAI已經(jīng)開始訓練ChatGPT-5了。

“上來就說能超越ChatGPT，那叫吹牛?！?/p>

周鴻祎最后這番話，不少媒體認為是在影射5月6日發(fā)布“訊飛星火”認知大模型的科大訊飛?？拼笥嶏w董事長劉慶峰在發(fā)布會上表示，“訊飛星火”在文本生成、知識問答、數(shù)學能力上已經(jīng)超過ChatGPT，目標是到今年10月，通用認知能力對標ChatGPT，并在中文上超越ChatGPT。

周鴻祎是否意有所指不得而知，可以肯定的是，投資者、用戶對國產大模型的耐心正在流失，要求變得更加苛刻，外部的競爭也更加激烈——留給國產大模型的時間已經(jīng)不多了。

5月4日，微軟宣布Bing預覽版全面開放，該系統(tǒng)此前已接入openAI的ChatGPT-4；一天后，谷歌也宣布向所有擁有Wordspace賬號的用戶開放Bard AI工具訪問權限。

微軟和谷歌先后走向開放，意味著新一輪用戶爭奪戰(zhàn)正式打響。一旦它們滲透進國內市場，面對技術上的差距，國產大模型并沒有太多應對方法。比起那群蹭熱點的企業(yè)，追趕openAI的骨干力量更值得我們關注——特別是百度、阿里、騰訊三巨頭，周鴻祎治下的360，疑似被其揶揄的科大訊飛實力也不容小覷。

這幾家公司的優(yōu)勢是相似的：雄厚的資金儲備；擁有諸多面向用戶的產品/服務，語料庫十分豐富；主營業(yè)務貼近大模型應用場景，如百度和360的搜索，騰訊的社交媒體，阿里的云計算和電商，科大訊飛的智慧辦公等。現(xiàn)階段，這些企業(yè)的產品距離ChatGPT當然還有一定差距，但并非沒有追趕的機會。

要知道，即便是技術領跑全行的openAI，也有自己的苦惱。過去一年，隨著ChatGPT走紅openAI的估值也是一路走高，成為全球范圍內升值最快的獨角獸——可惜隨之飆升的，還有虧損額。

據(jù)外媒報道，openAI上一財年凈虧損達到5.4億美元，同比幾乎放大一倍。每一次預訓練參數(shù)都要耗費巨資，要提升系統(tǒng)穩(wěn)定性又必須不斷加大參數(shù)量和預訓練頻次，虧損自然成為無解難題。國盛證券的研報指出，通過測算，2800億參數(shù)量的大模型預訓練成本約為200萬美元/次，谷歌的PaLM號稱擁有5400億參數(shù)，單次預訓練成本將高達1200萬美元。

今年2月推出的付費版ChatGPT和其他商業(yè)化嘗試收效甚微，短時間內不可能覆蓋預訓練所需成本。CEO Sam Altman曾暗示，公司未來幾年可能需要籌集約1000億美元的資金，才能進一步提升技術，打磨下一代產品。

openAI的經(jīng)歷表明，AI大模型研發(fā)如同一場漫長且艱難的馬拉松——不要總是奢望彎道超車，踏踏實實和參數(shù)打交道是成功的基礎。

水能載舟亦能覆舟，狂熱的市場氛圍既給企業(yè)帶來了資金和關注度，也帶來了難以預估的風險。近段時間，證監(jiān)會等監(jiān)管機構已經(jīng)加大管控力度，不少公司也主動出面自證清白：據(jù)不完全統(tǒng)計，4月底至今已有世紀天鴻、萬興科技、中科信息、唐德影視等多家上市企業(yè)發(fā)布股票交易異常波動公告，澄清自身業(yè)務和AI、大模型的關系。

經(jīng)過移動互聯(lián)時代的洗禮，蹭熱點、追風口的情況太過常見了。似乎任何一個風口都逃不過從萌芽到爆發(fā)，再走向混亂、重塑秩序的過程。但在亂戰(zhàn)過后，有的風口出清泡沫、置之死地而后生；有的賽道卻徹底沉淪，如一顆流星般結束自己絢爛卻短暫的一生。

走在時代前沿的AI大模型，似乎更有可能成為前者，不過需要所有從業(yè)者、監(jiān)管機構的共同努力才能保證健康發(fā)展。大模型是一條技術門檻、資金門檻都很高的賽道，蹭熱點的企業(yè)注定無法長久。加強監(jiān)管、凈化行業(yè)環(huán)境、驅逐不良玩家可能會帶來短期混亂，但對行業(yè)的長期發(fā)展肯定是有益的。

關鍵詞：

上一篇：每日看點!精子著床成功后最早的癥狀_精子著床有什么癥狀或感覺
下一篇：最后一頁

丰满人妻熟妇乱又伦精品,最新国产精品精品视频视频,天堂а√中文最新版在线,成年网站未满十八禁

瘋狂的大模型：蹭熱點的多，真能打的鳳毛麟角

最近更新

特別關注

省委召開常委會議

2017年全球十大航天新聞和中國十大航天新聞評選揭曉。

五星級酒店馬桶刷洗茶杯，酒店以后還能住嗎？

這些政策將影響你明年錢袋子

生態(tài)文明建設年度評價結果公布：吉林排名靠前

長春市公安局寬城區(qū)分局“一號追逃目標”嫌疑人喜歡二人轉“露出馬腳”

“第一動力”正加力

中紀委機關談反腐

撐起“半壁江山” 釋放更強動力

300城市土地市場量跌價漲成交均價上漲

焦點資訊