以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads
首頁 > PEPE > Info

大模型慢半拍,字節甘做“嫁衣”?_GPT

Author:

Time:1900/1/1 0:00:00

文:財經故事薈,采寫:王舒然,編輯:萬天南

圖片來源:由無界AI工具生成

在大模型甚囂塵上的當下,一向高舉高打的字節,卻一反常態,低調得讓人不太習慣。

當百度、阿里、華為、360等知名互聯網公司的一把手們親自掛帥,為大模型站臺,并不吝用“智能化時代的開端”、“科技和商業史上的革命性時刻”來贊譽它時,字節卻安靜得多。

相關的官宣只有兩個,一是4月11日,飛書宣布將推出AI助手“MyAI”,二是4月18日,火山引擎推出大模型訓練云平臺,包括自研DPU、新版機器學習平臺等系列云產品,以服務于大模型創業公司——字節自研大模型始終未露面。

相反的是,火山引擎總裁譚待公開“承諾”,火山引擎不做大模型,將化身賦能者,為大模型客戶提供算力等AI基礎設施,幫助其做好大模型開發。

此舉似乎表明,字節避開了大模型戰火,選擇以幕后賣水者的身份入局。

只是,在算力、算法、數據這大模型的三要素上均具備優勢的字節,為何會選擇“韜光養晦”?字節真的會徹底放棄大模型,甘為他人做“嫁衣”嗎?

慢一拍的字節大模型

火山引擎不做大模型,或許并不代表字節對大模型無動于衷,這可能是個文字游戲。

實際上,雖然字節從未大張旗鼓得官宣自研大模型,但已經有所部署。

據36Kr在今年2月的報道,字節跳動在大模型上已有布局,會在語言和圖像兩方面發力,語言大模型團隊由字節搜索部門牽頭,目前團隊規模在十數人左右;圖片大模型團隊則由產品研發與工程架構部下屬的智能創作團隊牽頭。

另據《晚點LatePost》報道,張一鳴開始看人工智能論文,且時常會和一些字節人士分享論文心得和對ChatGPT的思考。

報告:美國投資者對比特幣的興趣激增,同時機構活動也有所增加:金色財經報道,根據分析公司K33 Research的報告,美國投資者對比特幣的興趣激增,同時機構活動也有所增加。數據表明,比特幣各交易時段累計收益自觸底16000美元以來,在美國市場時段累計大幅上漲約30%,超過亞洲和歐洲交易時段的表現。美國市場比特幣交易活動的激增是由貝萊德 (BlackRock) 最近于6月14日提交的現貨比特幣ETF引發的。

K33強調,比特幣最近的飆升與美國股市的表現顯著脫鉤。上周比特幣與這些指數之間的30天相關性轉為負值,這是自2021年1月以來的首次。[2023/7/4 22:16:28]

這表明,字節并不想缺席這場盛宴,但必須承認的是,字節在大模型上的反應確實有點“遲鈍”了。

民生證券4月9日發布的《當大模型不再稀缺》報告顯示,國內至少已有30多家大模型亮相。大部分都在3~4月份官宣,比如3月16日的百度“文心一言”大模型,4月8日的華為盤古系列AI大模型,4月10日的商湯“日日新”大模型,4月11日的阿里“通義千問”大模型......

而據36Kr報道,字節語言大模型團隊今年初才成立,預期今年年中推出大模型,字節跳動相關技術負責人表示,技術中臺在這些領域的探索仍處于初期,尚未成熟。

事實上,大模型競賽的起點并非今天,而在更早的布局,這方面,字節有些晚了。

對比來看,百度、阿里、華為、騰訊等企業的大模型均在2019年~2021年間就已有雛形,比如,百度在2019年發布了文心大模型,阿里在2021年發布了M6大模型,同年華為發布盤古大模型,這些雛形可以視為近期發布的類ChatGPT大模型的“基座”。

央行行長易綱:央行愿與各貨幣當局和國際機構在CBDC方面加強合作:10月31日消息,中國人民銀行行長易綱在“2022年香港金融科技周”活動上表示,在設計數字人民幣時,我們通過“雙層運營”和“可控匿名”的方式,在保護個人隱私的同時維護金融安全。目前,人民銀行正在與香港金融管理局以及其他貨幣當局就CBDC開展合作。希望此類合作能夠更好地服務于國際國內市場需求,并有助于鞏固香港作為國際金融中心的地位。展望未來,我們愿與各貨幣當局和國際機構在CBDC方面加強合作。[2022/10/31 12:00:42]

而字節方面,雖然其AI布局不算晚,字節AILab早在2016年就成立,與騰訊同一年,但其似乎并未在大模型上下足功夫。

據《晚點LatePost》報道,一位字節人士稱,在去年底ChatGPT出現前,字節對大模型的投入還比較少,表現之一是,約有100人的字節AILabNLP組,只有不到10人在研究語言大模型,其他人主要在做翻譯和抖音安全等優化。

知乎上一位字節AILab工程師的回答也印證了這一點,他表示,字節AILab的主要研究方向和業務應用有關,比如抖音特效、視頻和圖片審核等。

簡單來說,字節對AI的探索比較務實,主要服務于自家業務,這種務實而非務遠的策略,或許反而成了其布局通用大模型的“阻礙”。

而除了晚一步之外,字節對大模型的野望似乎也不是很大。

據《晚點LatePost》報道,字節語言大模型的探索方向主要與搜索相關,可能會在抖音、TikTok中推出類似微軟NewBing的功能;圖像大模型則主要服務商業化需求,以幫助字節的廣告客戶以更低成本制作視頻。

另據字母榜報道,有知情人士稱,飛書推出的“MyAI”背后的大模型是由飛書自行操盤,而非字節大模型團隊負責。

從上述信息判斷,字節大模型似乎并不打算“大包大攬”,而是與自家部分業務緊密相關,這與百度“文心一言”、阿里“通義千問”等通用大模型有所差別。

蘇州:將加快全市推廣數字人民幣試點 搭建更多應用場景:9月20日消息,蘇州市委書記曹路寶19日在“第二屆長三角數字金融產業創新周開幕式暨蘇州市金融支持產業創新集群發展大會”上表示,蘇州將加快全市推廣數字人民幣試點,積極在C端、B端、G端搭建更多應用場景,加快形成產業化優勢;持續招引優質資源,推動數字人民幣產業鏈縱向延伸和橫向拓展,將試點優勢轉化為數字金融產業創新集群發展優勢。(金十)[2022/9/20 7:07:42]

比如“文心一言”,在發布會現場,文心一言展示了五個使用場景,包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。

“通義千問”的功能則包括多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等,阿里巴巴集團董事會主席兼首席執行官張勇表示,阿里所有業務包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等都將接入該模型,應用場景實屬廣泛。

另一個可以側面佐證這一點的是,百度和阿里均計劃依托自家云平臺,向外界開放大模型服務,打造大模型生態。

比如阿里云智能集團CTO周靖人表示,各行各業的生態伙伴都可以對千問大模型進行再訓練和精調,打造行業專屬大模型;百度智能云事業群總裁沈抖也表示,文心一言的能力將通過百度智能云對外提供服務,會率先在媒體、文娛、企業軟件等行業落地,場景包括智能客服、員工培訓、巡檢日報、知識萃取等。

但字節云卻“反其道而行之”,火山引擎宣稱只做基礎設施服務,不對外輸出大模型能力。

這意味著,字節正在探索的大模型定位可能并非是開放生態,而是為了增強現有業務的競爭力。

當然,這只是初期,字節大模型的全貌尚未揭開,在字節官宣之前,還是變數難料。

字節為何甘為他人做“嫁衣“?

值得探究的是,為何字節對百度、阿里那樣的通用大模型興趣不高?火山引擎又為何堅定得不做大模型?

泰國SEC批準修訂數字資產運營商的資本要求:7月12日消息,據官方公告,泰國證券交易委員會(SEC)已批準修訂數字資產運營商的資本要求,要求數字資產運營商有足夠的資金來支持業務運營,從而提升對交易用戶的保護和運營商數字資產業務的可信度。

具體規則包括完善企業經營初始資金制度(提高實收資本),完善資本金保管制度等。對于新申請人,上述標準將從政府公報上公布之日起生效。對于現有的商業經營者,SEC已決定制定一項過渡性條款。[2022/7/12 2:08:12]

背后原因或許與以下幾方面的權衡有關:

其一,通用大模型燒錢,且距離商業落地“遙遠”。

訓練大模型的一大成本是算力,而算力的關鍵是芯片,那么,大模型訓練需要多少芯片?

參考ChatGPT,美國市場研究機構TrendForce推算稱,處理ChatGPT的訓練數據需要2萬枚A100芯片。網上流傳的一份《AI芯片專家交流紀要》顯示,如果是對標ChatGPT的大模型,1萬顆A100芯片是入門券。

而據國盛證券估算,按單張A100芯片的價格為10萬元算,大模型訓練需要投入約10億元。

這還只是訓練階段的芯片成本,還有模型推出后的綜合運營成本,參考ChatGPT,半導體研究公司SemiAnalysis認為,GPT-3每天大規模服務用戶的運營成本高達70萬美元,一年則高達2.555億美元,新一代的GPT-4模型只會更燒錢。

除此外,還有數據采集、人工標注等軟性成本,加起來可謂“天價”。

像字節這樣的大廠或許有資金實力,但麻煩的是,燒錢的結果面臨不確定性。

俄羅斯中央銀行重新考慮其在加密貨幣挖礦方面的立場:金色財經報道,俄羅斯中央銀行第一副行長Ksenia Yudayeva表示,該銀行對使用加密貨幣進行國際支付持開放態度,俄羅斯媒體還補充說,該銀行也在重新考慮其在加密貨幣挖礦方面的立場。Yudayeva稱,我們改變了對采礦的立場,也允許在外貿和國外使用加密貨幣。 Vedomosti 報道稱,財政部在統一俄羅斯黨在弗里達舉行的一次討論會上公布了該法律草案。在那次討論中,俄羅斯議會下議院國家杜馬的成員Anton Gorelkin提到了中央銀行參與的必要性,草案中已經考慮了許多國家機構和部委的意見。允許加密貨幣國際貿易的規定是法律上的一項創新。經濟發展部官員Anatoly Dyubanov在統一俄羅斯會議上表示,將其加入現行法律是一個權宜之計。

金色財經此前報道,俄羅斯正積極討論在國際結算交易中使用數字貨幣的想法。(路透社)[2022/6/1 3:55:00]

雖然大模型前景可瞻,但距離大規模的商業落地還有不小的距離,目前仍在摸索階段,除了像釘釘、飛書、印象筆記等辦公場景的具體落地外,其他的應用場景都還停留在展望階段。

創世伙伴CCV合伙人梁宇曾對《21世紀經濟報道》表示,現在是通用人工智能商業化應用的前夜,AI大模型還沒有經過大量的商業包裝和訓練,需要從業者像園藝師一樣去修剪,形成符合行業規律的商業化產品。

IDC中國研究總監盧言霞則認為,大模型落地的不確定性在于,能不能成功落地,是否真的能產出比之前的AI更好的效果,需要多久才能落地等等。

通用大模型投入產出比的不確定性,或許會讓“ROI至上”的字節有所顧慮。

其二,時間就是力量,在過去幾年內,阿里、百度等企業已將大模型“基座”迭代過幾輪,而字節幾乎是從“零”開始,先發優勢已失,追趕不易,不如務實一點。

如今,字節大模型聚焦搜索、視頻生成等場景,離自身的業務落地更近,在算法和數據的儲備上極具優勢,可操作性更高。

火山引擎定位基礎設施的服務也是同理,其2021年開始切入IaaS模式,至今也有一定積累。

且網上流傳的一份《阿里云AI專家交流紀要0401》顯示,在國內大廠的AI算力儲備中,字節排名第二,僅次于阿里。

更重要的是,火山引擎該定位的商業落地十分明確,更容易保障正向現金流。

這是因為大模型訓練需要巨大算力支持,而云廠商是公認的算力等基礎設施的最佳載體。

正如阿里巴巴集團董事會主席兼首席執行官張勇所言,大模型是一場“AI+云計算”的全方位競爭,超萬億參數的大模型研發,是囊括了算法、底層龐大算力、網絡、大數據、機器學習等諸多領域的復雜系統性工程,需要超大規模AI基礎設施的支撐。

微軟便是先例,微軟Azure作為OpenAI的獨家云供應商,為ChatGPT提供算力和超級計算系統。除了OpenAI,微軟2023財年二季度財報電話會議顯示,安盛、聯邦快遞和H&RBlock等公司也都選擇Azure來部署和管理其模型。

像微軟這樣的云廠商被喻為大模型時代的“賣水人”,意為在大模型淘金的人未必能賺到錢,但為淘金人提供基礎服務的肯定能賺到。

硅谷知名風投A16Z的研究印證了這一點:生成式AI的大量資金最終都穩定地流向了基礎設施層,預計生成式AI總收入的10%~20%都流向了云提供商。

總之,商業落地風險小,自身又擅長,無怪乎火山引擎如此定位,而抓住這股“紅利”,有機會為其帶來新的市場增量。

在目前的云市場中,火山引擎還排不上名次,IDC最新發布的《中國公有云服務市場跟蹤》報告顯示,目前公有云服務市場的市場份額排名前五名分別為:阿里云、華為云、中國電信天翼云、騰訊云和AWS,它們總共占據了72%以上的市場份額,其余的云服務廠家份額有限。

或許,以基礎服務切入大模型戰場的火山引擎,未來有機會借此一搏新的市場格局。

火山引擎或遇天花板

目前看,火山引擎這條路走得還算順利。火山引擎總裁譚待表示,目前國內有數十家做大模型的企業,七成已經在火山引擎云上,包括AI技術公司MiniMax、智譜AI、昆侖萬維、毫末智行等。

關于“七成”的數據口徑,譚待的解釋是,該“七成”是火山引擎相關客戶與第三方機構統計的大模型企業數量之比,而能獲得這么多客戶是因為機器學習平臺解決了算力輔助的問題。

這些客戶案例表明,火山引擎在大模型訓練領域已有一定立足之地。

不過,從長遠看,火山引擎也面臨挑戰。

一方面,有能力做大模型的公司畢竟是少數,客戶規模的天花板很明顯。

據譚待透露,在火山引擎的大模型客戶中,通用大模型公司占比大約為三分之一,垂直行業公司占比約為三分之二。

分別來看,在通用大模型方面,雖然目前創業者眾,但大浪淘沙,最終留下的能有幾何?

一位互聯網投資人認為,中國版ChatGPT只會在5家公司里產生:BAT+字節+華為,因為大廠有錢有人有場景。

北京航空航天大學人工智能研究院教授吳文峻也有類似觀點,其在接受《中新經緯》采訪時表示,在目前宣布進軍大模型的三四十家企業中,最后能做成的或許不超過一半。

當客戶數量有明顯的天花板時,火山引擎的前景可能也有了“瓶頸”。

而在垂直行業模型方面,客戶數量雖然很多,但也可能面臨阿里云、百度云等平臺的“狙擊”。

原因在于,阿里云、百度云均自帶通用大模型輸出的能力,基于此,企業可更方便的生成垂直模型。

比如阿里云,阿里云智能集團CTO周靖人在此前的媒體采訪中表示,阿里云會為企業提供一個專屬數據空間,企業將相關信息存入,且不需要做任何數據預處理,便可調用“通義千問”,一鍵式生成自己的行業專屬大模型。

而如果在沒有大模型的火山引擎上做垂直模型訓練,企業要操心的事顯然更多。

上述投資人認為,垂直模型企業一般很少會自己從頭做,而是找一個還不錯的Pre-Train過的大模型,在此基礎上做InstructionTuning。

在此方面,阿里云等平臺可能更有優勢。

另一方面,未來云廠商的模式可能是賣模型+賣算力,而不只是賣算力。

Maas模型即服務的時代已經到來,阿里云、百度云不僅支持專屬行業模型的生成,還支持中小企業甚至個人基于大模型直接開發應用,這就好比個人開發者基于安卓操作系統開發App。

換句話說,模型層在未來可能成為新的基礎設施。

李彥宏在36Kr專訪中更是斷言,未來企業在購買云計算時,不看底層算力,而是看大模型的優劣。

這可能給火山引擎帶來一定沖擊,因為當大量中小企業或個人基于阿里云、百度云開發應用時,云廠商背后的算力也得到了間接調用,從而規模效應平攤了算力成本,最終使其基礎設施層面的服務也更具價格優勢,這頗有點“降維打擊”的意思。

事實上,“價格戰”已經開始了。

4月26日,在2023阿里云合作伙伴大會上,阿里云推出了史上最大規模的降價:核心產品價格全線下調,降幅最高至50%。

不過,火山引擎對此好像比較樂觀,至少現階段如此。

其邏輯在于,一來火山引擎拿到的時間窗口還比較長,譚待認為,國內距離全球最高水平的大模型還需要比較長的時間,現階段不可能用三四十分的模型去做應用,也不可能做好應用。

二來,火山引擎堅信未來是多云多模型時代,企業會避免單一依賴,而選擇使用多家云服務,同時,各行業都有自己高質量的私有語料,會形成多模型生態。

言下之意可能是,市場很大,火山引擎總會有立足之地。

總而言之,大模型市場的未來撲朔迷離,參與其中的任何一員的前途均可能有變數,“缺失”大模型的火山引擎如此,走務實路線的字節大模型也如此。

Tags:GPTCHATATGCHAFoxGPTchat幣還會漲嗎Karatgold Coinblockchain是什么網站

PEPE
ERM LABS與The Sandbox戰略合作,將真人密室逃脫游戲引進元宇宙_ABS

將現實生活中的體驗帶入一個全新的維度,ERMLABS專注于將現實生活中的娛樂及冒險體驗以游戲獨特架構設計擴展到元宇宙里.

1900/1/1 0:00:00
一文梳理Web3教育賽道項目:Web3大規模采用的催化劑?_WEB

原文作者:Karen,ForesightNews隨著Web3教育協議OpenCampus上線幣安Launchpad,Web3與教育的結合、Web3入門和開發教育第一次闖入行業視野.

1900/1/1 0:00:00
詳解Curve推出的新版TNG:或促使交易量超Uniswap?_UNI

原文作者:DeFiCheetah,加密?KOL原文編譯:Felix,PANews核心觀點:CurveFinance?近期除了?crvUSD?最重要的更新之一:TricryptoNewGenera.

1900/1/1 0:00:00
淺談STO的未來機遇:Web3淘金熱中賣鏟子?_STO

原文:《「代幣化的未來」的?STO?的機遇,是在淘金熱中賣鏟子》 原文作者:北辰 原文來源:鏈茶館 在香港Web3嘉年華的閉幕式中.

1900/1/1 0:00:00
Bankless Ventures已獲得75%承諾投資,LP包括a16z創始人等_BAN

博鏈財經BroadChain獲悉,4月29日,Bankless創始人DavidHoffman宣布規模為3500萬美元的BanklessVentures已獲得75%的承諾投資.

1900/1/1 0:00:00
周鴻祎:國內大模型如果不經過兩年模仿,上來就說超越,那叫吹牛_GPT

來源:澎湃新聞 記者范佳來 圖片來源:由無界AI工具生成“我們給你創造一個GPT大腦,把你直播的內容全部用數字化方式記錄下來,就可以實現董宇輝的數字永生.

1900/1/1 0:00:00
ads