以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads

百度的對手 從來都不是OpenAI_GPT

Author:

Time:1900/1/1 0:00:00

文心一言千呼萬喚始出來,兩天內,百度股價先抑后揚,實現了一個大號V字反轉。

新聞發布會當天百度港股股價下跌后,隨著部分媒體和企業用戶陸續拿到內測邀請碼,文心一言真實的能力表現很快提振了資本市場對百度的信心。當晚美股開盤后,百度股價由跌轉漲,并在北京時間3月17日凌晨收盤后,實現了3.8%的漲幅。

反映到第二天港股市場上,截至17日午間,百度香港股價早間高開高走,大幅拉升,盤中漲幅最高近15%。

據了解申請文心一言API調用服務測試的企業已達7.6萬。

根據字母榜(ID:wujicaijing)實測,文心一言已經足以比肩ChatGPT(GPT-3.5),在中文理解上,甚至比后者略勝一籌。

在2022年四季度財報電話會上,李彥宏就曾提到,相比海外開發的大語言模型,文心一言的比較優勢在于更理解中國文化,更適合中文和中國市場。

而且,在多模態生成方面,GPT-4只是做到了能夠實現圖片輸入,輸出形式上仍只有文本一種形態。與之相比,文心一言已經能夠實現文本、圖片、音頻和視頻的全形態輸出,不過,據李彥宏介紹,由于生成視頻成本較高,暫時還無法做到對所有用戶開放。

在字母榜實際測試中,文心一言在完成對話的流暢度上也要好于ChatGPT。當然,造成這種體驗差異的原因之一,或許也在于文心一言才剛剛上線,還不像ChatGPT已經歷了上線半年的反饋調教。

根據官方公告,文心一言目前采用分批開放方案:3月16日起,獲得邀請測試碼的首批用戶,即可在文心一言官網體驗產品,其他C端用戶排隊預約,即可陸續體驗;企業客戶則可以訪問百度智能云官網進行申請,排隊體驗文心一言API調用服務。

百度希壤推出“元宇宙會展解決方案”:8月21日消息,百度希壤“會展元宇宙解決方案”發布會在北京舉行。以元宇宙會展舉辦便捷化、功能多樣化與價值差異化為核心,百度面向生態合作伙伴推出一站式的元宇宙會議、展覽服務。發布會上,百度副總裁馬杰分享了百度希壤元宇宙會展解決方案的具體能力。“百度希壤元宇宙會展解決方案旨在通過云智一體的元宇宙基礎設施和覆蓋會展全流程的SaaS化技術支持,為行業帶來便捷、多樣的元宇宙會展服務,共同挖掘元宇宙會展的差異化價值。” (上證報)[2022/8/21 12:38:58]

值得注意的是,相比微軟新必應對每日對話次數,以及每次對話輪次的限制,文心一言告訴字母榜,作為一個人工智能語言模型,它沒有每天的對話限制。

如同GPT-4“考慮到大模型的競爭格局和安全隱患”而不再對外公布用了什么數據、怎樣訓練模型等核心機密問題之外,字母榜還在測試中發現,文心一言同樣有所保留,在問到“你每次回答最多可以輸出多少文字?”時,文心一言表示,“該問題涉及百度公司商業秘密,我不能回答每次回答最多可以輸出多少文字。”

與之對比,ChatGPT的回答被限制在約3000個單詞,GPT-4可以做出超過2.5萬個單詞的回答。

但無論是ChatGPT、GPT-4還是文心一言,目前都仍處在不斷完善的過程中,正如李彥宏所言,它們都仍有“胡說八道”的一面。

如文心一言,目前對英文語種、代碼場景的訓練還不夠多,表現還不夠好。“它們有時候會有很驚艷的表現,但不少場景下,細究起來還有明顯的bug,進步空間很大。”李彥宏說道。

“江蘇全面排查虛擬貨幣挖礦活動”排名百度熱搜榜第7位:10月9日消息,百度熱搜數據顯示,“江蘇全面排查虛擬貨幣挖礦活動”排名百度熱搜榜第7位。[2021/10/9 20:16:23]

這或許也是百度希望盡快將文心一言推向市場的原因之一,只有借助更大范圍內的真實人類反饋,文心一言才能獲得更高頻的進步迭代速度。

尤其在國內用戶尚無法注冊 ChatGPT的現實背景下,百度面對的競爭對手,除了OpenAI外,更大的壓力還在于同樣盯著AI大模型產品的一眾國內科技大廠。

ChatGPT的橫空出世,標志著互聯網產業的競爭重點將從應用層面進入模型層面。百度搶先發布文心一言,意味著百度在必定日趨激烈的大模型競爭中占據了先發優勢。

在李彥宏現場演示的五個視頻中,文心一言通過“總結《三體》的核心內容”“續寫《三體》”“判斷于和偉和張魯一誰更高”等系列問題,展現出了總結、分析、內容創作生成和推理能力。

此外,文心一言還可以幫助公司起名字、想公司Slogan,撰寫公司新聞稿等,對于雞兔同籠這類考驗邏輯思維的數學題,也不在話下,按李彥宏的說法,“(文心一言)很像小學生的水平了。”

更讓人驚艷的則是文心一言在中文理解上的表現,如對“洛陽紙貴”的解釋,用“洛陽紙貴”寫一首“藏頭詩”,這都是ChatGPT無法做到的能力。

為了驗證文心一言是否真的有李彥宏演示的那般強大,字母榜特意找來了曾令ChatGPT頭疼不已的部分問題,打算上手考考它。

第一題:小明的媽媽有四個孩子,其中三個分別是大熊、二熊和三熊,那么第四個孩子叫什么?

文心一言的回答是:小明的媽媽有四個孩子,其中三個分別是大熊、二熊和三熊。因此,第四個孩子叫做小明。

百度區塊鏈總經理肖偉:利用區塊鏈可實現供應鏈上下游各角色的互相信任:金色財經訊,8月4日,百度超級鏈開放網絡白皮書發布會于線上召開,會上,百度區塊鏈總經理肖偉表示,區塊鏈可以為商業行為提供信任。例如貸款方可以通過區塊鏈技術向銀行提供貸款使用的過程,而實現銀行對于貸款方的信任。通過過程的溯源,在金融貸款、醫保核實、廣告效率追蹤、商品源頭追蹤等領域可讓供應鏈上下游的參與者充分的相互信任。[2020/8/4]

看來文心一言是懂腦筋急轉彎的。

再來第二題:小明騎自行車,一把把把把住了。這句話怎么理解?

文心一言的回答是:這句話的意思是小明在騎自行車時,一只手握住了車把手。這可能是因為他需要控制自行車的速度或方向,或者是為了保持平衡。也有可能是因為他想要保護自己不受傷害。總之,這句話描述了小明采取的一種行動或姿勢來控制自行車的運動狀態。

理解多音多義字上,文心一言也過關了。

對于演示中沒有展現的編寫代碼、生成表格等能力,字母榜經測試發現,文心一言也具備對應實力。

不過,就像進入內測界面后給出的友情提示所說,其擅長中文,也會英文,其他語言正在學習的文心一言,盡管能夠生成方言,但目前還僅限于四川話、東北話、廣東話和臺灣話。

聲音 | 百度副總裁:區塊鏈等組成的ABC+X架構應該推動各行各業的演進和進步:據環球財富報道,8月9日,由中央網信辦、工信部、部共同指導,廈門市人民政府主辦的中國人工智能峰會召開,百度副總裁、智能云事業群組總經理尹世明表示,人工智能如果需要實現工業化,進而達到規模化應用,很重要的是要把它架構化,ABC+X這個架構應該推動各行各業的演進和進步。所謂的 ABC+X ,A是人工智能、B是大數據、C是算力,X則是目前一些最熱的技術,比如邊緣計算、5G、IOT、區塊鏈。這個新的架構賦予了我們新的能力,把算力、數據、算法綜合在一起,整合X,提供了全新的應用開發平臺。基于此,可以有各種各樣的應用得以重新的開發,重新的設計,帶來新的效能。[2019/8/10]

同時,如OpenAI CEO山姆·阿爾特曼評價GPT-4仍有缺陷、存在限制,并在熟悉之后可能不會像初見時那樣驚艷一樣,文心一言稍不留神也會產生幻覺、生成錯誤答案,并出現推理錯誤。

作為一款對標ChatGPT的產品,據百度CTO王海峰介紹,新一代知識增強大語言模型——文心一言,是在ERNIE及PLATO系列模型的基礎上研發而來,背后包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強等六大關鍵技術。

“前三項是這類大語言模型都會采用的技術,ERNIE和PLATO中也已經有應用和積累,在文心一言中又有了進一步強化和打磨;后三項則是百度已有技術優勢的再創新,也是文心一言未來越來越強大的基礎。”

如通過知識增強,大語言模型可以在調用更少參數的基礎上,達到效率更高、效果更好的目標;檢索增強,則保證了文心一言可以回答時下新近發生的事情。與之對比,GPT-4通常缺乏對其絕大部分數據截止后(2021年9月)發生的事件的了解,也暫不具備從其經驗中學習的能力。

動態 | 百度與北京市西北旺鎮合作 通過區塊鏈等技術打造首都智能城鎮示范區:據中國新聞網消息,10月16日,北京市海淀區西北旺鎮人民政府與百度簽署合作協議,通過百度人工智能、大數據、云計算、區塊鏈等關鍵技術,雙方將共建“智慧西北旺”,打造首都智能城鎮示范區,構建中關村科學城新型城市形態。[2018/10/17]

面對與GPT-4之間存在的差距,留給百度的挑戰在于,如何通過更高頻的產品迭代和應用創新,實現后來居上式的反超。

這種經歷對百度并不陌生。在搜索時代,百度就曾靠著上述策略實現了對谷歌的趕超,并一舉奪下國內搜索市場最大份額。

2018年8月,當外界傳出谷歌將重返中國市場,并計劃在未來6個月到9個月內在中國推出一個審查版的搜索引擎蜻蜓(Dragonfly)時,李彥宏顯得頗有些激動,曾發朋友圈表示:“這些年來,百度一直被認為是占了谷歌退出中國的便宜。我們無法證明一件沒有發生的事情……百度是后來者居上,通過技術和產品創新反超谷歌。到2010年,谷歌在市場份額持續下降的情況下退出中國時,百度的市場份額已經超過70%。如果現在谷歌回來,我們正好可以真刀真槍地再PK一次,再贏一次。”

現在,同樣跌落到跟隨者象限的谷歌和百度,都需要直面來自ChatGPT的挑戰。

稍有不同的是,這次百度搶先谷歌,成為全球科技大廠中第一個做出并對外發布類ChatGPT產品的公司。

正如谷歌云CEO托馬斯·庫里安所說:“我會告訴你這是一個新游戲的第一分鐘,而游戲從來沒有人能在一分鐘內完成。”

在方興未艾的生成式AI時代,百度尚有機會借助后續的產品更迭實現對領跑者OpenAI追趕。

據鈦媒體報道,文心一言很快將在四五月份迎來下一個版本或者新功能的發布,后續將以月或雙月的頻率展示文心一言新功能或新版本。

過去近三十年互聯網發展歷史中,中國科技公司正是靠著“小步快跑、快速迭代”的方法論,在應用創新上實現了對美國同類公司從模仿再到超越的過程。

面對眼下這場新的AGI競賽,環顧國內科技公司,百度最有可能在AI領域追趕乃至超越國外同行。在等來這個戰略機遇之前,百度已經在AI領域堅守十年。

正如李彥宏所說:“無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。”

在2013年成立中國第一個深度學習研究院后,百度此后十年間向AI累計投入超1000億元資金,成為中國大型科技互聯網企業中研發投入比例最高的公司之一,并相繼研發出首個國產深度學習框架飛槳,成為國內至今唯一能與國際兩大主流框架 TensorFlow和PyTorch正面交鋒的深度學習框架,和百億參數中英雙語大模型PLATO-X、千億參數大模型“百度·文心”,以及知識增強大模型Ernie等等。

灼識咨詢曾在一份報告中將百度列入中國AI領導地位,除了深度學習框架飛槳居中國深度學習框架榜首外,還因為百度不僅擁有中國最多的AI專利數量以及AI專利申請數量,還凝聚了中國最多的開發者,成為中國最大的開放式AI平臺。

國盛證券在ChatGPT產品報告中指出,這是一項屬于具備云服務能力的大廠游戲。

借助百度智能云國內TOP4的頭部陣營地位,百度恰恰成為登上牌桌的為數不多參與者之一。更重要的是,百度借助芯片層的昆侖AI芯片,框架層的飛槳深度學習框架,模型層的文心大模型,以及應用層的搜索、自動駕駛、智能家居等產品,成為全球范圍內寥寥無幾擁有全棧自研能力的AI公司之一。

消費互聯網用戶增長趨緩,且各家核心App基本觸達月活天花板后,中國科技大廠都在高喊著向產業互聯網轉型,開始在數字化、智能化浪潮中掘金。

一場圍繞大模型的新競賽在過去兩年間悄然打響。IDC發布的《2022中國大模型發展白皮書》顯示,自2020年起,中國的大模型數量驟增,僅2020年到2021年,中國大模型數量就從2個增至21個,和美國量級同等,大幅領先于其他國家。

除了百度文心大模型在市場格局中處于第一梯隊外,2021年4月,一眾科技大廠繼百度之后集中公開了各自的大模型產品,華為公布了千億級參數規模的盤古大模型,阿里巴巴達摩院發布了被稱為中文版“GPT-3”的語言大模型PLUG,并在此基礎上于2022年9月推出通義大模型系列。晚到一步的騰訊,于2022年4月,對外披露了混元大模型。

與文心大模型相比,上述大模型在功能上基本類似,如都具備文生圖、文本轉視頻、自動生成文案等。

基于百度文心大模型的AI 藝術創作展示,用戶輸入文字,AI就能根據語意進行繪畫創作。

而且,這些科技大廠同樣在內部籌劃類ChatGPT產品。在百度爆出即將發布文心一言消息后,進入2月份,華為對外表示在類似ChatGPT方向上從2020年開始就在布局;阿里巴巴則透露阿里版聊天機器人ChatGPT正在研發中,已處于內測階段;騰訊則被爆出針對類ChatGPT產品已成立混元助手項目組,聯合騰訊內部多方團隊構建大參數語言模型,希望“成為國內的業界標桿”。

暫時尚未亮相大模型的字節跳動,也在近期被媒體報道稱在大模型上已有所布局,分別在語言和圖像兩種模態上發力,其中語言大模型團隊在今年正式組建,探索與搜索、廣告等下游業務的結合,有望趕在今年年中推出大模型方案。

正在追趕OpenAI,乃至計劃超越前者的不止百度一家。這將是一場圍繞技術和速度的雙重賽跑。誰先上線產品,誰就有可能借助來自用戶的真實反饋掌握先機,從而隨著時間推移形成愈來愈強的馬太效應。

這也就不難理解李彥宏為何在2月初給文心一言項目下了“三月完成內測上市”的死命令。

來自微軟的一組數據更能直觀感受生成式AI產品迭代的速度之快:從GPT到GPT-3,背后參數量從1.17億飆升到了1750億,增長近1500倍。

“大語言模型是個馬太效應非常明顯的行業,可以說如果落后18個月,就基本沒機會了,因為先一步發布的產品已經迭代得非常先進了。”李彥宏如此感嘆。

這場GPT爭奪戰中,時間就是生命,效率就是金錢。

 來源:元宇宙之心

元宇宙之心

企業專欄

閱讀更多

金色財經 善歐巴

金色早8點

白話區塊鏈

Odaily星球日報

MarsBit

歐科云鏈

深潮TechFlow

Arcane Labs

BTCStudy

Tags:GPTHATCHAATGGenerative GPTChatCoinglobalchainCATGE幣

火幣APP下載
擼空投正確姿勢:五個案例告訴你如何避免“被女巫”_HOP

Sybil Attack,中文翻譯成“女巫攻擊”。Sybil 一詞最早出自 1973 年的小說《Sybil》,這本小說講的是女主 Sybil Dorsett 進行心理治療的故事.

1900/1/1 0:00:00
衍生品起家 控股BitKeep Bitget如何崛起自成生態?_BIT

3月22日,巴黎區塊鏈峰會,Bitget 高調宣布向多鏈錢包 BitKeep 投資3000萬美金,取得控股權。在眾多交易所紛紛裁員收縮的當下,Bitget的激進擴張成為熊市中的一道風景.

1900/1/1 0:00:00
從應用火到股市 AIGC概念股連漲仨月_IGC

AI有變革生產力之勢,證券市場聞風而動。同花順數據顯示,AIGC概念指數年內上漲近60%,漲幅是上證指數的10倍多.

1900/1/1 0:00:00
難以定義的企業:DAO的法律結構問題_DAO

作者:Mike Wawszczak  翻譯:卡丘zircon 文章來源:SeeDAO這是「 DAO 的法律實體結構」系列中的第一篇文章.

1900/1/1 0:00:00
zkSync Era主網即將上 測試網如何交互DEX_SYNC

zkSync 近期宣布了 2.0 版本的上線,并稱此版本為 zkSync Era,SyncSwap 為近期在 zkSync Era 測試網新上線的 AMM Dex(3 月 1 日上線).

1900/1/1 0:00:00
中國檢察官雜志發文:虛擬貨幣屬于刑法上的“財物” 應予以保護_區塊鏈

原標題:法秩序統一性視域中非法獲取虛擬貨幣的行為性質認定作者:陳禹橦,北京市人民檢察院第一分院第三檢察部四級高級檢察官.

1900/1/1 0:00:00
ads