以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads
首頁 > Coinw > Info

ChatGPT之后 AIGC會如何革新內容創作?_AIG

Author:

Time:1900/1/1 0:00:00

作者:胡璇騰訊研究院高級研究員;胡曉萌騰訊研究院研究員、博士后

內容生產,特別是創意工作,一向被認為是人類的專屬和智能的體現。牛津大學計算機學院院長邁克爾·伍爾德里奇2019年寫作的《人工智能全傳》一書中,“撰寫有趣的故事”被列為人工智能“遠未實現”的任務之一。

如今,AI正大步邁入數字內容生產領域。AIGC不僅在寫作、繪畫、作曲多項領域達到“類人”表現,更展示出在大數據學習基礎上的非凡創意潛能。2023年3月15日,多模態信息處理標桿GPT-4模型正式發布,使生成內容的準確度及合規性進一步提升。數字內容生產的人機協作新范式正在形成,創作者和更多普通人得以跨越“技法”和“效能”限制,盡情揮灑內容創意。

也有人擔憂,AI是否會讓創作者們集體“失業”,甚至讓“創作”本身走向衰頹,就像機械復制時代的藝術品可能失去“靈韻”那樣。換言之,AIGC的流行給了我們一個重新審視“創作”是什么、是否為人所獨有這些問題的機會。

本文將分析AIGC改變數字內容創作的現狀、關鍵突破和挑戰,并嘗試探討以上問題。

AIGC正在成為互聯網內容生產基礎設施

數字內容正邁入強需求、視頻化、拼創意的升級周期,AIGC恰逢其會。線上生活成為常態,一方面,用戶創作內容大幅解放生產力,例如短視頻就是將原本需要長制作周期、高注意投入的視頻,變成了可以源源不斷產出的“工業品”和“快消品”;另一方面,作為核心的創意仍舊稀缺,需要新的模式輔助創作者持續產生、迭代和驗證創意。種種因素,都需要更加低成本、高效能的新工具與方式。

AIGC正在越來越多地參與數字內容的創意性生成工作,以人機協同的方式釋放價值,成為未來互聯網的內容生產基礎設施。

從范圍上看,AIGC逐步深度融入到文字、代碼、音樂、圖片、視頻、3D多種媒介形態的生產中,可以擔任新聞、論文、小說寫手,音樂作曲和編曲者,多樣化風格的畫手,長短視頻的剪輯者和后期處理工程師,3D建模師等多樣化的助手角色,在人類的指導下完成指定主題內容的創作、編輯和風格遷移工作。

ZetaChain推出500萬美元的Grants開發資助計劃:金色財經報道,ZetaChain推出500萬美元的Grant開發資助計劃,以支持有助于ZetaChain生態系統發展的創新、去中心化的業務。支持的初始列表包括全鏈(Omnichain )借貸協議、DeFi、Omnichain NFT項目或市場、通用GameFi數字資產平臺、治理和DAO工具、Web3社交網絡應用等Dapps。[2023/4/14 14:02:52]

從效果上看,AIGC在基于自然語言的文本、語音和圖片生成領域初步令人滿意,特別是知識類中短文,插畫等高度風格化的圖片創作,創作效果可以與有中級經驗的創作者相匹敵;在視頻和3D等媒介復雜度高的領域處于探索階段。盡管AIGC對極端案例的處理、細節把控、成品準確率等方面仍有許多進步空間,但蘊含的潛力令人期待。

從方式上看,AIGC的跨文字、圖像、視頻和3D的多模態加工是熱點。吳恩達認為多模態是2021年AI的最重要趨勢,AI模型在發現文本與圖像間關系中取得了顯著進步,如OPENAI的CLIP能匹配圖像和文本,Dall·E生成與輸入文本對應的圖像;DeepMind的PerceiverIO可以對文本、圖像、視頻和點云進行分類。典型應用包括如文本轉換語音TTS、文本生成圖片,廣義來看AI翻譯、圖片風格化也可以看作是兩個不同“模態“間的映射。

上圖:原圖,AIGC的典型場景及發展趨勢,來自紅杉資本

OKB Chain測試網正式上線,用戶可通過OKX Web3錢包領取測試網OKB體驗:金色財經報道,據OKX官方消息,基于以太坊的Layer2網絡OKB Chain(OKBC)測試網已正式上線,用戶可以通過OKX Web3錢包領取測試網OKB進行體驗。OKBC專注于提高安全性并實現無縫集成,支持去中心化產品部署,100%兼容EVM和Cosmos,以及提供可靠的智能合約審計服務,將幫助OKX 5000萬用戶輕松探索Web3。

此前消息,OKBC發展路線圖將分三步實現以太坊擴容解決方案,V1為以太坊PoA側鏈,專注于提供高性能和低交易費用;V2升級為以太坊原生ZK Rollup平臺大幅提高可擴展性和效率;V3打通ZK Rollup之間的跨鏈通信,以OKB作為紐帶,為用戶提供類似Web2的Web3使用體驗。[2023/3/28 13:31:21]

下圖:使用有道智云AI翻譯后的結果

關鍵突破:自然語言技術解放創作力

AIGC對創作者的解放體現在:“只要會說話,你就能創作”,無需懂得原理,不用學習代碼,或者Photoshop等專業工具。創作者以自然語言向AI描述腦海中的要素甚至想法后,AI就能生成對應的結果。這也是人機互動從打孔紙帶,到編程語言,圖形界面后的又一次飛躍。

自然語言是不同數字內容類型間轉化的根信息和紐帶,比如“貓”這個詞語就是加菲貓的圖片,音樂劇《貓》和無數內容的索引,這些不同的內容類型可以稱為“多模態”。

AIGC此輪浪潮,最大底層進化就在AI對自然語言“理解”和“運用”能力的飛躍,這離不開2017年Google發布的Transformer,它開啟了大型語言模型時代。有了這一強大的特征提取器,后續的GPT、BERT等語言模型突飛猛進,不僅質量高、效率高,還能以大數據預訓練+小數據微調的方式,擺脫了對大量人工調參的依賴,在手寫、語音和圖像識別、語言理解方面的表現大幅突破,所生成的內容也越來越準確和自然。

HBTC Chain負責人:DeFi是公鏈生態的重要組成部分,可以促進公鏈的真正發展和長期價值保障:金色財經報道,在10月21日舉辦的《金色百家談 | HBTC Chain打造跨鏈Dex解決方案》的直播節目中,HBTC Chain負責人Cody表示,DeFi對于公鏈的重要性不言而喻,優秀健康的DeFi會是公鏈的護城河,以太坊就是最好的案例。從公鏈的發展來看,最先大家講究的是共識算法/擴展性/性能等,最后,我們逐步公鏈的競爭來到了生態之爭,DeFi就是公鏈生態最好的補充之一。以太坊之所以是以太坊,更多的是以太坊上有足夠多的生態應用來支撐其價值,形成了事實上的公鏈絕對領先地位。DeFi是公鏈生態的重要組成部分,是能夠真正推動公鏈做更多可以實際落地的應用,可以促進公鏈的真正發展和長期的價值保障。個人認為,DeFi是完全不同于以往的ieo/ico之類,是實實在在的去促進數字資產的價值轉換,對于公鏈來說,支持DeFi是公鏈應用落地的必然趨勢。[2020/10/21]

但大模型意味著極高的研究和使用門檻,例如GPT-3有1750億參數量,既需要大算力集群也不向一般用戶開放。2022年,部署在Discord論壇上、以聊天機器人形式提供的midjourney成為了第一個用戶友好型AIGC應用,帶來AI繪畫熱潮,一位設計師用其生成的圖片甚至在線下比賽中獲獎。

使用簡單文字即可交流的低門檻,類似搜索引擎的使用方式,一下子點燃了普通用戶對AI使用的熱情。緊接著,基于擴散模型的一系列文本生成圖片產品,如StableDiffusion等,把AI繪畫從設計圈帶向大眾。開源的StableDiffusion僅需一臺電腦就能運行,截至2022年10月已有超過20萬開發者下載,累計日活用戶超過1000萬;而面向消費者的DreamStudio則已獲得了超過150萬用戶,生成超過1.7億圖片。其驚艷的藝術風格、以及圖像涉及的版權、法律等問題也引發了諸多爭議。

動態 | Baer Chain孵化的OASIS(綠洲)平臺SDK即將完成開發:目前,OASIS技術團隊正在進行SDK(Software Development Kit,軟件開發工具包)開發,預計在20個工作日內完成開發。通過SDK,符合條件的第三方游戲開發商游戲,能夠極簡完成技術對接、快速地加入OASIS平臺。[2019/11/26]

Diffusion的震撼感還沒消散,ChatGPT橫空出世,真正做到和人類“對答如流”,能理解各式各樣的需求,寫出回答、短文和詩歌創作、代碼寫作、數學和邏輯計算等。不僅如此,人類反饋強化學習(RLHF)技術讓ChatGPT能持續學習人類對回答的建議和評價,朝更加正確的方向前進,因此以不到GPT3的1%的參數實現了極佳的效果。盡管ChatGPT仍存在一些缺陷,例如引用不存在的論文和書籍、對缺乏數據的問題回答質量不佳等,但它仍然是人工智能史上的里程碑,并上線兩個月后用戶數突破1億,成為史上用戶數增長最快的消費者應用。

下一挑戰:向“在場”的3D互聯網進發

在文、圖、視頻后,數字技術演進的重要方向是從“在線”走向“在場”,AIGC將成為打造3D互聯網的基石。人們將在在虛擬空間構建仿真世界,在現實世界“疊加“虛擬增強,實現真正的臨場感。隨著XR、游戲引擎、云游戲等等各種交互、仿真、傳輸技術的突破,信息傳輸越來越接近無損,數字仿真能力真假難辨,人類的交互和體驗將到達新階段。

目前AIGC在3D模型領域還處于探索階段,一條路徑是以擴散模型為基礎分兩步走:先由文字生成圖片,再生成包含深度的三維數據。谷歌和英偉達在這一領域較為領先,先后發布了自己的文字生成3D的AI模型。但從生成效果看,距離現在人工制作的3D內容的平均質量還有距離;生成速度也未能盡如人意。

2022年10月,谷歌率先發布了DreamFusion,但其缺點也很顯著,首先擴散模型僅對64x64的圖像生效,導致生成3D的質量不高;其次場景渲染模型不僅需要海量樣本,也在計算上費時費力,導致生成速度較慢。隨后,英偉達發布了Magic3D,面對提示語“一只坐在睡蓮上的藍色鏢蛙”,用大約40分鐘生成了一個帶有紋理的3D模型。相比谷歌,Magic3D生成速度更快、效果更好,還能在連續生成過程中保留相同的主題,或者將風格遷移到3D模型中。

動態 | 黑客利用Excel文檔來執行ChainShot惡意軟件攻擊:近日出現了一款名叫ChainShot的惡意軟件攻擊,其利用微軟 Excel 文件包含的微型 Shockwave Flash ActiveX 對象、以及一個所謂的“電影”的 URL 鏈接,忽悠人們去下載 Flash 應用程序。

降維安全實驗室了解到該 Flash 應用程序其實是一個混淆的下載器:進程會在內存中創建一個隨機的 512-bit RSA 密鑰對,將私鑰保留在內存中、并將公鑰發送到攻擊者的服務器,以加密 AES 密鑰(用于加密有效負載)。如果你對本文所述惡意軟件的細節感興趣,可聯系降維安全實驗室。[2018/9/12]

Magic3D與DreamFusion對比

第二條路徑是借助AI來“合成”不同視角下同一物品的照片,從而直接生成3D。英偉達在2022年12月的NeurIPS上展示了生成式AI模型——GET3D,可根據其所訓練的建筑物、汽車、動物等2D圖像類別,即時合成3D模型。和上文中的輸出物相比,模型和紋理更精細,更采取了一般3D工具的通用格式,能直接用到構建游戲、機器人、建筑、社交媒體等行業設計的數字空間,比如建筑物、戶外空間或整座城市的3D表達。GET3D在英偉達A100GPU上訓練而成,使用了不同角度拍攝的約100萬張照片,每秒可生成約20個物體。結合團隊的另一項技術,AI生成的模型能夠區分出物體的幾何形狀、光照信息和材質信息,使可編輯性大幅加強。

NVIDIAGET3D基于AI生成的模型示例

可行路徑:與游戲中的程序化生成技術相結合

盡管如此,AIGC在3D側的能力,距離打造3D互聯網仍有不小的距離。而游戲中較為成熟的程序化內容生成技術,可能是AIGC邁過深水區的一大助力。

從技術路徑上,AI生成3D難以沿用“大力出奇跡”的老辦法,即單靠喂給AI海量的輸入來提升效果。首先,信息量不同,一張圖片和一個3D模型相比相差一個維度,體現在存儲上就是數據量級不同;其次,圖片和3D的存儲及顯示原理不同,如果說2D是像素點陣在顯示器的客觀陳列,3D則是實時、快速、海量的矩陣運算,就像對著模型在1秒內進行幾十次“拍照”。為了準確計算得到每個像素點,“渲染”在顯示器上,需要考慮的因素至少有模型幾何特征,通常用幾千上萬個三角面來表示材質特征,模型本身的顏色,是強反射的金屬,還是漫反射的布料光線,光源是點狀的嗎,顏色和強度如何。最后,原生3D模型的數據相對較少,僅游戲、影視、數字孿生等領域有少量積累,遠不如已存在了數千年、可以以非數字化形態存在的圖像那么多,例如ImageNet中就包含了超過1400萬張圖片。

用計算機幫助創作者這件事,游戲界已經探索了四十多年。用算法生成的游戲內容首次出現在1981年的游戲Rogue中,地圖隨機,每局不同。3D時代,程序化生成技術大量應用于美術制作,因為其需要巨額時間和人力成本,以2018年發售的游戲《荒野大鏢客2》為例,先后有六百余名美術參與,歷經8年才完成約60平方公里的虛擬場景。

程序化生成在效能和可控度上介于純手工和AIGC之間。例如2016年發布、主打宇宙探險的獨立游戲《無人深空》,用PCG構造了一系列生成規則和參數,聲稱能創造出1840億億顆不同的星球,每個星球都有形態各異的環境和生物。

游戲《無人深空》中使用程序化生成的海洋生物示例

2022年的Epic打造的交互內容《黑客帝國:覺醒》在最新虛幻引擎和程序化生成加持下,打造出栩栩如生、高度復雜的未來城市,共包括700萬個美術資產,包括7000棟建筑、38000輛可駕駛的車和超過260公里的道路,其中每個資產由數百萬個多邊形組成。

Epic使用虛幻5引擎和程序化生成技術高效制作《黑客帝國:覺醒》中的龐大城市

程序化生成和AI的結合更成為熱門學術領域,每年人工智能與游戲的頂級學會——IEEETransactionsonGames都會為程序化生成開辟專門的討論板塊。劇情、關卡、場景、角色,每個板塊都有大量的研究和實踐成果在推進。

創作到底是什么?

關于創作,有一句經典論斷——天才是99%的汗水,加上1%的靈感。愛迪生認為那1%的靈感最重要。AIGC則向我們證明,99%的汗水能產生質變。善用AI的創作者,或許才是“完全體”。

首先,AI和自然人的創作過程,沒有那么大的差異:一部作品的誕生,一個作者的成長,都建立在大量對經典的觀察、參照、模仿、提煉基礎上,并非一蹴而就。而創新往往也有跡可循,或者是對主流的揚棄甚至反叛,或者是對多種元素的加成和融合。因此,如知識產權制度,也是在鼓勵創作的基礎上,給予貢獻者以對等的獎勵,而非一刀切地拒絕模仿。

其次,人作為創作核心這一點沒有變化:AI面向任務,人類面向創造。一方面,人類信息系統紛繁復雜,遠非幾個“prompt”輸入就能概括。正如一位網友說,AI代替不了我,因為它理解不了老板的需求。沒有五年經驗的乙方,也解讀不來甲方口中的“要大氣”。另一方面,AI成長的養料仍然由人提供,AI更可靠可信也依賴著人的使用與反饋。“斷奶”于2021年的ChatGPT可不知道2022年世界杯的戰果。

從實用的視角,AIGC將賦予普通用戶更多的創作權力和自由。從PGC、UGC到AIGC的發展路徑可見,普通人越來越多的參與到創作之中,數字內容不僅呈現數量上的指數級增長,類型和風格也走向了更加包容和多元的生態。未來,用戶可以使用手機拍攝的一系列照片,通過AIGC工具生成一個可以使用的3D渲染圖。采用這種創造內容的方式,我們可以想象未來的數字空間將不再完全由開發人員構建,而是利用AIGC響應用戶的輸入按需生成。

AIGC工具對專業人士的杠桿效應更顯著:如果對普通人的增益是從0到1,對專業人士則可能是從1到10,使他們能集中精力處理更頂層、更有價值的事情:比如立意,風格,構圖,元素組合和后處理,或者怎樣在前期制作盡可能多樣的demo來找尋更好的方案。運用AI也正成為新的職業能力,善于“施咒”的大觸們前赴后繼地開發著AI近乎無限的潛能,并社交平臺上留下讓人望洋興嘆的作品。

更長期看,創作和藝術的歷史是螺旋上升的歷史,是某一種風格數量極大豐富、質量巔峰造極之后的突破、突變與跨界,也是一個時代精神情感的凝結。我們有理由相信,AIGC變革下創新依舊存在,甚至會加速發展。

參考資料來源:

https://mp.weixin.qq.com/s/ZYSEou1ki0a4JVY2Nv8_SA.

https://zhuanlan.zhihu.com/p/388666777.

https://zhuanlan.zhihu.com/p/82758631.

https://zhuanlan.zhihu.com/p/493739360.

Tags:AIGIGCCHAAINAIGENIUS價格igc幣是真的嗎bptchainaskchaintoken

Coinw
All in AIGC 的扎克伯格 坐不住的 Meta_META

面對火熱的ChatGPT,狂歡的粉絲,再看看自家冷冷清清,凄凄慘慘的HorizonWorlds,估計但凡是個有點東西的企業都坐不住,更何況是扎克伯格和改名明志的Meta呢?前不久.

1900/1/1 0:00:00
金色觀察 | 灰度研究:加密貨幣圣杯“穩定幣”的崛起_穩定幣

文/Grayscale?Research,譯/金色財經xiaozou1976年,經濟學家FriedrichHayek撰寫了一篇名為《貨幣非國家化》的文章.

1900/1/1 0:00:00
上海升級推遲下的板塊機會:L2 頭部生態的 DeFi「內卷」_以太坊

撰文:?CabinVC L2旨在解決以太坊長期存在的、提升吞吐量的迫切需求,今年,其頭部生態相繼迎來階段性的技術落地,同時也是今年以太坊主網升級的主要受益板塊.

1900/1/1 0:00:00
Lookonchain:一機構2022年通過抄底ETH并在頂部賣出獲利3600萬美元_LOOK

3月3日消息,Lookonchain發推稱,一機構今年積累了7669枚ETH、83815枚AAVE、919998枚UNI和86976枚COMP.

1900/1/1 0:00:00
ARB Token為防止機器人濫用,本次空投建立積分制_ARB

3月16日消息,以太坊Layer2擴容解決方案Arbitrum正式宣布將發行原生TokenARB并公布Token經濟學。據悉,ARB初始總供應量為100億枚,總供應量將以每年至多2%的速度膨脹.

1900/1/1 0:00:00
金色午報 | 3月19日午間重要動態一覽_區塊鏈

7:00-12:00關鍵詞:CBDC、FDIC保險、CoinbaseCTO、USDC1.俄羅斯建立CBDC監管、發行的法律草案已獲立法者一讀批準;2.

1900/1/1 0:00:00
ads