以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads
首頁 > DAI > Info

萬字長文講透AI藝術:緣起、意義和未來(上篇)_SAL

Author:

Time:1900/1/1 0:00:00

前言

今年 AI 藝術熱潮源于海外 AI 技術在圖像生成領域的革命性進步,以 Disco Diffusion、Stable Diffusion、Midjourney 等為頭部代表的擴散模型(Diffusion Model)開始在數字藝術領域大放異彩!以其驚人的藝術效果和可繪制“萬事萬物”的無限性,在短短半年時間里,吸引了來自全世界數千萬注冊用戶的實際參與、以及數億人的關注與談資。

時代洪流再度來襲,只不過這次的主角給予了 AI 技術。我們可以去質疑一種新的商業模式或者消費場景的市場有限性,但卻無法不去敬畏一種新技術革新所帶來的未來無限性,那是一場絕對的“無限游戲”!

緣起:細數幾大模型

2022 年初,由獨立開發者 Somnai 開發的 Disco Diffusion(簡稱 DD)在谷歌 Colab 云服務上正式對世界開放使用,4 月份開始在國內經很多設計與開源領域的大 V 傳播至熱,引發全民參與熱潮,不限于如何使用這種 AI 生產力工具、AI 藝術與人類藝術之爭、版權問題,乃至對現有各種視覺相關行業的沖擊幾何,紛繁復雜,不一而足,好不熱鬧。

緊隨其后的是一個更為強大的 AI 藝術工具 Midjourney(簡稱 MJ)開始在 Discord 上建立全球第一個集中式的 AI 創作者社區,在短短兩三個月內,僅靠這種自發的人人傳播,社區規模便突破了一百萬人,成為 Discord 有史以來規模最大的社區頻道,蔚為壯觀。

基于以太坊的文物保護平臺Salsal將在六個月內推出:金色財經報道,由倫敦大學學院考古系教授Mark Altaweel牽頭的學者正在開發基于以太坊的區塊鏈工具Salsal,以幫助博物館和文化機構組織和跟蹤有價值的歷史藏品。Altaweel 表示,將歷史記錄在區塊鏈上將是“博物館非殖民化”和保護文物的第一步,專業知識是 Salsal 實現廣泛采用所需的關鍵,博物館和收藏家將他們的歷史文物收藏提交到Salsal區塊鏈。然后,考古學家等專家將檢查每件文物,以確定其狀況、出處以及是否合法獲得。

Altaweel表示,Salsal 仍處于測試版本,但總體目標是在六個月內在以太坊上推出。[2023/8/5 16:20:19]

2022 年夏天,眾多科技巨頭紛紛涉足 AI 藝術領域,以 OpenAI、谷歌、微軟、百度最為積極,分別推出了 Dall·E 2、Imagen、Nuwa、文心一格。巨頭成?還是社區成?成為這個夏天 AI 藝術發展進程中最矚目的商業鏖戰。

但這些都尚不足以將 AI 藝術帶入到一個千億乃至萬億級的消費市場中,一種技術只有具備建立超級大生態的能力才會被歷史所輔證、被當下所青睞、被未來所銘記,就像曾經的 Linux、云計算、安卓、以太坊等在用生態來承載人類數字技術發展的 30 多年征途。而它們的繼承者今天也逐漸嶄露頭角——Stable Diffusion(簡稱 SD)。

CyberConnect已開放空投查詢網頁:8月4日消息,Web3 社交圖譜協議 CyberConnect 在社交平臺上表示,目前已開放空投查詢網頁,用戶可以通過官方網站查詢空投的資格和數量。

此前報道,CyberConnect 將向社區用戶發放空投獎勵,共計 240 萬枚 CYBER 將在 Season 1 中面向社區用戶開放申領,占代幣總量 2.4%。

持有 Mystery Box、The Shards、Mini Shards、W3ST、CyberProfile Premium Handle、CyberProfile Early Adopter NFT 的用戶可領取。具體的獎勵指南將于 8 月 4 日公布[2023/8/4 16:18:11]

SD 自今年 8 月份面世以來,秉承“大開源”的精神和宗旨,不僅在短短兩個月時間內讓其背后公司實體一躍成為市值高達十幾億美金的獨角獸,更吸引了全球數百萬乃至上千萬人積極參與其生態的建設,這場如火如荼的“去中心化運動”引爆了海內外的創業與投資熱潮,因此其意義之深遠遠超對自身的影響,其福澤被于世界與萬民。

而所謂的“大開源”,包括開放核心 AI 算法模型(Latent)、開放核心訓練數據集(LAION)、開放 AI 生成圖片的版權(CC0)。這種三位一體的開源模式,讓全世界所有普通人、極客、創業者、商業團體可以隨心所欲地完成對 SD 的部署、運行、改進和商業化,且大膽使用全世界人利用 SD 所無私貢獻的 AI 生成式圖片,而不必受制于版權的束縛,大膽地去創新,讓 AI 技術在視覺生成領域能夠零摩擦地大跨步向前,不必受制于商業的條條框框而固步自封。

3月共計價值1090萬美元的NFT被盜,環比減少約33%:金色財經報道,PeckShield在推特上表示,2023年3月,價值1090萬美元的NFT被盜,比上個月減少了32.72%。一半被盜的NFT在2 小時內迅速在市場上出售。74.9%的被盜NFT在Blur平臺上出售,19.5%的NFT在OpenSea上出售。[2023/4/3 13:41:38]

風靡國內外的 AI 藝術工具

時至今日,DD 雖然在商業化上無法體現效率、邊際成本、規模效應的優勢,但其對 AI 藝術開源運動的引領地位被廣泛認可,依然是更多新人入場所能夠首先免費享受到的 AI 藝術體驗,對于教學與用戶教育的意義依然存在且無法被替代。

在美學角度,DD 對于色彩的大膽繪制往往令人“心馳神往”,但其并不注重邏輯性,具有極為強烈的“AI 風格”,這種純粹追求對視覺的沖擊效果也經常被壁紙類創作者所青睞,因此在抖音、小紅書等社交媒體上經常會看到由 DD 所創作的“色彩美學”作品。幾乎所有的國產 AI 藝術產品和工具都會首先集成 DD,是對開創者的致敬,也是對其獨特美學體驗的認可,這種風格不因技術的進化而過時,也許會歷久而彌新,傳承為 AI 藝術最初始的模樣,愈發不可替代,則彌足珍貴!

數據:近24小時全網爆倉2.4億美元,以太坊爆倉8914萬美元:金色財經報道,據Coinglass數據,近24小時全網爆倉2.41億美元,其中以太坊爆倉8914.32萬美元,比特幣爆倉5574.89萬美元,SHIB爆倉1384.02萬美元。[2022/8/15 12:25:45]

DD繪制的中國二十四節氣

AI 藝術領域并非由開源獨撐,時至今日商業化最為成功的當屬 MJ。而 MJ 不僅完全閉源,還倡導付費模式。這種底氣當然來自其核心可控的技術、強大的產品、頂級的算法、不斷進化的數據集,使得 MJ 的出圖已經進入“大成之境”,不論從邏輯性還是細節都幾乎與人類藝術家難解難分。迄今為止,MJ 共發布了四個版本,而每個版本都有其“致命性”的革新,如 v2 版的“美學”、v3 版的“邏輯”、v4 版的“無可挑剔”。每次的新版本發布都無不讓全世界為之歡呼和追捧,這種場面不禁令人想到了當初 iPhone 從初代開始的每一場發布。有人戲稱,DD 是塞班,SD 是安卓,MJ 則是蘋果。戲謔之中,暗藏著歷史的重演,未來已在此處,只是分布不均。

靠著不斷進化的“深度”,MJ 全年都處于興盛不衰的狀態,是所有 AI 藝術創作者都頂禮膜拜的“岡仁波齊峰”。雖然 MJ 并沒有進駐中國消費市場,但憑借著大模型(Big Model)之“大力出奇跡”的精髓,加上 MJ 每天都在擴充自己的訓練數據集,這個扎根于海外的產物竟也十分理解中國元素。很多國內用戶用它刻畫古風、武俠、神獸、古建筑等系列,并燃爆了整個抖音和小紅書的公域流量,好的作品點贊量都高達一百多萬,比很多粉絲數上億的頭部主播發布的日常狀態都高。也許在七八月份的時候,很多用戶還能挑出 MJ 出圖的各種問題和瑕疵,但今天更多的是折服與認可,隨之而來的便是持續的商業化輸出。MJ 的創作者群體已經逐漸從一開始的純興趣愛好慢慢擴展至使用 MJ 進行商業設計與變現的職業群體,涉及影視制作、游戲設計、UI 設計、原畫、插畫、壁紙、數字藝術、數字藏品、元宇宙視覺等多個領域數百萬人的輻射。

Glassnode:處于虧損狀態的以太坊地址數突破3100萬,創近兩年新高:5月15日消息,據Glassnode數據顯示,處于虧損狀態的以太坊地址數(7日平均)達31,101,288.667個,創近兩年新高。[2022/5/15 3:16:59]

MJ 目前將社群構建在海外社交軟件 Discord 之上,從 0 到 100 萬人僅僅不到半年時間,而更是在隨后的兩個月時間內從 100 萬干到了近 400 萬左右的規模。

可以說 MJ 社群的規模增長速度恰如其分地反映了整個 AI 藝術行業 2022 年的發展軌跡和無盡潛力。作為 AI 藝術皇冠上的明珠,MJ 的存在無疑給了從事這個行業的創作者和創業者更多的信心和鼓舞,因為它在不斷證明——AI 藝術的進化是永無止境的!

AI藝術家AIBEN使用MJ創作的科幻作品

在技術基因上,SD 跟 MJ 有著太多相似、相比、相拼之處。比如出圖時間都在 1 分鐘以內,甚至秒級,這得益于像 SD 利用潛空間(latent space)極大地提升了擴散模型的繪制效率,將原本二維的像素空間畫布降維至一維的潛空間,這不僅僅是壓縮了時間,更讓圖像匹配人類描述的精準度大大提升,因此這類模型相比于初代的擴散模型更具商業落地可行性,可滿足千萬乃至上億人參與的新消費場景。

時至今日,由 MJ 和 SD 領銜的 AI 藝術消費市場已經在全球突破了一千萬用戶的大關,并在瘋狂地向一億全球用戶的新征程邁進。但 SD 目前在輸出圖像的藝術水準上相比于 MJ 還存在一些進步的空間,這與我們接下來要講得息息相關,也是 SD 生態正在努力的方向。

目前 SD 生態由公司實體 StabilityAI 和 RunwayML 共同領銜推進,與此同時一些第三方社區力量也舉足輕重,諸如 SD webui 項目、眾多二次元改進項目、可用于訓練 SD 新模型的 dreambooth 生態、可用于精準控制 SD 畫面輸出的交叉注意力技術方向等等。百花齊放,生態猶如熱帶雨林一般,可能每天都有生與死,但生生不息!

更值得注意的是,擴散模型技術大廈的構建更離不開眾多上游大技術的鼎力配合,尤其指更精準理解人類語義的大模型技術、文本與圖像多模態預訓練模型(CLIP)、AI 藝術輸出質量最為依賴的大規模訓練數據集等。

SD 今天的成就離不開當初對 LAION 數據集的全力支持,其中大名鼎鼎的 LAION-5B 是用于訓練下一代圖像文本模型的開放式大規模數據集,高達 58.5 億個圖像-文本對,共 80T 數據,是世界第一大規模、多模態的文本圖像數據集。

這個數據集的建立并非一朝一夕的工作,它是對互聯網發展近 30 年的縮影,要對海量的互聯網圖片做大量的工作,諸如提供了圖片過濾、水印圖片過濾、高分辨率圖片、美學圖片等子集和模型,以供不同方向研究。這就是互聯網的視覺 DNA!時至今日則由 CLIP、擴散模型等新一代 AI 技術進行編碼演繹,去勾勒出互聯網未來的模樣——元宇宙時代。隨著 LAION 的持續進化,SD 也會輸出更加高質量的 AI 藝術作品,就像 MJ 那樣。

誠如 StabilityAI 創始人 Emad 所言:“很高興支持創建這個為下一代模型奠定基礎的數據集。甚至更好的數據集正在開發中,它被設計為廣泛的、可擴展的。現在我們將向著多樣化、專業化和不斷提高質量前進。”

SD繪制的“萬事萬物”

如今人類有了眾多開源與閉源的 AI 藝術生產力,這其中有的可以直接進入商業生產,而有的則停留在娛樂體驗,因此就產生了付費與免費的用戶行為。對于極致水準的圖像生成,用戶付費的意愿也隨之強烈,這便是 AI 藝術這個行業極為明確的發展方向,進化是永恒的使命!

(注:全文超萬字,共分三篇,上篇以幾大 AI 藝術模型講述“緣起”,中篇以打破“十二道邊界”講述“意義”,下篇從最新技術動向的角度講明 AI 藝術尚存在的進化空間,暢想“未來”)

巴比特資訊

個人專欄

閱讀更多

金色早8點

比推 Bitpush News

Foresight News

PANews

Delphi Digital

區塊鏈騎士

深潮TechFlow

鏈捕手

區塊律動BlockBeats

DeFi之道

Tags:SALION以太坊CYBERUniversal DollarInternational Squid Games比特幣以太坊行情分析CyberSwap

DAI
金色觀察 | Messari:2023年DeFi十大趨勢_DEFI

Messari近日發布了年度報告Crypto Thesis 2023,長達168頁,其中第7章是關于DeFi的2023年10大趨勢.

1900/1/1 0:00:00
Coinbase董事會:要用更長遠的眼光看待Web3_WEB

撰寫:Katie Haun、Fred Wilson編譯:深潮 TechFlow圍繞 FTX 發生的事件動搖了許多人的信心.

1900/1/1 0:00:00
全球第一大加密貨幣借貸商 Genesis 為何走向崩潰?(更新中)_GENE

Genesis Global Trading 臨時首席執行官 Derar Islim 周三在電話會議上告訴客戶,其貸款部門在 FTX 崩潰后暫時暫停贖回和新貸款發放.

1900/1/1 0:00:00
ConsenSys:詳談L2 Rollup的競爭現狀和挑戰_BSP

原文標題:《ConsenSys:詳談 L2 Rollup 的競爭現狀和挑戰》原文作者:ConsenSys原文編譯:巖石上的刺猬,SevenUp DAO在過去的幾年中,隨著以太坊網絡活動的增加.

1900/1/1 0:00:00
從一而終:鏈上數據和DID結合透視去中心化奧秘_ENS

我們需要的是完整的去中心化,任何環節的缺失或者對中心化的妥協,都會造成一種破碎和斷裂,Web 3.0的優勢就無法被真正發揮出來。當我們推開Web 3.0的大門后,看到的只有荒蕪.

1900/1/1 0:00:00
FTX暴雷后SBF的真心話:贏家因勝利而高尚_KEL

原文來源:Kelsey Piper,Vox原文編譯:Leo、0x9F、FYJ,BlockBeats這是 Vox 的記者 Kelsey Piper 在 11 月 16 日晚與 FTX 創始人 SB.

1900/1/1 0:00:00
ads