人工神經網絡
一個最重要的創新:人工神經網絡
簡單來講,神經網絡意味著理論上它可以學習任何用戶動作的映射!
為了介紹一會兒將使用的一些術語,從狀態到行動的映射將被稱為“策略”。
為了讓拳手的神經網絡學習策略,AI Arena將采取模擬學習和強化學習。其中神經網絡架構存儲在IPFS上。
在上圖中,神經元之間的連接稱為“權值”。當你的神經網絡正在“學習”時,所發生的是它正在改變權值的值。
AI Meta Club推出Entry Pass NFT:據官方消息,AMC宣布推出Entry Pass NFT(EP NFT),EP NFT是AMC生態的唯一通行證。每個NFT都是具有唯一的編號的數字資產,可享元宇宙經濟、游戲娛樂、參與活動、AI軟件使用等特權。
此外EP NFT為會員帶來更多機會和福利。同時也創造了一個真正的數字經濟系統。 并且可以通過兩個EP NFT 鑄造出新的EP NFT,這將為生態擴建帶來更多建設者。[2023/6/28 22:05:22]
權值最終將決定狀態如何映射到動作,這意味著我們可以將權值解釋為“智能”。
神經網絡權值對于每個NFT都是唯一的,并存儲在以太坊上。
AI設計機制全攻略
狀態
(1)什么是狀態?
狀態是環境在某個時間點的表示。它并沒有包含所有信息——只包含了其中必要的信息。
OpenAI CEO:公司已不用API付費客戶數據訓練大語言模型:金色財經報道,ChatGPT開發公司OpenAI首席執行官Sam Altman表示,公司已經有一段時間沒有使用付費客戶的數據來訓練人工智能大語言模型了;用戶們顯然希望我們不要使用他們的數據進行訓練,所以我們已經改變了我們的計劃,未來我們也不會這樣做了。網絡記錄也顯示,今年3月1日,OpenAI悄然更新了其服務條款,不會使用通過其API提交的任何數據來服務改進,包括AI模型訓練,除非客戶或組織選擇加入。但OpenAI的新隱私和數據保護僅適用于使用該公司API服務的客戶。[2023/5/6 14:46:49]
例如:研究人員使用屏幕上的所有像素作為狀態,讓AI計算出像素代表什么。然后根據他們認為對決策過程重要的因素進行人工調試。
AI Arena一再強調其關心的是為所有人提供平等的機會——團隊希望獎勵能夠更多地給予堅持訓練AI的用戶,而不是獎勵擁有更多資源的用戶。
ECOChain獲得Thai Fund1500萬美金風險投資:據ECOC官網消息:近日繼“創世資本”“戰略投資ECOChain(ECOC)之后,泰國Thai Fund與ECOChain(ECOC)簽訂風險投資協議,為ECOChain(ECOC)技術研發與應用投資1500萬美金。
ECOChain(ECOC)是一個基于POS共識的全結構公有鏈系統,其底層技術以高安全性技術為支撐,在高TPS的基礎上兼顧了高區塊容量,并通過VM智能合約實現了跨鏈。ECOChain(ECOC)目前正在深入開發原子計算神諭系統以及POL定位系統,前者會于本月進入內測階段。
Thai Fund致力于傳統資本領域的投資,目前公司旗下管理著19只開放式基金。截至2019年12月底,公司管理資產總規模近500億元。[2020/7/27]
(2)游戲將使用哪些變量?
Dai 供應接近歷史新高,6 月以來 Balancer Labs 流動資金已增長 5.3 倍:DTC Capital 投資者 Spencer Noon 發文闡述了 5 個跡象表明 DeFi 采用正在迅速發展。1)首先在 BTC 美元借貸利率上,DeFi 超過了 CeFi。CeFi 用戶已經開始使用 DeFi 協議(例如 MakerDAO)進行再融資。2)目前去中心化穩定幣 Dai 的供應接近歷史新高 1.23 億;3) TokenSets 在 5 月再平衡達到歷史新高,有價值約 4,700 萬美元的加密貨幣在鏈上完成交易;4)盡管自 4 月以來 Synthetix 解鎖了 1600 萬美元的 SNX 的通脹獎勵,總鎖定價值(TVL)仍持續上升,強烈表明該代幣模型是可行的;5)自 6 月 1 日起,Balancer Labs 流動資金從 600 萬美元增至 3200 萬美元,增長了 5.3 倍。5 個池的流動資金超過了 100 萬美元,有 30 個池至少持有 10 萬美元。該協議中有 2 個資金池進入自動作市平臺資金池的前 5 名。[2020/6/13]
下面是狀態中包含的變量列表。需要注意的是,AI Arena將使用下標1表示用戶自己的AI,下標2表示對手。
動態 | Numerai 公司從Paradigm籌集了1100萬美元的融資:據coindesk消息,對沖基金和預測市場初創公司Numerai在3月份剛剛結束了一輪1100萬美元的融資,融資方是Paradigm和Placeholder,主要銷售NMR令牌。該公司于2017年通過空投首次推出NMR令牌。[2019/3/21]
此外,競技場的左邊界的X位置為0,右邊界的X位置為1。
訓練
(1)訓練概述
這是改變神經網絡中權值的過程,以使AI能夠起作用。
例如:如果我們在對手面前,我們可能希望我們的戰士出擊。
有一系列的權值可以實現這一點,訓練的重點是讓AI學會在特定場景中采取特定的行動。
AI Arena在應用程序中嵌入了以下培訓計劃:
模仿學習
為了學習如何戰斗,你的AI將觀察你并學習模仿你的動作。
自我學習
為了學習你無法教給它的技能,你的AI將與自己的副本對抗,以不斷提高。
(2)為什么需要訓練?
1·隨機初始化
首次創建NFT拳手時,神經網絡權值也隨之生成。一開始它會隨機采取行動,因為它不知道在什么情況下應該采取什么行動。
因此為了準備戰斗,我們必須訓練它,使它學會一個好的作戰策略。
2·隨機策略
正如上文“神經網絡”部分中提到的,從狀態到動作的映射稱為策略。
換句話說,策略定義了代理在某些情況下的行為方式。在訓練之前,NFT拳手還沒有學會一個好的戰斗策略,所以只是隨機行動。
(1)通過觀察學習
理解模仿學習的最好方法是想象你是一個師父,你的AI是一個你正在準備戰斗的戰士。
你用你的人工智能進行搏擊,它學習模仿你在特定場景中的動作。
我們正在寫一篇關于模仿學習的綜合博文,到時候會將其鏈接到這里。
(2)演示
實際情況:你實際操控的是左邊的灰色拳手,而你的AI在右邊。你可以測試一些動作,觀察AI如何模仿你。
請注意:它不會立即復刻你的動作,因為神經網絡需要一點時間來學習,所以在AI學會之前,你可能需要多重復幾次你的動作。
為簡單演示,目前AI Arena只允許用戶使用這些操作:向左跑、向右跑、單拳、雙拳和防守。
(1)完美匹配
最完美的拳擊搭檔就是用戶自己。通過自我學習,你的AI總是在不斷地挑戰自己,不斷地改進。
(2)不同的學習范式
通過模仿學習,AI通過觀看演示進行學習。在自我學習中,AI像對手一樣學習和戰斗沒有多大意義,因為對手是人工智能本身的克隆。
但是如果沒有專家向人AI展示如何戰斗,那么它如何學習該做什么呢?——通過獎勵。
AI將學會采取給予它更多正向獎勵的行動,而減少采取給予它負面獎勵的行動。
定制訓練
Python環境[正在準備中]
AI Arena計劃為玩家引入一個python環境來訓練他們自己的模型。
目前,用戶僅限于使用團隊在應用程序中提供的兩種培訓方法;但不久的將來,應用程序將可以允許玩家導入其自定義培訓模型并上鏈。
游戲模式探索
戰斗
AI Arena目前有兩種可用的作戰模式:模擬賽和排位賽。除此之外,團隊計劃在不久后整合另外兩種作戰模式。
1)模擬賽
玩家可以在對抗競技場測試他們的拳手來預先訓練的AI。在這種模式下將沒有任何獎勵。
2)排位賽
玩家將讓他們的拳手去對抗來自世界各地的拳手。玩家的唯一目標就是努力攀登排行榜,成為競技場的冠軍!
玩家在排行榜上的排名越高,贏得一場戰斗的回報獎勵就越高。
3)目標
雖然每種戰斗模式都有其獨特之處,但它們都有一個共同的勝利目標:在指定的時間內消耗對手所有生命值。
鏈金交易員總結
目前AI Arena尚處在早期,很適合提前埋伏觀察。據官方透露,游戲正式版本大概率于明年推出,而今年年末推出的測試版本將只有白名單用戶可以參與體驗。
白名單用戶名額的獲取方式是參與團隊即將推出的解密游戲,通過游戲后的用戶將會被隨機選擇是否進入白名單。
有興趣的玩家可以加入他們的Discord嘗試體驗,大概率后期會有早鳥空投獎勵。
親愛的Bankless國民:如果我們今天問一千個人關于元宇宙的定義,我們可能會得到一千個不同的答案。有些人會說它一個平臺,有的人會說它是一個視頻游戲,還有更多的人可能會爭論"元宇宙"的概念.
1900/1/1 0:00:00以Facebook公司為代表的科技領域,開始深度的布局元宇宙板塊,這意味著這個賽道逐漸成為了風口.
1900/1/1 0:00:00最近海外很火的一個像素風鏈上社交平臺:Chillchat吸引了眾多目光,宣稱要將做成“元宇宙中的Discord 3.0”以及“將NFT帶入到日常生活中”.
1900/1/1 0:00:00憨態可掬的北京冬奧會吉祥物“冰墩墩”引發搶購熱潮,天才少女谷愛凌驚天一躍勇奪金牌圈粉無數,“翊”鳴驚人蘇翊鳴氣沖霄漢,冬奧單板大跳臺再奪金……北京冬奧會點燃了人們的冰雪熱情.
1900/1/1 0:00:00原文標題:《IOSG Weekly Brief | Curve 能否超越 Uniswap V3? #94》撰文:IOSG Ventures在過去的 DeFi 之夏中.
1900/1/1 0:00:00近日,隨著周杰倫等世界級巨星入場 NFT,NFT 市場也在 1 月迅速升溫,據 Dune Analytics 數據顯示,在一月僅僅過了一半時間的情況下.
1900/1/1 0:00:00