以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads
首頁 > 區塊鏈 > Info

完全基于Transformer的目標檢測器,ICLR匿名論文視覺、檢測統一_DET

Author:

Time:1900/1/1 0:00:00

機器之心報道

編輯:陳萍

一種新的集成視覺和檢測Transformer的目標檢測器ViDT。

Transformer在NLP任務中取得不錯的發展,許多研究將其引入到計算機視覺任務中。毫不夸張的說,Transformer正在改變計算機視覺的格局,尤其是在識別任務方面。例如Detectiontransformer是第一個用于目標檢測的、端到端的學習系統,而visiontransformer是第一個完全基于transformer的圖像分類架構。在本文中,一篇被ICLR2022接收的匿名論文集成了視覺和檢測Transformer(VisionandDetectionTransformer,ViDT)來構建有效且高效的目標檢測器。

ViDT引入了一個重新配置的注意力模塊,將SwinTransformer擴展為一個獨立的目標檢測器,之后是一個計算高效的Transformer解碼器,該解碼器利用多尺度特征和輔助技術,在不增加計算負載的情況下提高檢測性能。

KBW置評SilverGate:SilverGate的資產負債表完全就是現金和證券:金色財經報道,KBW在投資者通報中置評區塊鏈公司SilverGate稱,SilverGate的資產負債表完全就是現金和證券。[2023/1/6 10:24:41]

在MicrosoftCOCO基準數據集上的評估表明,ViDT在現有的完全基于transformer的目標檢測器中獲得了最佳的AP和延遲權衡,其對大型模型的高可擴展性,可達49.2AP。

論文地址:https://openreview.net/pdf?id=w4cXZDDib1H

ViDT:視覺與檢測Transformer

ViDT架構如下圖2(c)所示:

首先,ViDT引入了一種改進的注意力機制,名為ReconfiguredAttentionModule(RAM),該模塊有助于ViT變體處理附加的和token以進行目標檢測。因此,ViDT可以將最新的帶有RAM的SwinTransformer主干修改為目標檢測器,并利用其具有線性復雜度的局部注意力機制獲得高可擴展性;

趙長鵬:幣安在全球完全合規,希望更積極地與監管機構接觸:3月8日消息,幣安首席執行官趙長鵬上周四晚上在威斯敏斯特參加了一個有影響力的英國政府官員聚會。

據出席聚會的人士透露,3月3日,趙長鵬在唐寧街10號、財政部以及國會議員的晚宴上發表了演講。此次晚宴是由保守派智庫政策研究中心組織的。

在演講中,趙長鵬承認幣安成立至今也曾犯過錯誤,但他強調,自己現在希望更積極地與監管機構接觸。

“感覺他在這里是在進行魅力攻勢,”一位消息人士說。另一人表示,唐寧街和財政部顧問的出席“表明政府對此事的重視程度”。

幣安的一名發言人拒絕就晚宴上的討論置評,但表示,趙長鵬“已經明確表示,我們在全球完全合規,我們希望盡可能獲得所有許可和注冊。”(The Block)[2022/3/9 13:45:14]

其次,ViDT采用輕量級的無編碼器neck架構來減少計算開銷,同時仍然在neck模塊上啟用額外的優化技術。請注意,neck編碼器是不必要的,因為RAM直接提取用于目標檢測的細粒度表示,即token。結果,ViDT獲得了比neck-free對應物更好的性能;

經濟日報:央行數字貨幣試點不會完全取代現金:11月2日,經濟日報發文《央行數字貨幣試點不會完全取代現金》。文章指出,中國人民銀行數字貨幣研究所所長穆長春表示,央行數字貨幣要從替代流通中的紙鈔和硬幣入手,并非要取代所有的人民幣。在商業銀行賬戶里的余額,實際上已經是以數字化形態存在了,沒有必要再替換。不少專家認為,即使推出央行數字貨幣,在相當長時間內,法定數字貨幣也不可能完全取代現金,二者將長期共存。[2020/11/2 11:24:08]

最后,該研究引入了用于知識蒸餾的token匹配新概念,它可以在不影響檢測效率的情況下從大型模型到小型模型帶來額外的性能提升。

RAM模塊

該研究引入了RAM模塊,它將與和token相關的單個全局注意力分解為三個不同的注意力,即×、×和×注意力。如圖3所示,通過共享和token的投影層,全部復用SwinTransformer的所有參數,并執行三種不同的注意力操作:

聲音 | 中國政法大學史明洲:區塊鏈可在事實問題上實現對法官的完全替代:中國政法大學民商經濟法學院講師、法學博士史明洲刊文《區塊鏈時代的民事司法》。文章表示,人工智能可以在法律問題上實現對法官的部分替代,而區塊鏈技術可以在事實問題上實現對法官的完全替代。區塊鏈能夠把法官從事實認定難題中解放出來,是一次民事司法的生產力革命。區塊鏈技術正處于不斷成熟過程之中,其司法應用可以分為初期、中期、遠期三個階段:初期的區塊鏈存證能夠解決電子證據認定難問題、中期基于法定數字貨幣的財產查控能夠解決強制執行難問題、遠期的債權行為“可視化”系統能夠解決虛假訴訟等問題。[2019/11/7]

ENCODER-FREEneck結構

為了利用多尺度特征圖,ViDT結合了多層可變形transformer解碼器。在DETR家族中,其neck部分需要一個transformer編碼器,用于將從骨干中提取的用于圖像分類的特征轉換為適合目標檢測的特征;編碼器通常在計算上很昂貴,因為它涉及×注意力。然而,ViDT只保留了一個Transformer解碼器作為其neck,因為帶有RAM的SwinTransformer直接提取適合目標檢測的細粒度特征作為獨立的目標檢測器。因此,ViDT的neck結構在計算上是高效的。

聲音 | 洪蜀寧:希望交易哈希代替交易本身的完全匿名抗追蹤方案能應用到比特幣中來:洪蜀寧發微博表示,這是中本聰關于Red為比特幣提出的用交易哈希代替交易本身的完全匿名抗追蹤方案的評價,可惜比特幣至今未能實現,倒是在mimblewimble里實現了,希望有一天能移植到比特幣中來。[2019/6/9]

解碼器從帶有RAM的SwinTransformer接收兩個輸入:從每個階段生成的token從最后階段生成的token,如圖2(c)的Neck所示。在每個可變形的transformer層中,首先執行×注意力。對于每個token,應用多尺度可變形注意力以生成一個新的token,聚合從多尺度特征圖

中采樣的一小組關鍵內容:

用于目標檢測的token匹配知識蒸餾

雖然大型模型具有實現高性能的高容量,但在實際使用中它的計算成本可能很高。因此,該研究還提出了一種簡單的知識蒸餾方法,可以通過token匹配從大型ViDT模型中遷移知識。

匹配每一層的所有token在訓練中非常低效,因此,該研究只匹配對預測貢獻最大的token。兩組token直接相關:P:用作多尺度特征圖的token集合,由body中的每個階段生成,D:token的集合,它們是從neck的每個解碼層生成的。因此,基于token匹配的蒸餾損失公式為:

評估

表2將ViDT與DETR(ViT)和YOLOS的AP、FPS等進行了比較,其中DETR(ViT)有兩個變體:DETR和DeformableDETR。

實驗結果表明:ViDT實現了AP和FPS之間的最佳權衡。憑借其高可擴展性,其性能優于1億個參數的Swin-base,在相似的AP的下,FPS比DeformableDETR快2倍。此外,ViDT參數為16M,得到40.4AP,比DETR(swin-nano)和DETR(swin-tiny)高分別高6.3AP、12.6AP。

表3對比了不同空間位置編碼與ViDT的結果。結果表明:pre-addition比post-addition帶來的性能提升更高,即sinusoidalencoding優于learnable編碼;因此,正弦空間編碼的2D歸納偏置在目標檢測中更有幫助。特別是,與不使用任何編碼相比,使用正弦編碼的預加法將AP增加了5.0。

表4總結了使用不同選擇策略進行交叉注意力時的AP和FPS,其中SwinTransformer總共包含四個階段。有趣的是,只要在最后階段激活交叉注意力,所有策略都表現出相似的AP。由于在各個階段中以自下而上的方式提取特征,因此在低級別階段很難直接獲得有關目標對象的有用信息。因此,研究者想要獲得較高的AP和FPS,只使用最后階段是最好的設計選擇,因為token的數量最少。

為了徹底驗證輔助解碼損失和迭代框細化的有效性,該研究甚至對YOLOS等neck-free檢測器進行了擴展。表5顯示了兩種neck-free檢測器YOLOS和ViDT(w.o.Neck)性能。實驗結果證明在ViDT中使用Neck解碼器來提高目標檢測性能是合理的。

下圖表明:教師模型的規模越大,學生模型的收益越大。從系數來看,系數值越大,性能越好。模型蒸餾將AP提高了1.0-1.7,而不會影響學生模型的推理速度。

研究者將所有提議的組件結合起來,以實現目標檢測的高精度和速度。如表8所示,有四個組件:(1)RAM將SwinTransformer擴展為獨立的目標檢測器,(2)neck解碼器利用多尺度特征和兩種輔助技術,(3)從大模型中獲益知識蒸餾,(4)解碼層drop進一步加快推理速度。結果表明:當使用Swin-nano作為其主干時,它僅使用13M參數就達到了41.7AP和合理的FPS。此外,當使用Swin-tiny時,它僅損失了2.7FPS而表現出46.4AP。

Tags:DETETRRAMDET幣是什么幣ETR價格ETR幣RAM幣RAM價格

區塊鏈
6億美元加密貨幣因區塊鏈被黑失竊_加密貨幣

本報訊游戲區塊鏈浪人網絡29日說,黑客入侵其系統,盜走價值約6.15億美元的加密貨幣。據法新社報道,黑客23日侵入浪人網絡系統,盜走約17.4萬枚以太幣和2550萬枚按1比1比例與美元掛鉤的穩定.

1900/1/1 0:00:00
泰國將于3月24日發行20泰銖聚合物紙幣以替代紙幣_BOT

泰國中央銀行(BOT)公布了新的20泰銖聚合物鈔票,有別于傳統紙鈔,新版鈔票將由塑膠制成,比起舊版鈔票更耐用且不易臟,新版鈔票預計在2022年3月24日開始流通.

1900/1/1 0:00:00
數字人民幣試點場景超800萬個,美團等互聯網平臺成用戶使用主要入口_數字人

來源:移動支付網   3月21日,新京智庫《2022數字人民幣與互聯網融合發展研究報告》正式發布.

1900/1/1 0:00:00
IPFS與Filecoin有什么關系?FIL幣會漲價嗎?_Filecoin

前面的文章中,已詳細聊過IPFS。可知這個技術已經非常成熟,取代HTTP只是一個時間的問題。那聊完技術,今天就來聊一聊跟我們大家息息相關的,就是Filecoin.

1900/1/1 0:00:00
NFT如何能快速成為2022年先鋒品牌營銷新密碼_NFT

營銷的浪潮總是一波接一波,一個波潮歸于平靜,總會有新的浪頭涌來,現在,NFT營銷的浪潮正洶涌。隨著Facebook改名Meta,元宇宙的概念被更多普羅大眾所知,與此同時,NFT營銷也越來越備受更.

1900/1/1 0:00:00
DAO是什么?如何把普通人送上太空_DAO

月球表面 當下最為熱火朝天的投資熱點是什么?在經歷一場拯救阿桑奇的加密朋克盛宴后,“DAO”已然出圈成為2022開年最為流行的投資名詞.

1900/1/1 0:00:00
ads