以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads
首頁 > 萊特幣 > Info

看不下去AI胡說八道,英偉達出手給大模型安了個“護欄”_THE

Author:

Time:1900/1/1 0:00:00

來源:量子位

作者:蕭簫

大模型們胡說八道太嚴重,英偉達看不下去了。

他們正式推出了一個新工具,幫助大模型說該說的話,并回避不應該觸碰的話題。

這個新工具名叫“護欄技術”,相當于給大模型加上一堵安全圍墻,既能控制它的輸出、又能過濾輸入它的內容。

一方面,用戶誘導大模型生成攻擊性代碼、輸出不道德內容的時候,它就會被護欄技術“束縛”,不再輸出不安全的內容。

另一方面,護欄技術還能保護大模型不受用戶的攻擊,幫它擋住來自外界的“惡意輸入”。

Lookonchain:孫宇晨錢包地址收到5250枚ARB空投并轉至Huobi:3月26日消息,據Lookonchain監測,孫宇晨錢包地址收到了5250枚ARB空投(價值6981美元),并轉移至Huobi。[2023/3/26 13:27:17]

現在,這個大模型護欄工具已經開源,一起來看看它的效果和生成方法。

防止大模型胡言亂語的三類“護欄”

根據英偉達介紹,目前NeMoGuardrails一共提供三種形式的護欄技術:

話題限定護欄、對話安全護欄和攻擊防御護欄。

數字人民幣無網無電支付功能正式上線:金色財經報道,數字人民幣無網無電支付功能正式上線,在部分安卓手機用戶中,數字人民幣App硬錢包的“支付設置”,已經新增“無網無電支付”入口,這一創新功能,后續還將面向更多機型及場景有序開放。(北京商報)[2023/1/11 11:05:22]

話題限定護欄,簡單來說就是“防止大模型跑題”。

大模型具備更豐富的想象力,相比其他AI更容易完成創造性的代碼和文字編寫工作。

但對于特定場景應用如寫代碼、當客服而言,至少用戶不希望它在解決問題時“脫離目標范圍”,生成一些與需求無關的內容。

這種情況下就需要用到話題限定護欄,當大模型生成超出話題范圍的文字或代碼時,護欄就會將它引導回限定的功能和話題上。

派盾:Angels To Miracles項目發生Rug Pull,合約部署者已轉移1350枚BNB:7月20日消息,派盾預警監測,Angels To Miracles項目發生Rug Pull,ATM代幣價格下跌46%,合約部署者(0xF836...73fBea)進行了大筆交易,并將1350枚BNB轉移至0x9777...dd3a49地址,隨后,1943.3枚BNB從上述地址(0x9777...dd3a49)轉移至TornadoCash。

此前消息,2020年10月尼日利亞正式推出其央行數字貨幣eNaira。[2022/7/20 2:25:59]

數據:合成資產協議Synthetix的單日交易量超2.5億美元:6月20日消息,Dune Analytics數據顯示,近日,合成資產協議Synthetix上每日的交易量都超過1億美元,今日的單日交易量已超過2.5億美元。據themerge.eth分析,1inch的集成推動了Synthetix上交易量的增長。除此之外,SIP-120提案的出現也起到了推動作用。[2022/6/20 4:40:51]

對話安全護欄,指避免大模型輸出時“胡言亂語”。

胡言亂語包括兩方面的情況。

一方面是大模型生成的答案中包括事實性錯誤,即“聽起來很有道理,但其實完全不對”的東西;

另一方面是大模型生成帶偏見、惡意的輸出,如在用戶引導下說臟話、或是生成不道德的內容。

攻擊防御護欄,即防止AI平臺受到來自外界的惡意攻擊。

這里不僅包括誘導大模型調用外部病APP從而攻擊它,也包括黑客主動通過網絡、惡意程序等方式攻擊大模型。護欄會通過各種方式防止這些攻擊,避免大模型癱瘓。

所以,這樣的護欄要如何打造?

如何打造一個大模型“護欄”?

這里我們先看看一個標準的“護欄”包含哪些要素。

具體來說,一個護欄應當包括三方面的內容,即格式規范、消息和交互流。

首先是格式規范,即面對不同問題的問法時,規定大模型要輸出的內容。

例如被問到“XX文章是什么”,大模型必須給出特定類型的“文章”,而非別的東西;被問到“誰發表了什么”,大模型必須給出“人名”,而非別的回答。

然后是消息定義,這里以“用戶問候”話題為例,大模型可以輸出這些內容:

最后是交互流的定義,例如告訴大模型,怎么才是問候用戶的最好方式:

一旦問候用戶的機制被觸發,大模型就會進入這個護欄,規規矩矩地問候用戶。

具體工作流程如下:首先,將用戶輸入轉換成某種格式規范,據此生成對應的護欄;隨后,生成行動步驟,以交互流指示大模型一步步完成對應的操作;最后,根據格式規范生成輸出。

類似的,我們就能給大模型定義各種各樣的護欄,例如“應對用戶辱罵”的護欄。

這樣即使用戶說出“你是個傻瓜”,大模型也能學會冷靜應對:

目前,英偉達正在將護欄技術整合進他們的AI框架NeMo中,這是個方便用戶創建各種AI模型、并在英偉達GPU上加速的框架。

對“護欄”技術感興趣的小伙伴們,可以試一試了~

Tags:THESynthetixETIIRAThe People’s CoiniBTC (Synthetix)metis幣發行量akira幣今天行情

萊特幣
DeFi 巨頭 Aave、Curve 推出穩定幣 重塑去中心化 3Pool_穩定幣

Aave原生穩定幣GHO、Curve原生穩定幣crvUSD是加密社區最近熱議的大事件,是時候對DeFi最著名的穩定幣池之一進行重塑了.

1900/1/1 0:00:00
一周融資速遞 | 30家項目獲投;已披露融資總額約為1.83億美元(4.24-4.30)_TAL

經Odaily星球日報不完全統計,?4月24日-4月30日公布的海內外區塊鏈融資事件共30起,較上周數據有一定減少,已披露融資總額約為1.83億美元,較上周數據有明顯下降.

1900/1/1 0:00:00
BRC熱潮,是散戶“最后的狂歡”嗎?_BRC

原文作者:Cookie,BlockBeats每年一度的「meme季」它又又又又來了。這是一個充滿焦慮的「季節」.

1900/1/1 0:00:00
明星公鏈隕落 Helium是如何把一手好牌打爛的?_HELI

原文作者:Jaleel、Leo,BlockBeats4月20日,Helium宣布已正式完成向Solana網絡的遷移,然而社區反應卻是一片唏噓.

1900/1/1 0:00:00
加拿大銀行:去中心化金融貸款的脆弱性_EFI

來源|BankofCanadaStaffWorkingPaper作者|?JonathanChiu,EmreOzdenoren.

1900/1/1 0:00:00
星球日報 | BTC及迷因幣快速下跌;Coinbase或將在阿聯酋設立國際中心(5月9日)_ILY

頭條 BTC?短線跌破?27500USDTOdaily星球日報訊OKEx?行情顯示,BTC?快速下跌,短線跌破?27500USDT,最低至?27300?附近USDT;現報?27525USDT.

1900/1/1 0:00:00
ads