以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads
首頁 > 火幣APP > Info

幾行代碼,GPT-3變ChatGPT!吳恩達高徒、華人CEO震撼發布Lamini引擎_MINI

Author:

Time:1900/1/1 0:00:00

來源:新智元編輯:Aeneas好困

快速定制模型的LLM引擎Lamini來了,開發者狂喜!

ChatGPT雖好,但始終有門檻。通常,只有擁有AI博士學位的大型機器學習團隊,才能這樣訓練一個模型。

為了把這個門檻打下來,團隊構建了Lamini引擎,從此,每個開發者都能夠擁有從GPT-3訓練ChatGPT的超能力!

劃重點:可以商用!可以商用!可以商用!

項目地址:https://github.com/lamini-ai/lamini/

Lamini的開發團隊表示,你需要的只是幾行代碼,就可以用托管數據生成器倆訓練自己的LLM,包括權重和其他所有的內容。

此外,你也可以使用開源的LLM,用Lamini庫對生成的數據進行微調。以及訪問完整的LLM訓練模塊,使用從LoRa等速度優化,到虛擬私有云(VPC)部署等企業功能。

對此,英偉達科學家JimFan表示,LLaMa+自定義數據正在成為新的范式,而Lamini的推出也帶了一種全新的模式——FaaS,微調即服務。

以太坊基金會啟動Road to Devcon資助活動:6月29日消息,以太坊基金會宣布,Devcon 7定于2024年在東南亞舉行,具體地點尚未確定。

此外,以太坊基金會啟動Road to Devcon(RTD)資助輪次,以支持不同地區新的以太坊活動、社區和教育舉措。申請截止日期為北京時間11月1日7:59。[2023/6/29 22:08:36]

MLOps的未來是「LMOps」。哪里有標準化,哪里就有機會。

OpenAI科學家,前特斯拉人工智能總監AndrejKarpathy也表示,LLM定制化的生態正在愈發火爆。

訓LLM就像prompt-tuning一樣簡單

寫一個prompt如此容易,但想要從基礎模型訓練出一個大語言模型,卻是如此困難。

因為需要花費大量時間,來找出微調模型失敗的原因,所以對數據集微調的迭代周期都是以月為單位的。

與之相反,微調prompt的迭代,只需要幾秒鐘,并且在幾個小時內,性能都能保持穩定。

這個過程只需要把有限數量的數據整合到prompt中就可以了,并不需要動輒幾TB的數據。

ChatGPT的誕生十分艱難,OpenAI的團隊花了幾個月的時間,在基礎的GPT-3模型上微調,并進行RLHF。這個門檻極高,只有大型的ML團隊才能完成這種訓練。

NFT項目Renga向美國專利商標局申請軟件和服務商標:金色財經報道,據美國專利商標局披露的申請信息顯示,由藝術家DirtyRobot創作的NFT項目已向該機構提交了軟件和服務商標申請,旨在使用戶能夠查看、交易和管理數字藏品和代幣。Renga商標申請涵蓋用于管理NFT和數字資產的可下載軟件,包括NFT和數字藏品的在線市場、以及用于電子存儲NFT的網站。商標申請表明,Renga即將推出的軟件將允許用戶查看、分析、記錄、存儲、監控、管理、交易和交換數字資產,如加密貨幣、數字代幣和NFT。[2023/4/4 13:43:22]

有500強企業的技術負責人這樣抱怨過:「我們團隊的10名機器學習工程師用了OpenAI的微調API,結果我們的模型反而變得更差了,怎么辦啊。」

「我真的不知道該怎么充分利用數據,我已經用盡了所有從在線教程中能學到的prompt魔法了。」

這,就是研究者構建Lamini的原因:讓每個開發者可以直接從GPT-3訓練ChatGPT。

任意LLM,秒變ChatGPT!

Lamini是一個LLM引擎,可以讓不僅僅是機器學習專家的任何開發人員,都能在大型數據集中,把高性能的LLM訓練得像ChatGPT一樣好。

這個過程,只需要Laimini庫的幾行代碼即可。

值得注意的是,這個庫中的優化遠遠超出了現在開發者可以使用的范圍,從更具挑戰性的優化到更簡單的優化。

比如,你想從不同的角度生成一個廣告文案。

首先,從llama模塊導入LLM引擎:

fromllamaimportLLMllm=LLM(name="marketing")

分布式云游戲平臺Now.gg獲NTT DoCoMo Ventures投資:金色財經報道,分布式云游戲平臺Now.gg宣布已獲得NTT DoCoMo Ventures投資,具體投資金額暫未公開。Now.gg主要支持PC、Android、Mac和游戲機等多設備玩家通過內置瀏覽器訪問分布式云游戲,NTT DoCoMo通過這次投資將會強化其基于瀏覽器的多設備元宇宙服務。(investingnews)[2023/2/15 12:07:37]

接下來,需要定義輸入和輸出類型。注意,這里一定要包括上下文,因為可以有助于LLM在自然語言中進行理解。

fromllamaimportType,ContextclassAdAspects(Type):tone:str=Context("toneofthemarketingcopy")product_features:list=Context("productfeaturestopromote")audience:str=Context("targetaudienceforthemessage")subject:str=Context("subjectortopicofthemessage")goal:str=Context("goalofthismarketingcampaignandmessage")classAdCopy(Type):title:str=Context("googleadtitletag")description:str=Context("googleaddescription")keywords:list=Context("keywordsforthesearchengine")

然后就可以開始提問了:

距離以太坊合并僅剩100個區塊高度:金色財經報道,據歐科云鏈OKLink數據顯示,當前距離以太坊合并僅剩100個區塊高度,預計將于23分鐘后啟動Paris升級。

注:The Merge 即“合并”,是以太坊2.0升級過程中的重要步驟之一。以太坊將在推出分片鏈之前進行主網與信標鏈權益證明系統的“合并”,這將標志著以太坊工作證明的淘汰以及向權益證明的完全過渡,合并后以太坊的能源消耗減少約 99.95%。[2022/9/15 6:58:05]

語氣:大膽,但不傲慢

特色:亞洲醬料和香料、家常調料和套餐包,可以輕松在家烹飪。

aspects=AdAspects(tone="boldandbright,butnotarrogant",product_features=,audience="suburbanfamilies",subject="deliciousasianmealswithoutgoingtoarestaurant",goal="getsuburbanmomsanddadstotrybuytheirfirstomsompackorfreetastingkit")ad_copy=llm(input=aspects,output_type=AdCopy)print(f"Adcopy:{ad_copy}")模型輸出:

嘗試Omsom的美味亞洲醬料、香料、家常調料和套餐包。輕松為家人在家做出美味佳肴。

>title='DeliciousAsianMealsWithoutGoingtoaRestaurant|Omsom'description="TryOmsom'sdeliciousAsiansauces,aromatics,andhome-cookedseasoningsandmealpacks.Easilycookdeliciousmealsathomeforyourfamily."keywords=

Voyager CEO在2021年股價高點時出售超過3000萬美元的股票:金色財經報道,VoyagerDigital的首席執行官StephenEhrlich從2021年2月9日到2021年3月31日,Ehrlich和他的特拉華州有限責任公司在11次單獨的銷售中出售了近190萬股公司股票,總計3100萬美元。在Ehrlich于2021年4月5日進行最終出售后,Voyager的股價將達到29.86美元的峰值。同期,比特幣上漲455%,以太坊上漲688%。三周后,VOYG的股價下跌了41%。到2021年11月,隨著加密貨幣市場整體達到頂峰,Voyager已從峰值下降了69%。

該公司今年早些時候在加密貨幣價格暴跌后遇到了麻煩,并在7月宣布破產之前凍結了客戶資產。根據破產申請,Voyager托管了13億美元的客戶加密資產,分布在350萬活躍用戶中。(CNBC)[2022/8/3 2:57:02]

如何創建自己的「ChatGPT」

基礎模型能理解一般的英語,但如果需要它們學習一些垂直語言和規則,prompt微調并不足夠,很多時候我們都需要構建自己的LLM。

利用用下面這個步驟,就能獲得像ChatGPT一樣遵循指令的LLM。

嘗試prompt-tuningChatGPT或其他模型

可以使用Lamini庫的API,在不同模型之間快速進行prompt-tuning,只需一行代碼,即可在OpenAI和開源模型之間切換。

Lamini庫已經優化了正確的prompt,這樣開發者就可以使用不同的模型,不必擔心如何為每個模型設置prompt的格式。

構建一個包含輸入-輸出對的大型數據集

這些數據集會向模型展示,它應該如何響應輸入,無論是遵循英文說明,還是以JSON響應。

研究者剛剛發布了一個只有幾行代碼的repo,使用Lamini庫,僅從100個數據點中,就能生成50k數據點。

而且因為使用Lamini庫來啟動Lamini引擎,所以這個過程根本不需要用到GPU。

在repo中,已經包含一個開源的70+k數據集。

項目地址:https://github.com/lamini-ai/lamini/

在大型數據集上微調基礎模型

除了數據生成器,研究者還發布了一個LLM,它使用Lamini對生成的數據進行了微調。以編程方式執行此操作的功能也會很快發布。

也可以把OpenAI的微調API作為起步。

在微調模型上進行RLHF

使用Lamini,就不再需要大型ML和人工標記團隊來運行RLHF。

部署到云端

只需點擊產品或功能中的API端點即可。

專為LLM打造的數據生成器

簡單來說,依照以下幾個步驟,就可以訓練自己的大語言模型了。

用于優化prompt微調和類型化輸出的Lamini庫。

用于微調和RLHF的高級Lamini庫,只需幾行代碼。

史上首個托管數據生成器,用于創建數據,來訓練遵循指令的LLM。注意,已獲得商業使用許可!

開源的指令跟隨LLM,使用上述工具,只需幾行代碼即可完成。

數據生成器工作原理

Lamini數據生成器是一個LLM管線,它采用原始的100多條指令的小集合,與預期的響應配對,生成50k+新的配對,靈感來自Stanford的Alpaca。這個生成管線使用Lamini庫來定義和調用LLM,以生成不同但相似的指令和響應對。

根據這些數據訓練后,你的LLM會遵循這些指示,因而得到改進。對于使用開源LLM的生成管線,研究者提供了一個很好的默認值,LaminiOpen和LaminiInstruct。

隨著每天新的LLM發布,研究者都會將默認值更新為性能最佳的模型。在目前的版本中,LaminiOpen用的是EleutherAI的Pythia,LaminiInstruct用的是Databricks的Dolly。

LaminiOpen會生成更多指令,而LaminiInstruct會生成這些指令的成對響應。

最終生成的數據集可供免費商業使用,已經通過CC-BY許可。

僅用一行代碼,就可以將Lamini庫的默認值換成其他開源或OpenAI模型。

研究者發現,OpenAI模型的平均表現更好,但它們的許可限制了將生成數據用于訓練類ChatGPT模型的商用。

對生成數據進行微調

在這個過程中,生成的數據會質量不一。

在微調之前,下一步就是將生成的數據過濾為高質量數據。

然后,Lamini會通過在這個過濾后生成的數據集上訓練基礎模型,來創建自定義LLM。

研究者已經發布了一個開源指令跟隨LLM,可以用Lamini來訓練Pythia基礎模型,生成的37k指令是從70k中篩選出來的。

顯然,Lamini庫的出現,讓迭代周期變得更快、更有效,有更多的人能夠構建模型,而不僅僅是試驗各種prompt。

團隊介紹

SharonZhou是Lamini的聯合創始人兼首席執行官。

個人主頁:https://sharonzhou.me/

她在哈佛大學獲得了計算機科學與古典文學聯合學士學位,并以最高榮譽獲得了碩士學位。

隨后,她在斯坦福大學獲得了計算機科學博士學位,師從吳恩達。

2022年,29歲的Zhou入選《麻省理工科技評論》「35歲以下科技創新35人」。

GregoryDiamos是MLPerf的聯合創始人。

他曾是百度硅谷AI實驗室的創始成員,對DeepSpeech和DeepVoice系統有貢獻。

參考資料:

https://lamini.ai/blog/introducing-lamini

Tags:MINIMINROMPROgeminidollarMinty ArtPhotoChromicbitopro交易所支持gopay

火幣APP
美聯儲加息 25 個基點并暗示暫停,鮑威爾稱“現在降息為時過早”_比特幣

美聯儲周三如期宣布加息25個基點,這是美聯儲自2022年3月以來的第10次加息,也是自2007年以來首次將聯邦基準利率上調至5%-5.25%的區間.

1900/1/1 0:00:00
熊市重襲還是短暫修正 12張圖解讀加密行業“迷之四月”_比特幣

作者:TheBlock研究主管@Lars編譯:Jordan,PANews在經歷了表現不俗的2023年一季度后,加密行業并未繼續高歌猛進,4月份再次陷入低迷,有人認為熊市并未完全結束.

1900/1/1 0:00:00
20位從業者,8種態度,ACGN走入AIGC迷城_AIG

來源:靠譜二次元,作者:靠譜編輯部,作者:哈士柴 圖片來源:由無界AI工具生成ChatGPT4發布后,AI熱潮席卷全球一個多月,國內有大語言模型產品的公司超過了20家.

1900/1/1 0:00:00
NFT 和 AI 新興技術共赴盛宴,一場前所未有的英國加冕皇室體驗_NFT

隨著英國隆重迎來國王查理三世時代,電視報道將主要集中在游行盛典和皇冠珠寶上。但在全國各地,慶祝加冕典禮的方式不再過時,而是更加數字化,不乏有創新者使用區塊鏈和限量版NFT等新興技術來大肆慶祝.

1900/1/1 0:00:00
Sui推出學術研究獎計劃,首輪將提供25萬美元支持_SUI

人工智能和機器學習領域是當今世界科技領域中最熱門的領域之一,它涉及到計算機科學、應用數學、統計學、物理學、生物學等眾多學科的交叉.

1900/1/1 0:00:00
Blur 借貸協議 Blend,NFTFi 協議矩陣關鍵棋_NFT

引言 盡管整體市場遇冷,但似乎Blur在NFTFi上向前躍進的腳步未曾放緩。根據其在5月2日所發布的推特動態,Blur正式從流動性聚合的直接交易層橫跨到借貸市場,接連推出了P2P永續借貸Blen.

1900/1/1 0:00:00
ads