以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads
首頁 > 酷幣 > Info

成立2年 每名員工價值2100萬美元 MosaicML憑什么賣出13億美元?_MOS

Author:

Time:1900/1/1 0:00:00

MosaicML以約13億美元的價格被大數據巨頭Databricks收購,其估值在本次交易中翻了六倍,成為了今年上半年最大的收購案。僅成立2年時間,擁有60多名員工,是什么撐起了MosaicML的高估值?

近期,AI領域掀起了一股投資收購熱潮。全球知名企業Salesforce向Anthropic注資4.5億美元,而Runway則成功籌集到了1.41億美元的資金。此外,雪花公司也宣布完成了對Neeva的收購,而中國國內巨頭美團則以20.65億收購了AI公司光年之外。

然而,最引人矚目的交易無疑是初創公司MosaicML的收購案。據了解,MosaicML以約13億美元的價格被大數據巨頭Databricks收購,其估值在本次交易中翻了六倍,成為了今年上半年最大的收購案。僅成立2年時間,擁有60多名員工,是什么撐起了MosaicML的高估值?

Databricks近期正式宣布,以約13億美元(約93億元人民幣)收購生成式人工智能初創公司MosaicML,以提供為企業構建類ChatGPT工具的服務。

該收購之后,MosaicML 將成為 Databricks Lakehouse 平臺的一部分,MosaicML 的整個團隊和技術都將納入Databricks旗下,為企業提供統一的平臺來管理數據資產,并且能夠使用自己的專有數據來構建、擁有和保護自己的生成式 AI 模型。

Rivermen宣布于4月16日正式成立香港運營節點:4月17日消息,元宇宙項目Rivermen宣布于4月16日正式成立香港運營節點,入局香港概念版圖。作為一款以中國傳統名畫《清明上河圖》為靈感的3D國風元宇宙項目,Rivermen意在通過香港運營節點更好地輻射泛中文人群,并與其他加密項目共同推動香港加密市場的繁榮發展。

此次在香港設立運營節點也將有助于Rivermen進一步整合資源、拓展市場,并借助香港作為加密圈勝地的優勢,為用戶帶來更加豐富多彩的元宇宙體驗。未來,Rivermen將參加多個香港舉辦的加密活動,與行業內投資機構和熱門項目共同探討元宇宙和GameFi相關問題。[2023/4/17 14:08:10]

MosaicML是一家非常年輕的生成式AI公司,它于2021年成立于舊金山,目前只公開披露過一輪融資,員工僅62人。在上一輪的融資中,其估值為2.2億美元,也就是說,此次收購MosaicML的估值直接躍升了6倍。此筆交易是截至目前今年生成式AI領域內所公布的最大一筆收購案。就在不久前,云計算巨頭Snowflake剛剛宣布收購了另一家生成式AI公司Neeva。在經歷了幾個月的投資熱之后,大型企業對生成式AI初創公司的大規模并購潮似乎正在開啟。

動態 | 內蒙古區塊鏈研究院正式成立:1月22日,內蒙古區塊鏈研究院揭牌儀式今日舉行。內蒙古區塊鏈研究院成立后,將積極開展區塊鏈技術交流、應用研究、產業培育、人才培養等工作,為自治區區塊鏈技術和產業創新發展提供智力、技術、人才、產業支撐,促進區塊鏈技術和市場經濟深度融合,推進全區數字經濟高質量發展。(內蒙古社區報)[2020/1/22]

Databricks起源于UC伯克利,曾參與Apache Spark項目開發。作為數據存儲和分析巨頭,截至2022年估值310億美元,幫助AT&T、殼牌、Walgreens等大型公司處理數據。前段時間,剛開源了自己大模型Dolly,旨在以更少參數實現與ChatGPT類似的效果。而在云計算更加普及后,Spark提出的“湖倉一體”理念,深深影響了一批大數據初創企業。自2013年成立后,Databricks火速成長為全球最火的Data Infra公司。去年,Databricks公布的年收入超過10億美元,而在2021年8月完成最新一輪融資后,其最新估值達到380億美金。

MosaicML的MPT系列模型是從HuggingFace PretrainedModel基類中子類化的,與HuggingFace生態系統完全兼容。MPT-7B模型是MosaicML最受歡迎的模型之一,擁有數十億個參數,可以處理超過2,000種自然語言處理任務。其中,MPT-7B的優化層包括FlashAttention和低精度層范數等,可以讓該模型比傳統訓練方法快2-7倍,資源的近線性可伸縮性確保了具有數十億參數的模型可以在幾小時內訓練,而不是過去的幾天。MosaicML還發布了新的可商用的開源大語言模型MPT-30B,擁有300億參數,并且性能優于GPT-3。

動態 | 報告:近半數活躍加密交易所于2016年后成立,30%的加密交易所集中英國、中國和美國:The Block利用了來自CryptoCompare的聚合交易所列表,以及來自CoinMarketCap和Nomics的列表數據進行分析,并過濾了去中心化的交易所數量,結果得到159個交易所,其中有138個交易所有實際的創建日期。在接受調查的138家交易所中,超過49%是在2016年之后成立的。同時在各地區中,英國是加密貨幣交易所最喜歡的創建地,其次是中國和美國。在考察的159家交易所中,有30%的總部位于英國、中國或美國。(區塊律動)[2019/10/16]

數據來源:MT-Bench對MosaicML主流模型進行的評估MPT系列模型的優勢在于它們的高效性和低成本。使用大量數據進行“訓練”的人工智能模型的復雜度急劇上升,訓練一個模型現在至少要花費數百萬美元,除了大公司之外,其他中小型企業普遍都無法承受。而MosaicML的MPT系列模型可以讓企業以更低的成本和更高的效率訓練自己的語言模型,從而可以更輕松地應用生成式AI技術,實現更好的業務表現。大多數開源語言模型只能處理最多具有幾千個tokens的序列(參見圖 1)。但是,借助 MosaicML 平臺和 8xA100-40GB 的單個節點,用戶可以輕松微調 MPT-7B 以處理高達 65k 的上下文長度。處理這種極端上下文長度適應的能力來自ALiBi,這是MPT-7B中的關鍵架構選擇之一。

動態 | 山東大學-南洋理工大學人工智能國際聯合研究院成立 規劃區塊鏈智能等研究方向:據新浪山東報道,7月5日下午,山東大學-南洋理工大學人工智能國際聯合研究院在山東大學中心校區揭牌成立。山東大學-南洋理工大學人工智能國際聯合研究院由山東大學、新加坡南洋理工大學聯合發起建立,屬于學校獨立直屬科研機構。兩校結合科研合作基礎,發揮各自學科優勢,突出雙方研究特色,規劃了人工智能基礎理論、AI健康與樂齡、眾智理論與智慧政務、區塊鏈智能、跨媒體智能、智能服務應用研究等重點研究方向。[2019/7/6]

例如,《了不起的蓋茨比》的全文不到68k個Token。在一個測試中,模型StoryWriter閱讀了《了不起的蓋茨比》并生成了一個尾聲。模型生成的尾聲之一如圖 2 所示。StoryWriter在大約20秒內(每分鐘約15萬字)讀完了《了不起的蓋茨比》。由于序列長度較長,其“打字”速度比其他MPT-7B型號慢,每分鐘約105個單詞。盡管 StoryWriter 的上下文長度為 65k 進行了微調,但 ALiBi 使模型能夠推斷出比訓練更長的輸入:在《了不起的蓋茨比》的情況下為 68k 個Token,在測試中高達 84k 個標記。

動態 | 英國金融委員會將成立區塊鏈專家委員會:據financemagnates報道,與零售外匯或合約市場不同,加密貨幣交易中如果出現糾紛,交易者沒有太多的追索權。為此英國金融委員會周四宣布,將成立區塊鏈專家委員會(BEC),以解決區塊鏈交易中可能出現的問題。該委員會由加密貨幣和區塊鏈行業的專業人士組成,將中立、公正的向金融委員會提供協商、反饋和建議,以解決問題。[2018/8/24]

圖2:MPT-7B-StoryWriter-65k+ 為《了不起的蓋茨比》寫了尾聲。尾聲的結果是提供《了不起的蓋茨比》的全文(大約 68k 個Token)作為模型的輸入,后跟“尾聲”一詞,并允許模型繼續生成。生成式AI技術的普及生成式AI技術是人工智能的一種分支,它利用大量的數據和深度學習算法,能夠自動生成原始文本、圖像和計算機代碼等內容。這種技術的出現,讓人們可以更加便捷地處理數據、分析數據,更好地服務于人類的需求。隨著大數據和人工智能技術的快速發展,生成式AI技術已經被廣泛應用于自然語言處理、圖像識別和虛擬現實等領域。例如,在自然語言處理領域中,GPT-4已經成為了最受歡迎的生成式AI模型之一,可以用于生成文章、翻譯語言和回答問題等任務。在圖像識別領域,StyleGAN2能夠生成高質量的圖像,可以用于游戲開發、影視制作和虛擬現實等領域。

MosaicML的CEO Naveen Rao此前曾表示,自 2018 年以來,使用大量數據進行“訓練”的人工智能模型的復雜度急劇上升,訓練一個模型現在至少要花費數百萬美元,除了大公司之外,其他中小型企業普遍都無法承受。而此次收購之后,Databricks的Lakehouse 平臺和 MosaicML 技術的聯合產品將能夠讓企業可以使用自己的專有數據來簡單、快速、低成本進行生成式AI模型的訓練和構建,在讓用戶擁有數據的控制權和所有權的情況下,可以進行自定義 AI 模型開發。根據Databricks的相關說法,在 Databricks 和 MosaicML的平臺和技術支持下,企業訓練和使用 LLMs 的成本將顯著降低,預計可以降至數千美元左右。這為生成式AI的普及提供了便利。

Databricks收購MosaicML的主要目的是加速生成式AI技術的發展和民主化。通過將兩家公司的技術和資源整合起來,Databricks可以更好地滿足客戶的需求,提供更高效、更便捷的解決方案。具體而言,該收購將帶來以下幾個方面的改變:

Databricks收購MosaicML后,可以將MPT系列模型集成到其Lakehouse平臺中,為客戶提供更高效、更低成本的大語言模型。這將有助于企業更好地處理自然語言處理任務,提高業務效率和準確性。

MosaicML的MPT系列模型具有快速訓練的特點,這將有助于Databricks提供更快速的模型訓練服務。這對于需要快速響應市場需求的企業來說尤為重要,可以幫助他們更好地滿足客戶的需求。

Databricks收購MosaicML也意味著生成式AI技術的民主化程度將會進一步提高。MosaicML的MPT系列模型可以讓中小型企業更輕松地訓練自己的語言模型,從而可以更好地應用生成式AI技術,實現更好的業務表現。這將有助于推動生成式AI技術的發展和應用,促進人工智能技術的普及和發展。

生成式人工智能應用程序旨在根據用戶的自然語言提示生成原始文本、圖像和計算機代碼。自去年11月人工智能初創公司OpenAI推出在線生成AI聊天機器人ChatGPT以來,人們對這項技術的興趣激增。“每個組織都應該能夠從人工智能革命中受益,并對其數據的使用方式有更多的控制。Databricks 和 MosaicML 有一個難以置信的機會來實現人工智能的民主化,并使 Lakehouse 成為構建生成式人工智能的最佳場所。”Databricks 聯合創始人兼首席執行官 Ali Ghodsi表示。

Databricks收購MosaicML的意義不僅在于加速生成式AI技術的發展和民主化,更在于將兩家公司的技術和資源整合起來,為客戶提供更高效、更便捷的解決方案。隨著人工智能技術的快速發展和應用,生成式AI技術將扮演著越來越重要的角色,Databricks收購MosaicML的舉動也體現了各企業對于這個方向的重視和投資。像Anthropic和OpenAI這樣的公司將現成的語言模型授權給企業,然后企業在其上構建生成AI應用程序。在對這些模型的強勁商業需求的推動下,為像MosaicML這樣的初創公司創造了機會。從Snowflake和Databricks接連的收購步伐中我們可以看到,大型科技公司對于生成式AI技術正在從自主研發、戰略投資逐步邁向兼并收購階段。

參考來源:

https://www.databricks.com/company/newsroom/press-releases/databricks-signs-definitive-agreement-acquire-mosaicml-leading-generative-ai-platform

https://mattturck.com/mosaic/

https://twitter.com/lmsysorg/status/1672077353533730817/photo/1

https://www.mosaicml.com/blog/mpt-7b#appendix-eval

https://www.mosaicml.com/blog/mpt-30b

-R3PO

個人專欄

閱讀更多

極客 Web3

Foresight News

金色財經 Jason.

白話區塊鏈

金色早8點

LD Capital

MarsBit

深潮TechFlow

Tags:MOSAICSAIOSAIMOSAICOSaitaMarsSOSAMZ

酷幣
為什么選擇去中心化交易平臺_KINE

隨著區塊鏈技術的飛速發展,去中心化交易平臺在數字資產交易領域嶄露頭角,其中Kine Protocol以其卓越的安全性和獨特性吸引著越來越多的用戶加入Kine Protocol.

1900/1/1 0:00:00
紅杉和 IDG 領投 dappOS 將如何實現從賬戶抽象到鏈抽象_DAP

作者:angelilu,Foresight NewsWeb3 操作協議 dappOS 近期宣布以 5000 萬美元估值完成種子輪融資.

1900/1/1 0:00:00
Bald 秒變“跑路龍頭”后 Base 生態能否再造 Meme 熱潮_BAL

作者:Mia,鏈捕手 近日,Base 上的 Meme 龍頭 Bald 一日千倍引發加密社區熱烈討論,而當大家正沉浸在“Blad 是否會創造新一輪暴富神話”的思考中.

1900/1/1 0:00:00
BALD市場操縱事件全解讀:幕后推手到底賺了多少錢?_BAL

作者:鏈上分析師 thiccy(@thiccythot_);編譯:PANews在Coinbase最新推出的L2 Base區塊鏈上.

1900/1/1 0:00:00
Arkham萬字投研報告:業務、賽道及估值_ARK

作者: WJBArkham是一個加密情報平臺,專門用于系統地分析區塊鏈交易并對其進行去匿名化,以向用戶展示背后的人員、公司以及與交易相關的數據和信息,以進一步分析他們的行為.

1900/1/1 0:00:00
比特幣擴容解決方案:Stacks_比特幣

1.摘要 比特幣是最安全和最持久的區塊鏈,但它也面臨著可擴展性和功能性的挑戰。比特幣的設計是簡約的,旨在保持不變.

1900/1/1 0:00:00
ads