在美劇《國土安全》里常出現這樣的橋段:警員在自己家里理出一面墻,把手上案件里的所有關聯人物和事件都貼在墻上,然后就是一個填肉的過程......照片、箭頭和關鍵詞組成一幅復雜的事件全貌。
——找到那個罪犯。
這幾乎是所有懸疑電影的經典場景。整個案件唯一的破綻就藏在這張關系網絡里,推理者的視線在這面墻上流轉,觀眾的腎上腺素也被極速調動起來。
圖源:《國土安全》劇照
我們會覺得這是合理的,設想中人類最敏銳的大腦可以穿破墻上的迷霧——如果墻上只有5個家庭,10個嫌疑人,和關于他們的100件事的話。
但如果把這面墻無限擴大,比如1億個嫌疑人,100億件事呢?
看起來這已遠超人腦的負載極限,但我們可能已經見過這樣的事了——或許你我的手機里就正在經歷這些——比如各式各樣的知識圖譜,以及在它底層,一個抽象出來叫做圖計算的技術概念。
圖計算緣起
“Things,notstrings.”
Google在2012年5月提出了這句話,以及知識圖譜的概念。
知識圖譜,由知識和圖譜兩個詞構成,前者是信息的內容要素,后者是信息最終的表現形態。這種信息間全新的連接方式,其基本組成單位是“實體—關系—實體”三元組,以及實體及其相關屬性—值對,實體之間通過關系相互聯結,構成網狀的知識結構。
知識圖譜能夠成立的核心是計算機的知識推理機制,圖計算為其提供了重要的底層技術支持。
圖計算中的“圖”即Graph,這是一種基于圖論而非數論的計算邏輯。
圖論的基本要素是“節點”和“邊”,“節點”可以理解為人或者網絡賬號這些相對靜態的實體,而“邊”則代表著不同實體之間的關系或者行為。
俄央行正開發數字盧布與其他CBDC之間的互動模式:4月23日消息,俄羅斯央行表示,支撐俄羅斯央行數字貨幣(CBDC)發行和流通的系統可能會與其他國家的數字法定貨幣很好地合作。在與俄羅斯立法者交談時,央行官員表示,這個問題仍需要解決,但強調目前正在開發數字盧布與其他CBDC之間的各種互動模式。替代方案包括與其他每個CBDC平臺建立雙向集成,或啟動一個國際數字平臺,以促進多個發行者的數字貨幣之間的同時互動。不過,俄羅斯央行仍然反對該國去中心化加密貨幣的自由流通,也不打算創建一個全國性的加密貨幣交易所。此前消息,俄羅斯央行擬允許對外結算在“實驗”環境中使用加密貨幣。[2023/4/23 14:22:02]
比如A在抖音上關注了B,這個動作就成為A和B之間這條“邊”上可包含的信息。“邊”在記錄內容的時候可以表示方向,這被稱為有向圖,而如果“邊”沒有標注方向則稱為無向圖。這種信息數據甚至可以是多模態的,比如在腦科學領域涉及光或電信號的時候。
相比于鏈表或者線性表的二維結構,“圖”相當于在結構上做了一次升維,這也讓其對于“關系”有更優越的描述能力,也更接近人類對于事物聯系的原生表達。
圖源:源于網絡
簡單來講,我們從來不是以Excel的樣子來理解外部世界的,圖的相互連接更接近正常人的思考方式。從遙遠的阿蘭?圖靈時代開始,人類就在思考如何讓機器像人類一樣思考,圖計算是目前為止最有潛力的路徑。
一開始只是試圖找到從鹿特丹到格羅寧根的最短路徑,荷蘭計算機科學家Dijkstra為了解決這個問題在1956年發明了尋求圖最短路徑的Dijkstra算法,這是最早與圖計算連接起來的概念之一。到Google創始人LarryPage在20世紀末發明了開創性的PageRank算法,以及隨著社交網絡時代降臨而繁榮起來的如Girvan-Newman算法等社區發現算法。
OKX Ventures Q1總結:NFT市場交易量環比增長137.04%至47億美元:4月5日消息,OKX Ventures發布2023年Q1總結表示,2023年Q1鏈上數據回暖,Layer 2市場日趨成熟,由于Ordinals協議帶來了NFT用例,比特幣網絡的季度費用達到了2021年Q4以來的最高水平。
此外,2023年Q1 NFT市場交易量快速增長,增長137.04%至47億美元,為2022年Q2以來的最高水平。但由于Blur的空投活動,導致OpenSea在2023年Q1失去了NFT市場主導地位。[2023/4/5 13:46:45]
這其中也能看出來,圖計算的定義本身也在經歷一個從狹義到廣義的延展過程。
狹義的圖計算更多指在確定不變的圖上做的計算,比如基于地圖信息的路網圖——在變化頻率和幅度很低的鹿特丹到格羅寧根之間尋找一條最短路徑——這是圖計算可以解決的典型問題。
廣義的圖計算指一切基于圖數據進行的分析計算,其中的數據概念進而擴充到海量規模并且富于動態變化,比如社交媒體的關系網絡,不斷發生新事件的歷史知識圖譜,或者將道路擁堵變化也考慮在內的路徑規劃。
于是圖數據庫的概念被引入進來。
圖數據庫是用來處理圖這種數據結構的工具,傳統的使用二維表格存儲數據的數據庫被稱為關系性數據庫——或者可以被理解成無數以橫豎軸結構展開的表數據的集合,圖數據庫則是另一種非關系性數據庫,它把所有表格打散了,然后織成一張網。
圖數據庫與關系型數據庫最大的不同是免索引鄰接。即圖數據模型中的每個節點都會維護與它相鄰的節點關系,這就意味著查詢時間與圖的整體規模無關,只與每個節點的鄰點數量有關,這使得圖數據庫在處理數據之間關系方面比關系性數據庫更加靈活之外,也具備處理大量復雜關系時比后者更優越的性能。
比特幣主導地位升至45.5%,達到9個月高點:金色財經報道,根據 TradingView 的數據,比特幣的主導地位(BTC市值占整個加密市場的份額)已達到 45.5% 的九個月高位。上一次達到 45% 以上是在 2022 年 6 月 25 日。
FundStrat Research解釋稱:“比特幣的主導地位通常被認為對加密市場是健康的,因為它表明市場泡沫相對較低(加密交易商選擇購買比特幣而不是更具投機性的山寨幣)”。FundStrat 認為,飆升可能反映出投資者對比特幣的興趣在 SVB 等傳統銀行倒閉時重新被“點燃”。[2023/3/16 13:06:55]
Google創始人LarryPage圖源:LearnBiography
圖計算與圖數據庫的發展是互聯網時代的一條暗線,在其中一些關鍵技術背后,可以看到谷歌、Meta、推特甚至高盛的身影——如果你還記得2007年開始爆發的那場金融危機的話——萊曼兄弟公司破產,高盛卻因為提前預見到了次級抵押貸款市場的熊市而活了下來,背后是圖數據庫系統——SecDB對危險的察覺能力。
不遑說,今天許多偉大公司都是基于圖計算領域的尖端技術而誕生或持續繁榮的。
而在經歷了幾十年的發展之后,圖計算現在站到了更廣泛的應用場景入口。
咨詢公司Gartner在《2021年十大數據和分析技術趨勢》的報告中預測,2025年全球將有80%的數據和分析創新會與圖技術有關。
在這屆世界人工智能大會上,與圖計算或圖數據有關的論壇數量也多達五場,是本次大會上被最高頻的概念之一。如螞蟻集團、亞馬遜云等矚目的圖數據庫框架,也在本屆WAIC上首次開源。
圖計算作為一種技術在國內開始成熟的標志是,小范圍的數據已無法探索技術上限,它比以往任何時候都需要更大的試驗場,比如6億用戶的抖音,或者12億用戶的支付寶。越來越多大型科技公司出現在關于圖計算的討論中。開源是產業化的隱喻,產業化的加速使圖計算開始獲得更豐富的能力縱深,甚至早已不局限在知識圖譜的領域。
Aave:將在未來幾周內部署其Stablecoin GHO測試網:10月14日消息,Aave發布其去中心化超額抵押Stablecoin GHO的發展進展。Aave表示,計劃在新的Aave V3市場在以太坊上部署之后將V3市場取代V2市場作為GHO的主要推動力,而此前部署在Aave V2中的GHO代碼已經由Open Zeppelin審計完成。
此外,Aave將允許Facilitator無需信任地鑄造和銷毀GHO,未來將發布如何申請該權限的指導框架。Aave還表示,GHO首個測試網的部署將在未來幾周內完成。[2022/10/15 14:28:13]
抖音與支付寶,兩條路徑
2018年8月,字節跳動內部開始自研圖數據庫ByteGraph的開發。
ByteGraph項目的發起是為了抖音核心的社交關系問題。個性化推薦系統逐漸成為互聯網各大社交媒體和電商網站的基礎能力。與此并行的,知識圖譜的場景也正在豐富,大量研究工作逐漸指向兩者的交匯處,圖計算與知識圖譜可以用來完善基于內容的推薦系統,從而提升推薦效果。
這是圖計算在字節跳動內的起點,并由此開始進入業務的底層開發場景。從抖音開始,ByteGraph逐漸演變為支持有向屬性圖數據模型、支持寫入原子性、部分Gremlin圖查詢語言的通用圖數據庫系統,隨后逐漸滲入今日頭條、TikTok、西瓜、等幾乎字節跳動全部產品線。
圖源:知乎
“字節跳動整個業務開發團隊,已經都在用圖建模的方式來表達和處理業務邏輯”,ByteGraph團隊負責人張帥表示。
開發團隊圍聚在一起探索業務時,往往會拽過來一塊白板,把初步的開發邏輯和任何靈感寫在一起。這某種程度上即是一種知識圖譜,并且天然與人類大腦思維接近。但此前這樣一張思維導圖需要被重新整理——可以理解為把圖文并茂的圖降維成一張Excel——再進入開發步驟。
音樂NFT初創公司Serenade完成420萬美元融資:7月4日消息,音樂NFT初創公司Serenade宣布完成600萬澳元(約合420萬美元)的新一輪融資,投資方包括音樂行業內多家公司高管以及“金剛狼”休·杰克曼。Serenade表示,他們計劃利用這筆最新融資進行全球化擴張,包括在美國設立一個辦事處并重新啟動“Serenade 2.0\"NFT市場。(musically)[2022/7/4 1:49:31]
但現在基于圖計算和圖數據庫,這張白板上的草圖可以直接被代碼化了。
在電商、到店業務甚至音樂等更復雜的場景嵌進信息流與社交屬性后,“圖”作為一種關系邏輯的重要性在字節跳動內完全顯示出來了。張帥透露ByteGraph已經在火山引擎上開始構建,這意味著字節跳動的圖數據庫開源已經開始提上日程。
在圖數據庫的進展方面,螞蟻集團走在字節跳動前面。在本屆WAIC上,螞蟻集團宣布開源圖數據庫TuGraph的單機版本。
螞蟻集團的圖數據庫研發從2015年開始,隔年第一次發布自研分布式圖數據庫并用于支付寶。2021年,螞蟻集團聯合清華大學自主研發的“大規模圖計算系統GeaGraph”完成了產品3.0版本的迭代。迭代后的版本查詢效率提升10倍,兼容性更強,并且正式升級為TuGraph。
相比抖音,支付寶背后有一張更龐大的用戶關系網絡,而其圍繞支付展開的科技金融業務,也讓兩者在進入圖計算領域的側重上分出差異。
圖源:MobileWorldLive
螞蟻集團看中的是圖計算中增強“薄”數據的表征,從而增強支付安全性的能力。
比如在支付寶的場景中,判斷一個用戶的消費偏好,或者這個人還款的信用,當用戶數據信息很豐富的時候,人工智能算法往往會得到很好的結果。但如果用戶背后沒有太豐富的信息——比如他只是偶爾的用支付寶轉過幾筆錢——如何得知這個人的特點呢?
圖數據比起以關系數據網為代表的表數據最鮮明的優越性在于,很多時候人、地點和事件的關聯性并不完全能以表的形式呈現,卻能用“節點”和“邊”這種更松散的形式記錄下來,這些隱形的關聯信息單獨來看并不能解釋某個關聯用戶的行為,但這張網聚集起來卻能形成一些社區發現。也因此,當這張關系網絡中納入的用戶越多,這種四兩撥千斤的能力也愈強。
“圖是一種最為靈活的連接方式,讓實體之間可以不受限制地連接”,螞蟻技術研究院院長陳文光表示,這同時也賦予了算法更多的“可解釋性”。
人跟隨著算法生活的蜜月正在過去,算法對人的過度入侵開始被提到高位審視。在這個過程中,算法已經不可逆的搭建起一套社會需要依附其上的運轉方式,于是當代碼替人做了決定——比如你的轉賬額度,或者為什么一直收到某一類的廣告——這個決定是如何做出的,需要可以被清晰追溯。
陳文光以社區發現舉了個例子:
“比如在某個社區里已知有一些“壞人’,然后我們發現某個人和這些鄰居的鏈接比較緊密,那這個人是”壞人”的概率也會更大。”
這是最基本的思路。一個人的節點特征是由他鄰居的節點特征通過某種運算,結合和他過去的特征合在一起型成的。能夠影響我們對一個人的判斷,形成他新的特征,這與之前純粹將數據放進神經網絡,通過統計學得到一個完全沒法解釋的分類答案不一樣。”
相比于表數據來說,圖計算帶有一個更清晰的逐層推導結構,這個結構本身就意味著一定的可解釋性。
這種把薄數據“變厚”的能力以及推理過程的可解釋性,已經開始和螞蟻集團開源的可信隱私計算框架“隱語”一起,在支付寶反詐風控的系統中形成合力。目前支付寶可在0.01秒內完成對一筆交易的風險判定,并且在2021年的全年統計中資損率低于億分之0.98——即平臺上1億人民幣的資金流轉中,出于欺詐行為的不到1元。
開始跨入現實之門
在這位從學界跨入產界的螞蟻智庫首席看來,圖計算是一個處在數據和人工智能發展交匯處的概念。技術沉淀多時,亟需的是場景。
陳文光是以費馬科技創始人的身份加入螞蟻集團的,再那之前的十幾年一直在清華大學計算機系擔任教授,這番從學界投身產界,最終進入大公司的姿態本身也像是圖計算作為一個前沿領域發展的某種映射。
費馬科技在2016年5月創立,站在臺前的是包括洪春濤和朱曉偉在內的幾位清華計算機系博士,陳文光則落于幕后擔任首席科學家。公司的業務方向是立足于高性能的分布式圖計算以進行大規模關系網絡分析,為銀行等客戶提供反欺詐能力和社交分析能力,以及整體的金融大數據解決方案。
2016年之前,陳文光在清華大學主導的圖計算研究已經有了成果,團隊自研的圖計算系統比當時開源軟件中常用的圖計算框架GraphX要快100倍左右,而所需的內存只是后者的10%。把自己培養的博士生聚攏起來,繼續優化自研的圖計算系統,并為它找到使用場景,這是費馬科技成立的初衷。
費馬的暢想卡在規模化這最后一步。
“圖計算要想真正成長起來,第一步要解決:做出來;第二步:有人用;第三步:大規模使用。而當時困擾我的問題,怎么實現從有人用到大規模使用。”
幾年時間里費馬科技確實拿到了一些標桿客戶,比如京東金融和國家電網,但整體的商業化路徑并不清晰,這也不是技術出身的團隊所擅長的事。
在本屆WAIC的一場論壇上,洪春濤與陳文光同席出現在最后的圓桌環節。洪春濤曾是費馬科技的CEO,現在他的身份是螞蟻集團圖數據庫負責人。2020年,洪春濤曾經表示圖計算未來的市場規模會達到千億,并且“已到爆發前夜”,但2021年初的多項工商變更則表明,費馬科技決定在這黎明前的最后一夜擁抱螞蟻集團。
原費馬科技高管,左三為陳文光,右二為洪春濤圖源:搜狐
“到2020年的時候,我們發現了自身的局限性。費馬團隊總體上技術上是很強,但是管理和市場銷售,特別是后者我們相對比較弱的”,陳文光在今年6月的一次采訪中對極客公園表示。
2020年,螞蟻集團宣布了陳文光的加入。兩年之后,后者開始擔任螞蟻技術研究院院長。
螞蟻集團對于圖計算的布局很早,從2015年開始就自主研發分布式圖數據庫、流式圖計算等圖相關技術,2016年發布自研分布式圖數據庫。而手握支付寶,意味著螞蟻天然有了全球領先的圖計算的場景需求,這是純粹從技術出發的圖計算團隊都不具備的。
從陳文光的表述中,費馬科技并入螞蟻集團并不是商業場上那種千篇一律的無奈收購,而是一個技術找到場景的積極故事。螞蟻集團,或者字節跳動這些掌握大量數據的科技公司正擁有這片土壤。只有在最大限度的接觸到真實數據之后,圖計算的成長才會開始加速,直到最終從象牙塔中走出,找到現實世界中的位置。
除了螞蟻和字節跳動,國內的互聯網巨頭幾乎無一例外的都已經開始圖計算和圖數據庫的相關布局。
華為云的圖引擎服務GES是國內首個商用的、擁有自主知識產權的國產分布式原生圖引擎。早在2019年華為云推出一站式AI開發平臺ModelArts,聯合了GES圖引擎打造的“圖神經網絡”,自此圖深度學習開始落地。
2020年6月1日,騰訊云正式發布分布式圖數據庫產品騰訊云數圖TGDB,能夠實現萬億級關聯關系數據實時查詢,高效治理異構數據,支持實時圖計算。
而早在2018年,百度已宣布開源大規模圖數據庫HugeGraph,這也是國內第一家開源的圖數據庫。今年5月百度將HugeGraph捐贈給了世界上最大的開源軟件基金會Apache,成為后者的孵化項目之一。孵化成功的HugeGraph有望成為全球首個Apache軟件基金會的圖數據庫頂級項目。
這一切跡象都在表明,圖計算正在被積極的潮水推動著。人類苦尋“幻視”一樣理想的人工智能,或許我們已經找到額頭上的那顆寶石了。
參考資料:
《圖論及相關歷史》
《人人都在談的圖數據庫到底是個啥?》
《圖計算,下一個科技前沿?》
Tags:Graph人工智能AICGraph幣是什么幣人工智能技術應用學人工智能后悔死了人工智能考研考哪些科目AIC價格AIC幣
更多地圖問題點擊頭像咨詢開門做生意,沒有客流量就很頭疼,其實做地圖標注對于店鋪來說是很有幫助的,比如理發店,五金店,打印店,寵物店,很多客戶都是通過地圖導航去找的,如果你的店鋪在地圖上有位置.
1900/1/1 0:00:00來源:智通財經APP 最近幾乎所有主要加密貨幣都在下跌,而萊特幣卻價格飆升,在過去30天內上漲了30%以上,成為了市值排名第13的加密貨幣。相比之下,同期比特幣下跌17%,以太坊下跌15%.
1900/1/1 0:00:00對話一: “春風都出800MT了,你豪爵還抱著DL250不放手呢!” 對話二: “錢江四缸機都出道10年了,你豪爵除了破雙缸還有啥?離開鈴木后更啥也不是!” 對話三: 甲:“我的XXX漏油了.
1900/1/1 0:00:00智通財經獲悉,最近幾乎所有主要加密貨幣都在下跌,而萊特幣卻價格飆升,在過去30天內上漲了30%以上,成為了市值排名第13的加密貨幣。相比之下,同期比特幣下跌17%,以太坊下跌15%.
1900/1/1 0:00:00方案描述 針對低壓無刷電機,大聯大世平集團推出基于靈動股份MM32SPIN560C的無刷電機驅動方案。由于MM32SPIN560C內部集成了一部分驅動電路,所以方案外圍電路比較簡單.
1900/1/1 0:00:00自大多數硬幣下跌以來,整個加密貨幣市場仍在經歷停機。盡管市場上大多數加密貨幣都出現虧損和下跌趨勢,但一些山寨幣已被證明是未來幾個月和幾年的潛在投資.
1900/1/1 0:00:00