書名:新世代關聯 - 圖資料庫理論精解+開發實務
原文書名:
產品代碼:
9786267569153系列編號:
DM2469定價:
980元作者:
張晨,吳菁,周研頁數:
624頁開數:
17x23x2.71裝訂:
平裝上市日:
20241017出版日:
20241017出版社:
深智數位股份有限公司CIP:
312.74市場分類:
電腦資訊產品分類:
書籍免稅聯合分類:
電腦資訊類- ※在庫量大
商品簡介
新世代關聯 - 圖資料庫理論精解+開發實務
近年來,網際網路、巨量資料、雲端運算、人工智慧和區塊鏈等資訊技術快速發展。我們已進入人類社會空間(Human)、資訊網路空間(Cyber)、實體物理空間(Physical)的人機物三元空間時代,這三個空間相互交互產生大量資料,成為生產的關鍵要素,滲透到生產、工作和生活的各方面。建構新型資料基礎設施,推動數位經濟發展,已成為時代熱點。
在這個人機物深度融合的背景下,圖技術作為資料基礎設施的底層關鍵技術迅速發展。圖技術能夠呈現複雜的連結關係,提升資料在網路空間中的價值,使使用者從高效管理資料資產轉變為有效提取資料價值。例如,在龐大的社群網站和複雜的金融交易網路中,圖技術能挖掘巨量資料中的隱藏模式和規律,極大提升數位技術解決現實問題的能力。作者具有豐富的圖技術研究和實踐經驗。
本書分為理論篇和實踐篇,詳述圖技術的研究內容和應用案例,內容翔實,深入淺出,兼具實用性和可讀性,是一本不可多得的圖技術教科書。
新世代關聯 - 圖資料庫理論精解+開發實務
近年來,網際網路、巨量資料、雲端運算、人工智慧和區塊鏈等資訊技術快速發展。我們已進入人類社會空間(Human)、資訊網路空間(Cyber)、實體物理空間(Physical)的人機物三元空間時代,這三個空間相互交互產生大量資料,成為生產的關鍵要素,滲透到生產、工作和生活的各方面。建構新型資料基礎設施,推動數位經濟發展,已成為時代熱點。
在這個人機物深度融合的背景下,圖技術作為資料基礎設施的底層關鍵技術迅速發展。圖技術能夠呈現複雜的連結關係,提升資料在網路空間中的價值,使使用者從高效管理資料資產轉變為有效提取資料價值。例如,在龐大的社群網站和複雜的金融交易網路中,圖技術能挖掘巨量資料中的隱藏模式和規律,極大提升數位技術解決現實問題的能力。作者具有豐富的圖技術研究和實踐經驗。
本書分為理論篇和實踐篇,詳述圖技術的研究內容和應用案例,內容翔實,深入淺出,兼具實用性和可讀性,是一本不可多得的圖技術教科書。
作者簡介
張晨
創鄰科技創始人兼 CEO,國家特聘專家,中國電腦學會(CCF)資訊系統專委會執委,北京理工大學校外博士生指導教授,香港科技大學(廣州)實踐副教授、圖資料實驗室聯席主任,正高級工程師,浙江大學竺可楨學院電腦科學與技術學士、加拿大滑鐵盧大學電腦科學博士、麥吉爾大學博士後,圖資料庫、分散式系統及平行計算領域專家,近 20 年分散式並行系統研發經歷。曾任美國運通巨量資料科學家、矽谷初創 Splice Machine 軟體架構師、加拿大初創 Graph Intelligence 聯合創始人。
吳菁
麥吉爾大學執行資訊系統博士, 荷蘭萊頓大學 ICT in Business 碩士,浙江大學竺可楨學院電腦科學與技術學士。圖型分析領域專家,現任浙江創鄰科技有限公司聯合創始人兼COO,前加拿大初創 Graph Intelligence 聯合創始人兼執行董事,近 10 年圖技術商業轉化及解決方案諮詢落地經驗,曾獲評創業邦 2022 最值得關注的女性創業者。
周研
大學畢業於浙江大學竺可楨學院混合班,博士畢業於浙江大學電腦學院,師從陳純院士。曾為 Apache開放原始碼專案貢獻者,具有 10 餘年大型軟體專案的研發和管理經歷。圖資料庫和分散式系統領域的專家,現任浙江創鄰科技有限公司聯合創始人兼CTO,承擔多個圖型計算領域省級、市級重大研發專項專案,是圖資料庫、知識圖譜領域國內外多個標準化委員會成員,主導 / 參與制定多項業界標準。
書籍目錄
理論篇
第 1 章 初識圖資料庫
1.1 圖資料庫的發展背景
1.1.1 什麼是圖
1.1.2 理解圖的手段:圖型分析
1.2 圖技術
1.2.1 圖型計算引擎
1.2.2 圖資料庫
1.2.3 圖型視覺化
1.3 圖資料庫技術的優勢
1.4 圖資料庫的分類
1.5 圖資料庫的應用場景
1.6 圖資料庫與知識圖譜
1.7 圖技術的發展趨勢
1.8 本章小結
第 2 章 主流圖資料庫的核心原理與架構設計
2.1 圖資料庫核心設計的關鍵目標
2.1.1 免索引鄰接
2.1.2 圖資料庫核心的分類
2.2 實現免索引鄰接的技術方案
2.2.1 使用陣列結構儲存
2.2.2 使用鏈結串列結構儲存
2.2.3 使用LSM樹或其他鍵值形式儲存
2.2.4 最佳化之路
2.3 Neo4j
2.3.1 Neo4j儲存結構
2.3.2 Neo4j事務
2.3.3 Neo4j叢集
2.4 JanusGraph
2.4.1 JanusGraph儲存結構
2.4.2 JanusGraph事務
2.4.3 JanusGraph架構
2.5 Galaxybase
2.5.1 Galaxybase系統架構
2.5.2 Galaxybase分散式圖型儲存
2.5.3 Galaxybase分散式圖型計算
2.5.4 Galaxybase高性能圖展示
2.6 本章小結
第 3 章 圖查詢語言
3.1 圖查詢語言一覽
3.2 Cypher
3.2.1 Cypher簡介
3.2.2 Cypher使用場景
3.2.3 Cypher高級特性
3.3 本章小結
第 4 章 圖型演算法
4.1 圖型演算法概述
4.2 尋路演算法
4.2.1 資料準備
4.2.2 演算法介紹
4.3 中心性演算法
4.3.1 資料準備
4.3.2 演算法介紹
4.4 社區檢測演算法
4.4.1 資料準備
4.4.2 演算法介紹
4.5 相似度演算法
4.5.1 資料準備
4.5.2 演算法介紹
4.6 圖模式匹配演算法
4.6.1 環路匹配
4.6.2 路徑匹配
4.6.3 複雜子圖
4.7 圖嵌入演算法
4.8 圖神經網路演算法
4.9 分散式並行圖型計算
4.9.1 分散式圖型計算框架
4.9.2 分散式圖型計算面臨的挑戰
4.10 圖型演算法的綜合應用
4.10.1 標準圖型演算法的應用
4.10.2 訂製化圖型演算法的應用
4.11 本章小結
參考文獻
第 5 章 圖資料庫使用者端程式設計
5.1 概述
5.2 驅動模式
5.2.1 Java
5.2.2 Python
5.2.3 Go
5.3 RESTful API
5.3.1 登入
5.3.2 圖列表查詢
5.3.3 圖模型操作
5.3.4 點操作
5.3.5 邊操作
5.3.6 遍歷操作
5.3.7 執行Cypher 敘述
5.4 本章小結
第 6 章 圖資料庫服務端程式設計
6.1 概述
6.2 Galaxybase PAR API簡介
6.3 PAR的使用方法
6.4 PAR的自訂函式
6.4.1 自訂非匯總函式
6.4.2 自訂匯總函式
6.5 PAR的自訂過程
6.5.1 自訂本機過程範例
6.5.2 自訂叢集過程範例
6.6 PAR的自訂過程封裝
6.6.1 PARKit
6.6.2 Traversal API
6.7 PAR管理介面
6.7.1 查詢
6.7.2 刪除
6.8 本章小結
第 7 章 圖型視覺化
7.1 圖型視覺化在不同領域的應用
7.2 通用圖型視覺化工具
7.3 圖型視覺化框架
7.4 基於圖資料庫的視覺化平臺
7.5 Galaxybase Studio圖型視覺化平臺
7.5.1 建立圖專案
7.5.2 圖專案管理
7.5.3 資料來源管理
7.5.4 圖型視覺化分析
7.5.5 使用者管理
7.5.6 圖型擷取
7.6 本章小結
第 8 章 圖資料庫選型
8.1 圖資料庫的應用場景
8.1.1 圖型分析需求:OLTP還是OLAP
8.1.2 圖資料特點
8.2 圖資料庫的儲存架構
8.3 圖資料庫的性能
8.3.1 匯入性能
8.3.2 查詢性能
8.3.3 圖型演算法性能
8.3.4 正確性驗證
8.4 圖資料庫的功能
8.4.1 基礎圖資料庫功能
8.4.2 高階圖資料庫功能
8.4.3 視覺化分析與查詢
8.5 圖資料庫選型基準測試
8.6 圖資料庫選型測試方案樣例
8.6.1 測試說明
8.6.2 測試用例
8.7 本章小結
實踐篇
第 9 章 知識圖譜
9.1 背景
9.2 影視知識圖譜
第 10 章 金融
10.1 信用卡申請反詐騙
10.2 中小信貸風控
10.3 反洗錢
第 11 章 泛政府
11.1 社會治安
11.2 疫情防控
11.3 電力排程
11.4 武器裝置管理
第 12 章 零售
12.1 商品推薦
12.2 社群網站行銷
第 13 章 製造業供應鏈管理
13.1 供應鏈風險管理
13.2 物流管理
第 14 章 企業資產管理
14.1 網路安全
14.2 許可權管理
14.3 裝置資產管理之智慧運行維護
第 15 章 生命科學
15.1 農業育種
15.2 新藥研發
推薦序/導讀/自序
序言
圖資料庫(Graph Database)是近年來新興的先進資料庫技術。隨著巨量資料和物聯網產業的蓬勃發展、資料型態的日益豐富以及資料間連結度的爆發式增長,傳統分析方法針對小資料量、單維度、靜態化資料已無法滿足日趨VUCA 的數位經濟時代下巨量資料處理與分析的需求。對於數量劇增的資料以及蘊含其間複雜連結關係的有效分析和高效處理已成為行業痛點。傳統的關聯式資料庫(Relational Database)對於資料間複雜關係的處理能力有所欠缺,而圖資料庫能高效處理巨量、複雜互聯、動態多變的網路拓撲結構資料,其性能比關聯式資料庫提升了數個數量級。
儘管圖資料庫在2007 年前後才開始商業化,但根據資料庫領域權威統計機構DB-Engines 基於公開資料的分析,自2013 年起,全球對圖資料庫的技術關注度增長已遠超其他資料庫類型。著名IT 技術顧問諮詢機構Gartner 於2020 年將圖資料庫列入企業亟須優先設定的技術矩陣,並評估其為該矩陣中不可或缺的重要底層技術,預測圖資料庫將在未來2 至4 年成為企業IT 架構的主流設定之一。Gartner 在2022 年進一步預測,到2025 年,圖技術將用於80% 的資料分析,圖型分析能力將成為數位化企業最核心的競爭優勢。在亞馬遜官方發佈的技術矩陣中,圖資料庫已成為與關聯式資料庫並列的核心技術組成部分。在資料庫領域的三大頂級學術會議之一ICDE 2022 中,圖技術相關論文佔比高達34.6%。至今,圖資料庫已在金融、能源、電信、物流、零售、航空和網際網路等多個行業中得到應用,創造出巨大的商業價值和社會價值。
不論是學術界的創新探索、工業界的規模創造,還是國家社會經濟發展的整體規劃,以圖資料庫為核心的圖技術已登上技術發展史的主流舞臺,成了一顆冉冉升起的新星。
本書主要內容
本書包括理論篇和實踐篇兩部分,其中理論篇包含8章,涵蓋了圖資料庫的發展歷史、定義、分類等基礎知識,以及圖資料庫的核心設計原理、圖查詢語言、程式設計方法、圖型演算法、視覺化圖型分析、圖資料庫測試和技術選型等內容,並提供了多家大型客戶在實踐中採用的技術選型和測試方法供參考。無論是軟體開發人員、業務分析師、學生還是技術選型決策者,都可以透過理論篇快速、全面地了解圖資料庫技術的全貌,掌握其核心知識系統。
實踐篇包含7章,旨在為圖技術的創新應用提供幫助和指引,涵蓋了圖資料庫在知識圖譜、金融、泛政府、零售、製造、企業資產管理和生命科學七大領域的應用案例。每個案例都詳細分享了場景背景、行業痛點、圖技術解決方案、圖模型設計和圖型分析程式範例。各行業從業者和解決方案供應商可以直接閱讀相關章節,並將書中的圖模型作為應用圖資料庫的入門指南。其他讀者也可以通過了解不同場景下的圖建模和圖型分析過程,系統學習使用圖思維發現問題、分析問題和解決問題的方法,做到活學活用、舉一反三。