数据分析之图算法:基于Spark和Neo4j - [英] 马克·尼达姆(Mark Needham)

数据分析之图算法:基于Spark和Neo4j

[英] 马克·尼达姆(Mark Needham)

出版时间

2020-09-11

ISBN

9787115546678

评分

★★★★★

标签

算法

书籍介绍

图分析可以揭示复杂系统和大规模网络的运作机制,图算法为构建智能应用程序提供了快速建模的框架,有助于更准确、更快速地做出预测。包括商品推荐和欺诈检测在内的许多人工智能问题能转换为图论问题。本书基于Spark和Neo4j讲解近20种常用的图算法,帮助读者拓展重要图分析类型的相关知识和能力,更快速地发现数据中的模式并找到更优的解决方案。

目录
第1章 导论 1
1.1 何谓图 1
1.2 何谓图分析和图算法 3
1.3 图处理、图数据库、图查询和图算法 5
1.4 为何要关心图算法 6

显示全部
用户评论
草率地翻了一下,发现社区传播算法挺适合解决目前问题的。
书中对中心性算法和社团发现算法的讲解还算是清楚,附带代码质量不高,没有详细解读。
这种类型的书本身就是偏向于具体应用和实践的,开卷有益吧。英文版整体的图例非常漂亮,每一章开头都有一个比较好的图来帮初学者理解,但要是要深挖图里的东西,这本书应该是不够的。整体行文思路是,先交代基本建图和构成,后按具体的算法划分为图基本特征描述(单源最短路算法等)、节点和子图特征(中心度等)以及社群发现和标签传播算法,最后给了一个Yelp的具体例子来讲实现。整体感觉思路是非常清晰了,因为主要目的是教用户使用,所以深度不太够。Spark 大部分是同 Neo4j 进行交互,Neo4j 主要是处理所有的算法层面,Spark 则是多数据输入等。整体来说,还是有收获的,主要是学习了作者的思维框架,代码质量一般。
适合入门速读,内容快速掌握
各种常见的算法包括路径发现,中心性,社区发现,机器学习等都给典型的应用场景,以及用neo4j和spark实现的过程,但是有一些应用场景写的模棱两可,不是我的理解有问题,就是翻译有问题。不过可以学习作者的思路然后去网上找资料了解相关应用,对于图算法的应用来讲,还是一本很不错的入门书籍。
收藏