趋势分析之图数据库
AMiner全新功能技术趋势分析Trend analysis(http://trend.aminer.cn)基于AMiner 2亿篇论文数据进行深入挖掘,包括对技术来源、热度、发展趋势进行研究,进而预测未来的技术前景。技术趋势分析描述了技术的出现、变迁和消亡的全过程,可以帮助研究人员理解领域的研究历史和现状,快速识别研究的前沿热点问题。
我们目前已发布了8期分析内容,具体如下:
图数据库(Graph Batabase)是NoSQL数据库的一种类型,基本含义是以“图”这种数据结构存储和查询数据,而不是存储图片的数据库。它的数据模型主要是以节点和关系(边)来体现,也可处理键值对。可以快速解决复杂的关系问题,最常见的例子就是社会网络中人与人之间的关系。常见的图形数据库有Neo4j、FlockDB、AllegroGrap、GraphDB、InfiniteGraph等。
下面我们将用Trend analysis分析图形数据库领域内的研究热点。(点击文末阅读原文即可进入Graph Databases Trend:)
下图是当前该领域的热点技术趋势分析,通过Trend analysis分析挖掘可以发现当前该领域的热点研究话题Top10如下:
graph theory
wireless sensor network
query processing
data mining
approximation algorithms
large graph
computational complexity
algorithm design and analysis
social network
graph database
根据Trend analysis的分析我们可以发现,wireless sensor network、data mining、query processing是图形数据库领域中的热门话题,无论是话题热度排行还是论文发表数量都领先于其他相关技术,其中,data mining的论文发表数量总体而言比较多。而早期比较热门的computational complexity自21世纪以来话题热度开始逐渐下降。
Horst Bunke是该领域内的代表学者之一。
他于1998年发表的“A New Algorithm for Error-Tolerant Subgraph Isomorphism Detection”一文中提出了一种新的纠错子图同构检测算法,从一组模型图到一个未知的输入图,该算法可以与未来的成本估算方法相结合,从而大大提高其运行时的性能。
国内该领域的代表学者有北京大学的邹磊教授,香港中文大学的于旭教授等。
目前图数据库和不同领域的很多问题都有关联,比如社交网络关系、金融领域的反欺诈多维关联分析场景等。以反欺诈多维关联分析场景为例,通过图数据库可以对不同的个体、团队做关联分析,从任务在指定时间内的行为,例如去过地方的IP地址、曾经使用过的MAC地址(包括手机端、PC端、WIFI等)、社交网络的关联度分析,同一时间点是否曾经在同一地理位置附近出现过,银行账号之间是否有历史交易信息等。