解读|近10年数据挖掘领域高引学者
近10年,人工智能发展迅速,如今该领域已经涵盖了机器学习、自然语言处理、计算机视觉、Web与知识工程、机器人、信息检索、人机交互、语音识别、数据挖掘、图形学、可视化、虚拟现实、多媒体、物联网、计算经济学、计算理论、信息系统、计算机安全和数据库等诸多研究方向。
我们节选了和人工智能相关的21个子领域,每个子领域选择1-2个顶级会议或者期刊,根据这些会议和期刊上近10年发表论文的引用情况(根据Goolge Scholar)生成了高引学者列表。
https://www.aminer.cn/ai10
点击文末阅读原文即可访问
今天为大家解析的是数据挖掘领域的高引学者情况。在数据挖掘子领域的高引学者是于2007至2017年间在 KDD 和 WSDM 会议上发表了论文并被大量引用的学者。
高引学者全球分布地图
由上面两张图可知,全球范围内,北美洲是数据挖掘领域高引学者分布最为集中的地区,亚洲和欧洲次之。若按国家统计,美国是数据挖掘领域高引学者最为集中的国家,中国、意大利、德国等国家学者数量次之,新加坡、印度、加拿大等国家学者人数较少。
高引学者中国分布地图
对我国数据挖掘领域高引学者分布进行分析,绘制中国范围内数据挖掘领域高引学者分布图,如上图所示:我们可以看出,中国数据挖掘领域的高引学者主要在北京、合肥、上海、广州、香港和台湾。
雷达图:中国VS美国
从数据挖掘领域高引学者的信息来看,这些学者主要分布在学界和产业界。
衡量标准如下:
产业界学者人数衡量产业创新
学界学者人数衡量基础研究
产业界学者发表论文总量衡量产业研究热度
学界学者发表论文总量衡量基础研究热度
产业界学者论文的总引用量衡量产业科研影响力
学界学者论文的总引用量衡量基础影响力
从两个国家的对比数据数据来看,我国各项数量并不均衡,以比最高值多5%左右为基准,选定产业创新、基础研究、产业研究热度、基础研究热度、产业科研影响力、基础科研影响力的基准分别为:35、65、3700、15000、450000、1600000。
从上图中可以看出,相较于美国,中国的基础影响力是最差的,这一数值主要由学界学者论文的总引用量来衡量,其实这也表明了我国的论文在质量上良莠不齐的一种现象。产业创新和产业研究热度相对来说情况好些,这两个值分别由产业界学者人数和产业界学者发表论文总量来衡量,这说明了我国在产业界的飞速发展。
机构分布:学界VS产业界
我们以 AI-10 数据挖掘领域100名高引学者的信息为基础数据,对其所属机构进行分类,分别为学界和产业界,统计后发现在学界有75名高引学者,在产业界有25名高引学者。其中,学界高引学者数量排名前3的学校是卡内基梅隆大学、清华大学和斯坦福大学。产业界高引学者数量最多的微软和谷歌。
性别分析
在数据挖掘领域的100位高引学者中,有13名是女性,87名是男性。在上一次的AMiner Most Influential Scholar Award 2016中(https://www.aminer.cn/mostinfluentialscholar),有10名是女性,90名是男性,这也表明了数据挖掘领域的女性力量正逐渐增强。
数据挖掘领域前10的高引学者
将数据挖掘领域此次排名前10的学者与上一次的AMiner Most Influential Scholar Award 2016中数据挖掘领域此次排名前10的学者(https://www.aminer.cn/mostinfluentialscholar)对比后,我们发现,这个领域的研究学者正逐渐呈现年轻化的态势,这也说明进入该领域的年轻学者越来越多。
AMiner Most Influential Scholar Award 2016数据挖掘领域前10的高引学者