CNCC2018技术论坛|6场报告引爆“认知图谱与推理”现场
知识引擎是人工智能的核心和基础设施。 大数据环境下数据的分布、异构、动态、碎片化和低质等特征给知识工程和知识服务提出了新挑战,既需要从感知角度学习数据的分布表示,又需要从认知角度解释数据的语义,构建新一代知识图谱,暨认知图谱成为实现人工智能的关键。
该论坛邀请了认知计算与知识工程领域的著名研究者,一起探讨如何通过半自动化的交互学习构建超大规模认知图谱,并探讨其在实际系统中的可能应用,将深入讨论机器学习和符号计算相结合的知识表示、获取、推理和知识服务理论和方法。
此次技术论坛由唐杰老师与周明老师主办,一共有6位嘉宾莅临现场作报告,现场十分火爆,座无虚席,许多参会者们直接坐在地上听老师们作报告。
《学术图谱中的认知问题》
Kuansan Wang
简介
Kuansan Wang是Microsoft Research Outreach的常务董事,负责Microsoft Academic Services。他还是MSR Redmond的首席研究员,从事网络搜索,数据挖掘,自然语言处理和信息检索方面的研究。
报告内容
此次报告主要介绍了微软学术搜索中知识图谱的构建方法和技巧,并探讨其中碰到的认知问题。
《Extremely large scale cognitive graphrepresentation in practice》
Hongxia Yang
简介
美国杜克大学博士学位,原IBM全球研发中心Watson研究员,Yahoo!主任数据科学家,现任阿里巴巴资深算法专家,带领团队开发基于计算平台和搜索推荐的智能算法,稳定的支持了阿里巴巴搜索、广告等30几个核心BU和其业务场景。在顶级统计和机器学习国际学术期刊会议发表论文40余篇(包括JASA, ICML, ATSTATS, KDD, ICDM,CIKM和WWW等),美国专利9项,任职 Applied Stochastic Models in Business and Industry副主编,International Statistical Institute理事,2017浙江省千人。
报告内容
此次报告她主要介绍了超大规模图计算在大数据公司发挥的重要作用,尤其是以深度学习和图计算结合的大规模图表征为代表的系列算法在阿里的诸多业务场景都取得了阶段性成果。阿里巴巴生态体系的数据是极其丰富多样的,涵盖着从购物、出行到娱乐、支付等各个方面信息。
比如个性化推荐系统作为一种信息过滤的重要手段,可以依据我们的习惯和爱好推荐合适的商品或者服务,但是传统的推荐系统容易出现稀疏性、冷启动和信息重复性的问题,而认知图谱作为大规模图表征的一类重要模型正在成为一种新兴类型的推荐辅助信息,可以将自然人的全域信息有效的结合起来,真正挖掘、理解每个人的需求,在每个业务域推出消费者真正感兴趣的潜在商品。
她表示阿里巴巴正在致力于研发新一代基于超大规模认知图谱/图计算的推理引擎,可以高效的对于超过几十亿节点,千亿的边进行推理分析。基于这个挑战,同时也在信息检索、分布式计算、机器学习、自然语言处理等相关领域带来新鲜理念和突破性进展。
《基于知识图谱的文本语义理解及其智能应用》
赵东岩
简介
现任北京大学研究员,全国新闻出版信息标准化技术委员会委员。主要研究方向为计算机网络与数据库应用技术、数字出版技术、Intelligent Agent。近年来承担国家级项目5项、主持1项,省部级科研项目6项、主持2项,发表学术论文10余篇,申请发明专利7项,先后五次获得国家和省部级奖励。其中,主持研发了具有国际先进水平的报业数字资产管理系统,获2006年度国家科技进步二等奖。个人获北京大学优秀共产党员(2004年)、第十届中国青年科技奖(2007年)等荣誉。
报告内容
他的报告以知识服务为背景,探讨如何基于知识图谱理解语义进而实现智能问答等智能应用的理论方法与技术路线。
并介绍北大计算机研究所在这个研究方向上的具体进展。
《Knowledge Extractionfrom Software artifacts》
黎铭
简介
南京大学教授,博士生导师,人工智能学院副院长。国家优秀青年科学基金获得者、教育部新世纪人才。主要从事软件挖掘、机器学习方面的研究工作。在《IEEE Trans KDE》等国内外重要学术刊物和IJCAI、ICML 等重要国际会议发表论文三十余篇,被国际同行他引逾千次。应邀担任《Frontiers of Computer Science》青年Associate Editor、《自动化学报》编委、国际软件挖掘系列研讨会SoftwareMining、PAKDD首届博士研讨会DSDM'11主席、国际会议IEEE ICDM的领域主席、IJCAI、AAAI的资深程序委员以及KDD、NIPS等多种一流国际会议程序委员;现任ACM数据挖掘中国分会执委、中国计算机学会人工智能与模式识别专委会委员、中国人工智能学会机器学习专委会委员、江苏省人工智能学会青年工委主任等。
报告内容
软件系统变得越来越复杂,如何保证软件的质量成为了一个非常重要的问题。软件挖掘是一种能够从软件数据中发现知识和规律的重要技术,目前已在软件质量保证等方面发挥了重要作用。由于软件数据自身特性与常见文本、图像等数据具有较大差异,因此如何有效从软件数据中抽取知识与规律是软件挖掘研究的核心问题。他的报告主要介绍了一些在软件挖掘方面的最新进展。
《图分析与数据智能技术及应用》
钱正平
简介
阿里巴巴计算平台工程总监、达摩院智能计算实验室成员。他带领团队负责围绕阿里巴巴内外诸如图计算、机器学习等新兴应用的系统研发和商业解决方案构建。2015年加入阿里之前,他是微软亚洲研究院的主管研究员。研究兴趣是分布式和数据并行计算,在OSDI、NSDI、EuroSys、VLDB等会议发表论文、并曾获EuroSys 2012最佳论文奖。钱博士2009年毕业于华南理工大学。
报告内容
图数据自然的表达了大规模、多样化数据间的复杂关联,挖掘其中的隐含模式可以为互联网用户提供更精准、可靠的信息和发现商业机会。他的报告结合了图分析在阿里巴巴的应用介绍相关的智能技术,包括图数据管理与分析等的关键技术与系统抽象。
同时结合真实场景的生产实践,从算法和系统两个方面,总结重要的研究问题和工程挑战。
《大规模网络的表示学习研究》
杨洋
简介
浙江大学计算机学院助理教授、浙江省人工智能发展专家委员会秘书、智慧金融研究院科学顾问,2016年获清华大学计算机科学与技术专业博士学位,被授予中国电子学会优秀博士学位论文(提名奖)、清华大学优秀博士毕业论文、北京市优秀博士毕业生等荣誉,博士期间访问美国康奈尔大学、比利时鲁汶大学。主要研究社交网络挖掘,具体包括网络异常检测、网络表示学习、信息传播建模等,在KDD、WWW、AAAI、TOIS等国际顶级学术会议及期刊上发表论文20余篇,曾担任KDD、WWW、AAAI、CIKM、WSDM、ICWSM、ASONAM等国际学术会议程序委员会委员。
报告内容
近年来网络表示学习受到了学术界及工业界的广泛关注。良好的网络表示形式是社交网络挖掘的基础,而表示学习通过将给定的网络投影至一个隐空间,利用隐空间中的向量以表示网络中的结点,并且使得结构、语义相似的结点在隐空间中足够接近。然而,已有的算法往往针对的是传统的网络,而难以捕捉社交网络所特有的性质。
本次报告介绍了如何针对社交网络的动态性(网络结构随时间发生改变)和无标度性(结点的度服从长尾分布)设计相应的表示学习算法,并将成果应用于链接预测、结点分类等场景中。
CNCC大会明日还会有更多的精彩内容,敬请期待。
分享干货
12种Python 机器学习 & 数据挖掘 工具包(附链接)
当机器人已经会跑酷还会热舞......而你还什么都不会时......
CNCC2018|图灵奖获得者Robert E.Kahn谈“数字对象与互联网发展”
AMiner
发掘科技创新的原动力