当前位置: 首页 > 学术报告 >

大网络数据的结构型模式挖掘

发布时间:2015-06-01 10:38:48

主讲人:徐晓伟教授

报告时间:6月2日(周二),下午14:00

报告地点:信息楼 A306会议室

内容提要:


  Networks are ubiquitous in our world. Prominent examples are the WWW and social networks. Many of the networks are very big and complex consisting of over millions of nodes and links. Therefore, pattern mining from big networks is a daunting task. In this talk we focus on mining two kinds of structural patterns including community structures and functional roles of nodes. More specifically, community structures are densely connected groups of nodes, with only sparser connections between groups. An example of community structures in social networks is a group of like-minded people. Many algorithms find community structures. But they tend to fail to identify and isolate two kinds of nodes that play special roles – nodes that bridge communities (hubs) and nodes that are marginally connected to communities (outliers). Recently, we proposed a novel algorithm called SCAN (Structural Clustering Algorithm for Networks), which detects community structures, hubs and outliers in networks. The algorithm is fast, visiting each node only once. An empirical evaluation of the method using both synthetic and real datasets demonstrates superior performance over other methods such as the modularity-based algorithms. Last but not least, we present a MapReduce/Hadoop implementation of SCAN for big social networks like Twitter.



报告人简介:
  徐晓伟:博士,美国阿肯色大学小石城分校信息科学系教授,该校信息科学系知识发现和数据挖掘(Advanced Knowledge Discovery and Data Mining Research Laboratory)实验室主任;兼任阿肯色大学数学系教授;曾任美国联邦食品和药物管理局(FDA)国家毒理学实验室(National Center for Toxicological Research)教授。1962 年生,1983 年在南开大学数学系获得学士学位,1987 年在中国科学院沈阳计算技术研究所获得硕士学位,1998 年在德国慕尼黑大学(University Of Munich)获得博士学位。1998 年~2002 年在西门子公司任高级研究科学家(senior research scientist);自2012 年任中国科学院沈阳自动化研究所客座研究员,博士生导师; 同时兼任东北大学客座教授。曾经是香港中文大学访问教授;为多家国际公司提供咨询服务,其中包括西门子公司,Axciom 公司,Dataminr 公司 和东软公司。研究领域包括数据挖掘、机器学习,生物信息、数据管理及高性能计算,多次在模式识别和数据挖掘领域知名国际会议上作大会特邀报告,在国际知名学术期刊和国际会议上发表了具有原创性的研究成果。他提出的基于密度的聚类等一系列理论算法,具有理论原创性,并被写入教科书。作为项目负责人,承担了多项科研和应用开发项目,其中包括美国National Institute of Health (NIH)项目,美国联邦食品和药物管理局(FDA)项目及工业界与大学联合研发项目。最近获得美国计算机协会ACMSIGKDD Test of Time 奖,表彰其在基于密度聚类算法的研究对数据挖掘领域所产生的重要影响。 

  

  欢迎广大师生参加!

                                                           

                        信息科学技术学院

                         2015年5月29日

上一篇:如何利用SCI、SSCI、ESI信息提高基金申报成功率
下一篇:关于开展“钱学森先生引领的成才之路”主题讲座的通知