社会计算与信息检索研究中心

时间:2020-11-05浏览:10806

冯晓骋  车万翔  刘建伟  秦兵  张伟男  刘挺  刘铭  赵妍妍  丁效

  

现有教师9人,其中教授4人,副教授2人,讲师3人,博士生导师5人。该研究中心主要研究方向包括:语言分析、信息抽取、情感分析、文本生成、问答系统、人机对话和社会预测。已完成或正在承担的国家自然科学基金重点项目、国际合作、企业合作等课题100余项。获国家科技进步二等奖1项、省科技进步一等奖1项、省技术发明二等奖1项、钱伟长中文信息处理科学技术一等奖1项。近年来发表论文500余篇。


标志性成果:影响力最大的中文自然语言处理基础技术开源平台

历时十余年研发语言技术平台(Language Technology Platform, LTP,已成为中文自然语言处理领域影响力最大的开源基础技术平台http://ltp.ai/。平台集词法分析(分词、词性标注、命名实体识别)、句法分析(依存句法分析)和语义分析(语义角色标注、语义依存分析)等多项自然语言处理子系统于一体,有效解决了自然语言处理技术入行门槛高,准确率、效率偏低,缺少共享数据和程序资源,重复开发现象严重,结果可视化差,错误分析困难,较难真正支持各类应用研究等众多问题。

目前,已被包括清华大学、北京大学、CMU等国内外众多大学及科研机构在内的家研究单位签署协议使用。同时,向百度、腾讯、华为、讯飞等多家知名公司收费授权,累计创造直接经济价值两千万元。还是最早以“云计算方式对外提供中文自然语言处理服务,并将其命名为“语言云http://www.ltp-cloud.com/,目前语言云累计注册的厂商及开发者已超过1。2010年,语言技术平台获得了中国中文信息学会颁发的“钱伟长中文信息处理科学技术奖一等奖;2016年获黑龙江省科技进步一等奖


  


标志性成果:首个基于上下位关系的开放域中文知识图谱

《大词林》(http://101.200.120.155/)是首个基于上下位关系的开放域中文知识图谱。相比于传统的开放域实体知识库,《大词林》的特点在于:1)构建不需要领域专家的参与,而是基于多信息源自动获取实体类别并对可能的多个类别进行层次化,从而达到知识库自动构建的效果。2)其数据规模可以随着互联网中实体词的更新而扩大,很好地解决了以往的人工构建知识库对开放域实体的覆盖程度极为有限的问题。3)每一个实体的义项均能够唯一对应到细粒度的上位词概念路径且具有丰富的实体和关系数据,能够更加清晰明确的展示实体的含义。

目前《大词林》2.0版已拥有实体30,102,845 (三千万),上位词182,079(十八万),优质的实体上下位关系对15,577,846(一千五百万对),属性-值对79,568,791(七千九百万对),关系(属性)数436,961(四十三万)。《大词林》已被科大讯飞、腾讯、奇虎360等多所公司以及高校付费使用已被科大讯飞、腾讯、奇虎360等多所公司以及高校付费使用。


    

     


     



Research Center for Social Computing and Information Retrieval     

The Research Center for Social Computing and Information Retrieval now has 7 faculty members, including 4 professors, 1 associate professor, 2 lecturers and 4 doctoral supervisors. The main research fields of the center include language analysis, information extraction, sentiment analysis, text generation, question answering system, conversation system and social prediction. More than 100 projects have been completed or are being undertaken, including projects of National Basic Research Program of China, projects of National High-tech R&D Program of China , projects supported by National Natural Science Foundation of China (NSFC), and some other international cooperation projects and business cooperation projects. The research center has received 1 second prize of National Science and Technology Progress Award, 1 first prize of Provincial Science and Technology Progress Award, 1 second prize of Provincial Technological Invention Award and 1 first prize of Qian Weichang Chinese Information Processing Science and Technology Award. In recent years, about  500 papers have been published.

  

电话:0451-86413683或86402993

地址:哈尔滨工业大学科学园科创大厦

通信地址:哈尔滨工业大学321信箱

电子邮件:webmaster@ir.hit.edu.cn

网址:ir.hit.edu.cn