研究方向      
  • 信息检索与信息推荐

查询意图理解、排序学习及应用、用户画像与推荐等

  • 情感分析与观点挖掘

基于认知的情感分析、隐喻和幽默计算、社交媒体处理等

  • 自然语言处理

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。

  • 舆情及热点事件的识别和跟踪、演化分析

对当前舆情及热点事件进行系统科学的识别和跟踪、演化分析

  • 机器学习

研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

  • 知识图谱构建及其应用

显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。


科研项目      
  • 国家自然科学基金项目(61632011)

    社交媒体中文本情感语义计算理论和方法

  • 国家自然科学基金项目(61751203)

    基于DNA计算的人工智能新方法

  • 国家自然科学基金项目(61572102)

    面向社交网络的药物不良反应的隐含知识发现

  • 国家自然科学基金项目(61272373)

    基于生物医学文献的隐含知识发现方法研究 2013年1月至2016年12月 随着基因组学研究和高通量技术的飞速进步,蛋白质之间的相互作用数据迅速积累,从蛋白质相互作用网络中识别出蛋白质复合物,是生物体行为理解、蛋白质功能预测和药物设计的基础。本项目综合利用各种生物医学知识源,使用特征耦合泛化策略构建蛋白质的实体识别模型;使用基于语义的相似度计算解决蛋白质名标准化中的歧义问题;使用平面特征核、卷积树核以及图核的复合核模型进行蛋白质相互作用关系抽取。使用该技术从生物文献中抽取蛋白质交互关系,与PPI数据库中的数据进行融合,构建了高性能的蛋白质交互网络,从中进行复合物发现。在抽取蛋白质复合物的过程中,引入基于监督的分类算法,从已知蛋白质复合物提取特征,结合机器学习模型获得蛋白质复合物。

  • 国家自然科学基金项目(61070098)

    基于信息抽取技术的蛋白质相互作用网络构建及蛋白质复合物识别研究     2011年1月至2013年12月 以 MEDLINE 为代表的海量生物医学文献资源中,存在大量的蕴含于公开发表的文献,而尚未被们认知的隐含知识。采用文本挖掘技术从这座宝库有效的提取隐含生物医学知识的需求变得非常迫切。本项目以 MEDLINE 的生物医学文献为主要数据源,在生物实体识别和名称标准化的基础上,利用UMLS、MeSH、GO、UniProt、DrugBank、KEGG Database 等生物医学资源,建立基于生物医学概念的概念空间和基于概率潜在语义索引的潜在语义空间表示;利用信息抽取和段落检索技术进行医学概念共现识别;引入监督学习方法,选取包含潜在语义空间相似度、医学语义关联度和全局语料库统计量以及信息抽取的统计特征等多种特征来综合评定概念间的相关度量,最终获得生物医学文献中的隐含知识,建立具有实用价值的生物医学文献隐含知识发现平台。

  • 国家自然科学基金项目(61976036)

    融合多源信息的学术推荐研究

  • 国家社科规划、基金项目 (19CTQ020)

    基于多源数据融合的企业专利威胁预警实现机制研究

  • 国家科技部(2018YFC0830604)

    基于控辩焦点识别的庭审应对策略与出庭预案组建

  • 国家科技部(2018YFC0832101)

    涉案当事人画像自动构建技术研究及系统研发

  • 国家自然科学基金项目(61702080)

    基于情感语义表示的隐式情感分析

  • 国家自然科学基金项目(61772103)

    基于引用极性和评论挖掘的论文综合评价模型研究

  • 十三五国家重点研发计划项目子课题(2016YFC0901902-4)

    精准医学文本语义关联抽取 2016年7月至2020年12月   项目利用海量的未标注文献数据,通过无监督的学习算法从中学习词向量。由于传统的词向量大都基于线性词序的上下文关系,忽略了关系抽取中重要的句法信息。因此,引入依存句法分析得到的句子主干结构构造句法词向量,并加入位置信息、词性等特征进行扩展。另一方面,采取深度学习方法进行实体关系抽取。深度学习通过大量非线性的计算单元,使其模型有强大的计算表达能力,能够从原始的输入数据中学习到更高层次的特征,从而使实体关系抽取识别更精准。

  • 企事业单位委托科技项目(2019T32110)

    生物医学领域知识图谱构建与智能检索研究 2019年7月至2020年12月 本项目利用深度学习方法和自然语言处理方法,开展生物医学领域知识的表示、实体识别和关系抽取;开展生物医学领域知识的融合、冲突检测以及质量评估研究,构建生物医学领域知识图谱;并基于该知识图谱,实现生物医学领域的智能检索。

  • 教育部2013年度“新世纪优秀人才支持计划“项目( NCET-13-0084)

    蛋白质相互作用网络的复合物识别算法研究 2014年1月至2016年12月 项目的研究目标是以MEDLINE文摘为数据源,在文本结构分析和文本概念表示的基础上,综合利用各种生物医学知识源(UMLS、MESH、GO、UniProt等),利用复合核模型进行蛋白质交互关系抽取,构建高准确性的蛋白质相互作用网络。在抽取蛋白质复合物的过程中,综合考虑蛋白质相互作用网络图的拓扑结构和生物医学领域知识(如蛋白质复合物的结构和蛋白质功能标注信息),总体衡量抽取得到的候选蛋白质复合物的可信性。


研究团队      
林鸿飞                                                                                 大连理工大学电气学部计算机科学与技术学院教授,博士生导师          
主要研究领域自然语言处理、情感分析与观点挖掘、信息检索与信息推荐、社会计算与社交媒体处理、面向生物医学文献的知识挖掘等。
         
杨志豪                                                                                 大连理工大学电气学部计算机科学与技术学院教授,博士生导师          
研究方向为自然语言处理、机器学习(深度学习)、文本挖掘、知识图谱构建及应用。
         
杨亮                                                                                 大连理工大学电气学部计算机科学与技术学院讲师,硕士生导师          
主要研究方向包括面向社交媒体的文本情感分析,涉及多语种多标签的情感分类,情感信息抽取、舆情及热点事件的识别和跟踪、演化分析等。
         

学术成果      
专利
  • 基于特征筛选与半监督学习的用户成长性画像构建方法

  • 一种结合排序学习的电影排名预测方法

  • 一种基于语义资源词表示和搭配关系的语义双关语识别方法

  • 面向生物医学文献的跨模态图像模式识别方法

  • 联合attention机制与神经网络的生物医学实体关系分类方法

  • 一种基于节点向量的蛋白质复合物识别方法 申请号2018106937482(已授权)

论文
  • Exploiting Adversarial Transfer Learning for Adverse Drug Reaction Detection from Texts[J]. Journal of Biomedical Informatics, 2020, 106:103431.

  • Attention guided capsule networks for chemical-protein interaction extraction[J]. Journal of Biomedical Informatics, 2020, 103:103392.

  • 幽默计算及其应用研究[J]. 山东大学学报(理学版)(7期):1-10.

  • 面向排名预测的电影媒体网站研究[J]. 北京大学学报(自然科学版), 2019, 55(01):68-77.

  • 结合排序学习的趣味成语生成模型[J]. 小型微型计算机系统, 2019, 40(003):520-526.

  • 基于两阶段注意力机制的立场检测方法[J]. 广西师范大学学报(自然科学版), 2019, 37(001):42-49.

  • KGHC: a knowledge graph for hepatocellular carcinoma, BMC Medical Informatics and Decision Making. 20, 135 (2020).

  • A Graph Convolutional Network–Based Method for Chemical-Protein Interaction Extraction, JMIR Medical Informatics, 8 (5) , e17643.

  • Chemical-protein Interaction Extraction via Gaussian Probability Distribution and External Biomedical Knowledge, Bioinformatics, btaa491,

  • Exploiting Adversarial Transfer Learning for Adverse Drug Reaction Detection from Texts, Journal of Biomedical Informatics, 2020, 106: 103431.

  • Exploiting sequence labeling framework to extract document-level relations from biomedical texts. BMC Bioinformatics. 2020, 21, 125.

  • Attention Guided Capsule Networks for Chemical-Protein Interaction Extraction. Journal of Biomedical Informatics. 2020,43 (1):88-96, SCI检索 影响因子2. 95.

  • A neural network-based joint learning approach for biomedical entity and relation extraction from biomedical literature Journal of Biomedical Informatics. 2020,43 (1):88-96, SCI检索 影响因子2. 95.

  • Detection of protein complexes from multiple protein interaction networks using graph embedding, Artificial Intelligence in Medicine, 2019, 96:107-115. SCI EI检索

  • A neural network approach to chemical and gene/protein entity recognition in patents. Journal of Cheminformatics (2018) 10: 65. SCI检索 影响因子3. 893  WOS:000453770100003

  • Document triage for identifying protein–protein interactions affected by mutations: a neural network ensemble approach. Database: The Journal of Biological Databases and Curation. 2018: bay097. doi:10.1093/database/bay097. SCI检索 影响因子3. 978  WOS:000445469700001

  • Identifying protein complexes based on node embeddings obtained from protein-protein interaction networks. BMC Bioinformatics.2018,19 :332 SCI检索 影响因子2. 213 WOS:000445215600002

  • SemaTyP: a knowledge graph based literature mining method for drug discovery. BMC Bioinformatics, 2018, 19(1):193. SCI检索 影响因子2. 213 WOS:000434048200005

  • An Attention-based BiLSTM-CRF Approach to Document-level Chemical Named Entity Recognition, Bioinformatics, 2018, 34(8), 1381-1388 SCI检索 影响因子7. 307 CCF B WOS:000430175000015

  • The impact of protein interaction networks' characteristics on computational complex detection methods,Journal of Theoretical Biology. 2018,439:141-151. 影响因子1.833

  • Drug Drug Interaction Extraction from Biomedical Literature Using Syntax Convolutional Neural Network, Bioinformatics, 2016, 32(22), 3444-3453 SCI检索 影响因子7. 307 WOS:000392748700010 CCF B他引11次

著作权
  • 基于卷积神经网络的事件触发词检测系统

  • 计算机网络实验教程

  • 基于机器学习及词典的面向多类型命名实体识别的生物医学信息抽取系统 申请号2019R11L229501 登记号  2019SR0483559

  • 基于深度学习和模板匹配的面向多类型命名实体关系抽取的生物医学信息抽取系统 申请号2019R11L229564  登记号 2019SR0620967

  • 中文开放域知识图谱问答系统软件V1.0 申请号 2020R11L291613 登记号 2020SR0688404

展开更多                                                                      

联系我们      
林鸿飞: hflin@
杨志豪: yangzh@
杨亮: liang@


扫描二维码
关注 CBDID微信公众号