CN104182535B 一种人物关系抽取方法和装置
申请日:2014.08.29
IPC分类号:G06F17/30
公开日:20170524
申请人:苏州大学
发明人:钱龙华;顾静航;李军辉;周国栋
一种人物关系抽取方法和装置
自然语言处理技术领域。
如何能够在面对海量文本资源时,抽取丰富的人物关系,并提高人物关系抽取的效率,是现有技术中亟待解决的问题。
一种人物关系抽取方法和装置,该方法包括:确定待抽取的人物关系的基本模式,对人物关系的基本模式进行人称代词的泛化得到泛化模式;在语料库中匹配满足泛化模式的人物关系;在指代消解范围内确定泛化模式中的人称代词所指向的第一人名;抽取该第一人名及对应的泛化模式的人物关系后端的第二人名,得到第一人名和第二人名的人物关系。
使得在面对海量文本资源时,不仅限于基本模式的人物关系的抽取,满足泛化模式的人物关系也可以被抽取出来,大大提高了人物关系的抽取效率。
申请号:CN201410436852.5
公开(公告)号:CN104182535B
申请日:2014.08.29
公开(公告)日:20170524
优先权:
同族:中国
同族引用文献:3
同族施引专利:18
申请人:苏州大学
申请人地址:215137 江苏省苏州市相城区济学路8号
权利人:苏州大数据有限公司$苏州大数据交易服务有限公司$苏州大数据研究院有限公司
权利人地址:215000 江苏省苏州市姑苏区人民路3118号国发大厦北楼7楼
发明人:钱龙华;顾静航;李军辉;周国栋
代理机构:北京集佳知识产权代理有限公司
代理人:常亮
-
1.一种人物关系抽取方法,其特征在于,包括:
确定待抽取的人物关系的基本模式,所述基本模式包含所述待抽取的人物关系的多种语义表述相同的字符串;
对所述人物关系的基本模式中位于前端的人名进行人称代词的泛化,得到泛化模式,所述泛化模式根据不同的人称代词具有多种扩展模式;
在语料库中匹配满足所述泛化模式的人物关系所在的句子,并依据所述句子确定指代消解范围,其中,所述指代消解范围包括:所述句子本身,以及位于所述句子上方的两个句子;
在所述指代消解范围内确定所述泛化模式中的人称代词所指向的第一人名;
抽取所述第一人名,以及与所述第一人名对应的所述泛化模式的人物关系后端的第二人名,得到第一人名和第二人名的人物关系。
7.一种人物关系抽取装置,其特征在于,包括:
确定单元,用于确定待抽取的人物关系的基本模式,所述基本模式包含所述待抽取的人物关系的多种语义表述相同的字符串;
泛化单元,用于对所述人物关系的基本模式中位于前端的人名进行人称代词的泛化,得到泛化模式,所述泛化模式根据不同的人称代词具有多种扩展模式;
模式匹配单元,用于在语料库中匹配满足所述泛化模式的人物关系所在的句子,并依据所述句子确定指代消解范围,其中,所述指代消解范围至少包括:所述句子本身,以及位于所述句子上方的两个句子;
指代消解单元,用于在所述指代消解范围内确定所述泛化模式中的人称代词所指向的第一人名;
人物关系抽取单元,用于抽取所述第一人名,以及与所述第一人名对应的所述泛化模式的人物关系后端的第二人名,得到第一人名和第二人名的人物关系。

宝贵建议
15501385867
contact@hugoip.com
更新日志