当前位置: 首页 > 专利查询>陈包容专利>正文

一种判断事件时态的方法技术

技术编号:21361313 阅读:31 留言:0更新日期:2019-06-15 09:19
本发明专利技术涉及人工智能自然语言处理领域,且公开了一种判断事件时态的方法,所述判断事件时态的方法包括以下步骤:第一步,创建专用数据库群;第二步,从文本中抽取事件;第三步,判断事件的时态,依据数据库群的数据,检测事件文本的时态词,对事件的时态做出判断。该判断事件时态的方法,通过建立包含事件前、中、后时态词库的数据库群,并进行分类,以便计算机或机器判断文本事件的时态时,依据相应的时态词库判断事件的时态,从而提高了计算机或机器判断文本事件时态的准确度,并通过建立及物动词库、事件词库以及其他词库的数据库群,以便计算机或机器快速找出隐含的时态词,提高了复杂文本事件时态判断的准确性和效率。

A Method of Judging Event Temporal

The invention relates to the field of artificial intelligence natural language processing, and discloses a method for judging event tense. The method for judging event tense includes the following steps: first, creating a special database group; second, extracting events from text; third, judging event tense, detecting event text tense words based on data of database group, and time of events. Make a judgment. The method of event tense judgment is based on the establishment and classification of database groups containing pre-event, middle-event and post-event tense thesaurus, so that when a computer or machine judges the tense of a text event, it judges the tense of an event according to the corresponding tense thesaurus, thus improving the accuracy of the computer or machine judging the tense of a text event, and by establishing transitive verb database and event thesaurus, the accuracy of judging the tense of a text event is improved. The database group of other lexical databases can help computers or machines quickly find the implied tense words, and improve the accuracy and efficiency of the temporal judgment of complex text events.

【技术实现步骤摘要】
一种判断事件时态的方法
本专利技术涉及人工智能自然语言处理领域,具体为一种判断事件时态的方法。
技术介绍
众所周知,随着计算机和互联网的高速发展,基于计算机和互联网的人工智能技术研究已然成为主流。人工智能通过对人的意识、思维的信息过程进行学习模拟,赋予机器像人那样思考,使得机器能够胜任一些通常需要人类智能才能完成的复杂工作。对我国来说,人工智能技术的一大难点就是自然语言处理,其中,在对文本事件的时态判断中,由于中文语义复杂,难以深入理解,使得计算机或机器对文本事件的时态做出准确的判断很难,容易导致计算机或机器做出错误学习模拟。
技术实现思路
本专利技术提供了一种判断事件时态的方法,具备提高计算机或机器判断文本事件时态的准确度的优点,解决了
技术介绍
中提到的问题。本专利技术提供如下技术方案:一种判断事件时态的方法,所述判断事件时态的方法包括以下步骤:第一步,创建专用数据库群,所述专用数据库群可自定义增减数据;第二步,从文本中抽取事件,所述文本为电子格式的面向计算机信息处理的中文文字组合;第三步,判断事件的时态,依据数据库群的数据,检测事件文本的时态词,对事件的时态做出判断。优选的,所述专用数据库群包括时态词库、时间名词库、及物动词库、事件词库以及其他词库。优选的,所述时态词库包括未发生时态词库、正发生时态词库和已发生时态词库,所述未发生时态词库包括事件前未发生时态词库、事件中未发生时态词库、事件后未发生时态词库和未发生的时间词库,所述正发生时态词库包括事件前正发生时态词库、事件中正发生时态词库、事件后正发生时态词库和正发生的时间词库,所述已发生时态词库包括事件前已发生时态词库、事件中已发生时态词库、事件后已发生时态词库和已发生的时间词库。优选的,所述其他词库包括介词库、量词库、名词库、代词库、非及物动词库、形容词库、数词库、副词库、连词库、助词库、叹词库以及拟声词库。优选的,所述判断事件的时态的流程如下:S1,提取所述抽取事件所在的单句,抽取及物动词往左和往右的第一个标点符号或空格之间的文本内容,作为提取的单句;S2,在所述提取的单句中,去掉所述事件文本的左侧相邻事件及其左侧的所有文本,以及去掉所述事件文本的右侧相邻事件及其右侧的所有文本;S3,根据预先创建的专用数据库群中的时态词库,在剩余文本中,检测所述事件文本的左侧和右侧是否有直接相邻的未发生时态词、已发生时态词、正发生时态词,如果有则进入下一步,如果无,则根据预先创建的专用数据库群中的词库,在剩余文本中,去掉剩余事件文本中的动词相邻左侧和右侧的其他词库中的字词及其任意组合,再根据预先创建的专用数据库群中的时态词库,在剩余文本中,检测所述事件文本的左侧和右侧有无直接相邻的未发生时态词、已发生时态词、正发生时态词,如果有则进入下一步;S4,根据S3的检测结果,依据时态词库检测事件文本的左侧是否有时态词,如有事件前未发生时态词、未发生的时间词或其任意组合,则判断该事件为未发生事件,如有事件前已发生时态词、已发生的时间词或其任意组合,则判断事件为已发生事件,如有事件前正发生时态词、正发生的时间词或其任意组合,则判断该事件为正发生事件,如果事件文本的左侧没有时态词,进入下一步;S5,根据S3的检测结果,检测事件文本中的及物动词的右侧,或事件词中的第一个文字的右侧是否有时态词,如有事件中未发生时态词、未发生的时间词或其任意组合,则判断该事件为未发生事件,如有事件中已发生时态词、已发生的时间词或其任意组合,则判断该事件为已发生事件,如有事件中正发生时态词、正发生的时间词或其任意组合,则判断该事件为正发生事件,如无,进入下一步;S6、根据第三步的检测结果,检测事件文本右侧是否有时态词,如有事件后未发生时态词、未发生的时间词或其任意组合,则判断该事件为未发生事件,如有事件后已发生时态词、已发生的时间词或其任意组合,则判断该事件为已发生事件,如有事件后正发生时态词、正发生的时间词或其任意组合,则判断该事件为正发生事件,如无,终止计算。本专利技术具备以下有益效果:1、该判断事件时态的方法,通过建立包含事件前、中、后时态词库的数据库群,并进行分类,以便计算机或机器判断文本事件的时态时,依据相应的时态词库判断事件的时态,从而提高了计算机或机器判断文本事件时态的准确度,确保计算机或机器做出正确的学习模拟。2、该判断事件时态的方法,通过建立包含及物动词库、事件词库以及其他词库的数据库群,以便计算机或机器在判断文本事件的时态时,根据及物动词库、事件词库以及其他词库,对复杂文本事件中的无关字词进行相应删除,以便快速找出隐含的时态词,不仅提高了复杂文本事件时态判断的准确性,还提高了复杂文本事件时态判断的效率。附图说明图1为本专利技术文本事件时态判断流程图;图2为本专利技术专用数据库群示意图;图3为本专利技术时态词库示意图;图4为本专利技术判断抽取事件时态流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1-4,一种判断事件时态的方法,判断事件时态的方法包括以下步骤:第一步,创建专用数据库群,专用数据库群可自定义增减数据,专用数据库群包括时态词库、时间名词库、及物动词库、事件词库以及其他词库,时态词库包括未发生时态词库、正发生时态词库和已发生时态词库,未发生时态词库包括事件前未发生时态词库、事件中未发生时态词库、事件后未发生时态词库和未发生的时间词库,事件前未发生时态词库包括“没有、未、没、想、等一下、计划等”在同一单句中位于事件文本左侧的未发生时态字、词以及短语,事件中未发生时态词库包括“下、一下、一个等”在同一单句中位于事件文本中的及物动词的右侧,或事件词中的第一个文字的右侧的未发生时态字词以及短语,事件后未发生时态词库包括“的计划、的想法、的准备、去、的设想等”在同一单句中位于事件文本中的及物动词的右侧,或事件词中的第一个文字的右侧的未发生时态字词以及短语,未发生的时间词库包括“过/等+量词+时间名词及其任意组合(例:计划过一小时看电影)”的短语组合,还包括“下个/下次/未来+时间名词及其任意组合(例:计划下个月装修房子)”的时间段与组合,还包括“量词+时间名词及其任意组合+以后/之后(例:计划一天后打电话给你)”的时间短语组合,正发生时态词库包括事件前正发生时态词库、事件中正发生时态词库、事件后正发生时态词库和正发生的时间词库,事件前正发生时态词库包括“在、正在等”在同一单句中位于事件文本左侧的正发生时态字词,事件中正发生时态词库包括“着、这等”在同一单句中位于事件文本中的及物动词的右侧,或事件词中的第一个文字的右侧的正发生时态字词,事件后正发生时态词库包括“呢、中、开始等”在同一单句中位于事件文本右侧的正发生时态字词,正发生的时间词库包括“此时、此刻、现在、实时等”,已发生时态词库包括事件前已发生时态词库、事件中已发生时态词库、事件后已发生时态词库和已发生的时间词库,事件前已发生时态词库包括“之前、曾经、已经等”在同一单句中位于事件文本左侧的已发生时态字词,事件中本文档来自技高网...

【技术保护点】
1.一种判断事件时态的方法,其特征在于:所述判断事件时态的方法包括以下步骤:第一步,创建专用数据库群,所述专用数据库群可自定义增减数据;第二步,从文本中抽取事件,所述文本为电子格式的面向计算机信息处理的中文文字组合;第三步,判断事件的时态,依据数据库群的数据,检测事件文本的时态词,对事件的时态做出判断。

【技术特征摘要】
1.一种判断事件时态的方法,其特征在于:所述判断事件时态的方法包括以下步骤:第一步,创建专用数据库群,所述专用数据库群可自定义增减数据;第二步,从文本中抽取事件,所述文本为电子格式的面向计算机信息处理的中文文字组合;第三步,判断事件的时态,依据数据库群的数据,检测事件文本的时态词,对事件的时态做出判断。2.根据权利要求1所述的一种判断事件时态的方法,其特征在于:所述专用数据库群包括时态词库、时间名词库、及物动词库、事件词库以及其他词库。3.根据权利要求2所述的一种判断事件时态的方法,其特征在于:所述时态词库包括未发生时态词库、正发生时态词库和已发生时态词库,所述未发生时态词库包括事件前未发生时态词库、事件中未发生时态词库、事件后未发生时态词库和未发生的时间词库,所述正发生时态词库包括事件前正发生时态词库、事件中正发生时态词库、事件后正发生时态词库和正发生的时间词库,所述已发生时态词库包括事件前已发生时态词库、事件中已发生时态词库、事件后已发生时态词库和已发生的时间词库。4.根据权利要求2所述的一种判断事件时态的方法,其特征在于:所述其他词库包括介词库、量词库、名词库、代词库、非及物动词库、形容词库、数词库、副词库、连词库、助词库、叹词库以及拟声词库。5.根据权利要求1所述的一种判断事件时态的方法,其特征在于:所述判断事件的时态的流程如下:S1,提取所述抽取事件所在的单句,抽取及物动词往左和往右的第一个标点符号或空格之间的文本内容,作为提取的单句;S2,在所述提取的单句中,去掉所述事件文本的左侧相邻事件及其左侧的所有文本,以及去掉所述事件文本的右侧相邻事件及其右侧的所有文本;S3,根据预先创建的专用数据库群...

【专利技术属性】
技术研发人员:陈包容
申请(专利权)人:陈包容
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1