时间信息提取方法、装置以及计算机存储介质制造方法及图纸

技术编号:21141309 阅读:91 留言:0更新日期:2019-05-18 05:13
一种时间信息提取方法、装置以及计算机存储介质,所述方法包括:获取文本数据;对所述文本数据进行拆分,提取所述文本数据中的实体词语以及有效时间;将所述实体词语与有效时间进行匹配,提取所述文本数据中的时间信息。采用上述方法,可以提升提取的时间信息的准确性。

Time Information Extraction Method, Device and Computer Storage Media

【技术实现步骤摘要】
时间信息提取方法、装置以及计算机存储介质
本专利技术涉及数据处理领域,尤其涉及一种时间信息提取方法、装置以及计算机存储介质。
技术介绍
如今,在企业交流以及人们日常交流中,文本数据中的信息量非常大。在各种场景中,文本数据中的时间信息是不可忽视的客观信息,因此,从大量的文本数据中提取准确的时间信息变得十分重要。现有技术中,从文本数据中提取时间信息的方法通常是:从文本数据中提取数字信息,将数字信息作为时间信息。然而,直接将数字信息作为时间信息,会导致提取的时间信息的准确度较低。
技术实现思路
本专利技术解决的技术问题是提取的时间信息的准确度较低。为解决上述技术问题,本专利技术实施例提供一种时间信息提取方法,包括:获取文本数据;对所述文本数据进行拆分,提取所述文本数据中的实体词语以及有效时间;将所述实体词语与有效时间进行匹配,提取所述文本数据中的时间信息。可选的,所述提取所述文本数据中的实体词语以及有效时间,包括:根据实体词库或词义分析算法提取所述文本数据中的实体词语,提取所述文本数据中的表征数字的信息作为有效时间。可选的,在提取所述文本数据中的实体词语以及有效时间之后,还包括:获取所述实体词本文档来自技高网...

【技术保护点】
1.一种时间信息提取方法,其特征在于,包括:获取文本数据;对所述文本数据进行拆分,提取所述文本数据中的实体词语以及有效时间;将所述实体词语与有效时间进行匹配,提取所述文本数据中的时间信息。

【技术特征摘要】
1.一种时间信息提取方法,其特征在于,包括:获取文本数据;对所述文本数据进行拆分,提取所述文本数据中的实体词语以及有效时间;将所述实体词语与有效时间进行匹配,提取所述文本数据中的时间信息。2.根据权利要求1所述的时间信息提取方法,其特征在于,所述提取所述文本数据中的实体词语以及有效时间,包括:根据实体词库或词义分析算法提取所述文本数据中的实体词语,提取所述文本数据中的表征数字的信息作为有效时间。3.根据权利要求2所述的时间信息提取方法,其特征在于,在提取所述文本数据中的实体词语以及有效时间之后,还包括:获取所述实体词语中与时间相关的有效实体词语。4.根据权利要求3所述的时间信息提取方法,其特征在于,所述获取所述实体词语中与时间相关的有效实体词语,包括:根据实体词库或词义分析算法,在所述文本数据中,若在距离选定实体词语的预设字数范围内存在表征时间的实体词语,确定所述选定实体词语为所述有效实体词语。5.根据权利要求1所述的时间信息提取方法,其特征在于,所述将所述实体词语与有效时间进行匹配,提取所述文本数据中的时间信息,包括:根据实体词语的词义,将所述实体词语与所述实体词语对应的有效时间进行匹配,得到时间信息单位;根据多个所述时间信息单位中的所述实体词语在所述文本数据中的位...

【专利技术属性】
技术研发人员:王浩周星周永吉陈凤杰
申请(专利权)人:贵州小爱机器人科技有限公司
类型:发明
国别省市:贵州,52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1