一种从交互数据中提取有效时间的方法技术

技术编号:22076149 阅读:37 留言:0更新日期:2019-09-12 14:16
本发明专利技术公开了一种从交互数据中提取有效时间的方法,该方法包括步骤:对文件进行内容提取,获得实体和有效时间;对提取实体和有效时间就你行文本拆分建模,利用结巴分词进行词性标注,通过正则穷举的方法进行匹配,把有效的时间实体转换为标准格式的时间;用户通过有效时间的提取,按照用户自己的语言习惯,输入内容;得到分割后的实体信息,提取出时间的实体,再用正则穷举的方法判断所有的数量词是否符合年月日时分秒的规则,提取有效时间,转换为标准格式输出;核对内容。本发明专利技术能判断是否是有效时间,并从时间先后顺序进行了排序,能大幅度的提高时间填写的准确性,从而达到效率的提升。

A Method of Extracting Effective Time from Interactive Data

【技术实现步骤摘要】
一种从交互数据中提取有效时间的方法
本专利技术属于有效时间提取
,涉及一种从交互数据中提取有效时间的方法。
技术介绍
现有的技术,无法实现智能的从一段话中提取多次的实体,不能判断有效时间的先后顺序,从而导致用户在输入内容过后,时间填写项有误差,导致体验感较差。
技术实现思路
本专利技术要解决的技术问题是:提供一种从交互数据中提取有效时间的方法,以解决现有技术中存在的问题。本专利技术采取的技术方案为:一种从交互数据中提取有效时间的方法,该方法包括以下步骤:(1)通过对大量的Word文档、邮件内容格式的文件进行内容提取,把内容格式统一转换为标准的输出格式,提取实体与有效时间,最后输出;(2)将从文档中提取出来的数据进行文本拆分、建模,利用结巴分词,对内容进行词性的标注,对关键字进行提取与标注,最后通过正则穷举的方法进行匹配,把有效的时间实体转换为标准格式的时间;(3)用户通过有效时间的提取,按照用户自己的语言习惯,输入内容;(4)将数据内容输入到已完善的规则中,得到分割后的实体信息,提取出时间的实体,再用正则穷举的方法判断所有的数量词是否符合年月日时分秒的规则,提取有效时间,转换为标准本文档来自技高网...

【技术保护点】
1.一种从交互数据中提取有效时间的方法,其特征在于:该方法包括以下步骤:(1)通过对大量的Word文档、邮件内容格式的文件进行内容提取,把内容格式统一转换为标准的输出格式,提取实体与有效时间,最后输出;(2)将从文档中提取出来的数据进行文本拆分、建模,利用结巴分词,对内容进行词性的标注,对关键字进行提取与标注,最后通过正则穷举的方法进行匹配,把有效的时间实体转换为标准格式的时间;(3)用户通过有效时间的提取,按照用户自己的语言习惯,输入内容;(4)将数据内容输入到已完善的规则中,得到分割后的实体信息,提取出时间的实体,再用正则穷举的方法判断所有的数量词是否符合年月日时分秒的规则,提取有效时间,...

【技术特征摘要】
1.一种从交互数据中提取有效时间的方法,其特征在于:该方法包括以下步骤:(1)通过对大量的Word文档、邮件内容格式的文件进行内容提取,把内容格式统一转换为标准的输出格式,提取实体与有效时间,最后输出;(2)将从文档中提取出来的数据进行文本拆分、建模,利用结巴分词,对内容进行词性的标注,对关键字进行提取与标注,最后通过正则穷举的方法进行匹配,把有效...

【专利技术属性】
技术研发人员:吴漾王鹏宇朱州曾路冯光璐郭仁超
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:贵州,52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1