【技术实现步骤摘要】
一种从交互数据中提取有效时间的方法
本专利技术属于有效时间提取
,涉及一种从交互数据中提取有效时间的方法。
技术介绍
现有的技术,无法实现智能的从一段话中提取多次的实体,不能判断有效时间的先后顺序,从而导致用户在输入内容过后,时间填写项有误差,导致体验感较差。
技术实现思路
本专利技术要解决的技术问题是:提供一种从交互数据中提取有效时间的方法,以解决现有技术中存在的问题。本专利技术采取的技术方案为:一种从交互数据中提取有效时间的方法,该方法包括以下步骤:(1)通过对大量的Word文档、邮件内容格式的文件进行内容提取,把内容格式统一转换为标准的输出格式,提取实体与有效时间,最后输出;(2)将从文档中提取出来的数据进行文本拆分、建模,利用结巴分词,对内容进行词性的标注,对关键字进行提取与标注,最后通过正则穷举的方法进行匹配,把有效的时间实体转换为标准格式的时间;(3)用户通过有效时间的提取,按照用户自己的语言习惯,输入内容;(4)将数据内容输入到已完善的规则中,得到分割后的实体信息,提取出时间的实体,再用正则穷举的方法判断所有的数量词是否符合年月日时分秒的规则,提取 ...
【技术保护点】
1.一种从交互数据中提取有效时间的方法,其特征在于:该方法包括以下步骤:(1)通过对大量的Word文档、邮件内容格式的文件进行内容提取,把内容格式统一转换为标准的输出格式,提取实体与有效时间,最后输出;(2)将从文档中提取出来的数据进行文本拆分、建模,利用结巴分词,对内容进行词性的标注,对关键字进行提取与标注,最后通过正则穷举的方法进行匹配,把有效的时间实体转换为标准格式的时间;(3)用户通过有效时间的提取,按照用户自己的语言习惯,输入内容;(4)将数据内容输入到已完善的规则中,得到分割后的实体信息,提取出时间的实体,再用正则穷举的方法判断所有的数量词是否符合年月日时分秒的 ...
【技术特征摘要】
1.一种从交互数据中提取有效时间的方法,其特征在于:该方法包括以下步骤:(1)通过对大量的Word文档、邮件内容格式的文件进行内容提取,把内容格式统一转换为标准的输出格式,提取实体与有效时间,最后输出;(2)将从文档中提取出来的数据进行文本拆分、建模,利用结巴分词,对内容进行词性的标注,对关键字进行提取与标注,最后通过正则穷举的方法进行匹配,把有效...
【专利技术属性】
技术研发人员:吴漾,王鹏宇,朱州,曾路,冯光璐,郭仁超,
申请(专利权)人:贵州电网有限责任公司,
类型:发明
国别省市:贵州,52
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。