【技术实现步骤摘要】
时间类型的识别方法、装置、存储介质、电子装置
本专利技术涉及计算机领域,具体而言,涉及一种时间类型的识别方法、装置、存储介质、电子装置。
技术介绍
相关技术中对文本智能抓取过程,经常需要对时间所属的时间类型准确识别,如招标文件中的时间类型包括招标公告时间、投标截止时间、开标时间、中标公告时间等,当通过定位了一个时间后,需要智能识别出这个时间属于哪一个类型的时间,以进一步确定该时间的作用,以对投标人进行时间上的提醒,如识别出了投标截止时间后,就可以在截止时间前智能地提醒投标人提前做好标书等准备工作。相关技术中还没有出现识别时间类型的方案。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种时间类型的识别方法、装置、存储介质、电子装置,以至少解决相关技术中不能在文本中识别时间类型的技术问题的技术问题。根据本专利技术实施例的一个方面,提供了一种时间类型的识别方法,包括:确定时间信息在样本文件中的位置;计算与所述时间信息相关的文本信息的向量值;根据所述向量值识别所述时间信息的时间类型。根据本专利技术实施例的另一方面,还提供了一种时间类型的识别 ...
【技术保护点】
1.一种时间类型的识别方法,其特征在于,包括:确定时间信息在样本文件中的位置;计算与所述时间信息相关的文本信息的向量值;根据所述向量值识别所述时间信息的时间类型。
【技术特征摘要】
1.一种时间类型的识别方法,其特征在于,包括:确定时间信息在样本文件中的位置;计算与所述时间信息相关的文本信息的向量值;根据所述向量值识别所述时间信息的时间类型。2.根据权利要求1所述的方法,其特征在于,在计算与所述时间信息相关的文本信息的向量值之前,所述方法还包括:提取与所述位置相邻的预定长度的文本信息。3.根据权利要求1所述的方法,其特征在于,计算与所述时间信息相关的文本信息的向量值包括:对所述文本信息进行分词处理得到多个分词;在所述多个分词中选择一个或多个关键词;对所述关键词进行数值化处理得到与所述关键词对应的分词向量。4.根据权利要求3所述的方法,其特征在于,根据所述向量值识别所述时间信息的时间类型包括:计算所述向量值与各时间类型的向量的预设数值之间的距离;将距离最短的时间类型确定为所述时间信息的时间类型。5.根据权利要求4所述的方法,其特征在于,在计算所述向量值与各时间类型的向量的预设数值之间的距离之前,所述方法还包括:统计多个时间类型的文本信息,得到各个时间类型的关键词;对所述各个时间类型的关键词进行数值化处理得到与所述各时间类型对应的所述预设数值。6.根据权利要求5所述的方法,其特征在于,在将距离最短的时间类型确定为所述时间信息的时间类型时,通过以下公式计算所述时间信息的时间类型:class={j,j∈min{value(j)}};其中,Value(j)为所述文本信息的向量值与所述各时间类型对应的...
【专利技术属性】
技术研发人员:聂颖,郑权,张峰,
申请(专利权)人:龙马智芯珠海横琴科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。