一种时间信息提取方法及装置、智能问答系统制造方法及图纸

技术编号:13334807 阅读:74 留言:0更新日期:2016-07-12 10:21
本发明专利技术公开了一种时间信息提取方法及装置、智能问答系统。其中,该时间信息提取方法包括:从当前文本中提取出中文时间信息;根据预定的转换规则,对中文时间信息中的中文时间短语进行转换,得到数字年份信息、数字月份信息、和/或数字日数信息;根据数字年份信息、数字月份信息、和/或数字日数信息计算出符合预定时间格式的数字时间信息。通过本发明专利技术,达到了可以满足用户对智能问答系统提取多样性时间信息的需求的效果。

【技术实现步骤摘要】

本专利技术涉及通信领域,尤其是涉及一种时间信息提取方法及装置、智能问答系统
技术介绍
传统的客户服务中心以电话呼叫中心为主,但在互联网的发展、用户数量的增多以及用户问题多样性等因素的影响下,传统的客户服务中心逐渐不能满足客户的需要。在这种情况下,很多大型服务企业在不断拓展更为经济高效的智能客服中心(例如,智能在线客服、智能手机应用等),以减小人工成本,增强用户体验。其中,智能客服的核心是智能问答系统,智能问答系统能够针对用户输入的问题提供简短、精确的答案,以这样的方式可以解决传统的客户服务无法满足用户需要的问题。随着智能问答系统被大量广泛地研究和应用,智能问答系统的相关技术及相关产品引起了国内外许多科研机构和公司的极大兴趣,已经有许多产品出现,很好地适应了市场的需求。然而,中文智能问答系统由于起步较晚导致不够成熟,当然这也和中文的语法和语义的复杂性等多种因素有关。在客户服务过程中,如何提取用户输入文本的时间信息是一个关键问题,例如,查询哪个月的话费,查询哪一天的天气情况等,提取时间信息的准确度直接关系到智能问答系统提供答案的准确性。在中文表达中,时间信息的表达方式有两种:一种是使用直接时间表达,例如,2014年12月30日、两千年十一月二十一号等;另一种是使用时间词语表达,例如,去年、上个月、明天等。通常,一般文本内容中除了采用上述方式表达的时间信息,还存在方言等特殊的时间词语。面对如此复杂的中文时间信息表达方式,传统的固定单一的时间信息提取方案已经无法满足用户的需要。然而,针对上述情况,现有技术中并没有提供一种有效的时间信息提取方案,以充分满足用户的时间信息多样化的需求。
技术实现思路
本专利技术的主要目的在于提供一种时间信息提取方法及装置、智能问答系统,以解决现有技术存在的面对复杂中文时间信息表达方式,传统的固定单一的时间信息提取方案已经无法满足用户的需要的问题。为了达到上述目的,本专利技术提供了一种时间信息提取方法,包括:从当前文本中提取出中文时间信息;根据预定的转换规则,对中文时间信息中的中文时间短语进行转换,得到数字年份信息、数字月份信息、和/或数字日数信息;根据数字年份信息、数字月份信息、和/或数字日数信息计算出符合预定时间格式的数字时间信息。优选地,转换规则包括:数字年份信息=预先配置的年份差值X+当前年份的年份数字,其中,年份差值X代表中文时间短语中的中文年份与当前年份的数字差值;数字月份信息=预先配置的月份差值Y+当前月份的月份数字,其中,月份差值Y代表中文时间短语中的中文月份与当前月份的数字差值;数字日数信息=预先配置的日数差值Z+当前日数的日数数字,其中,日数差值Z代表中文时间短语中的中文日数与当前日数的数字差值。优选地,在根据预定的转换规则,对中文时间信息中的中文时间短语进行转换之前,包括:将中文时间信息中的中文数字转换成阿拉伯数字;从阿拉伯数字中分别提取数字年份信息、数字月份信息、和/或数字日数信息,在提取失败的情况下,确定需要使用转换规则对中文时间短语进行转换。优选地,从当前文本中提取出中文时间信息,包括:按照预定的文本分割规则,对当前文本进行分割,得到短文本;按照预定的提取规则,从短文本中提取中文时间信息。优选地,文本分割规则包括:按照标点符号对用户输入文本进行分割;提取规则包括:按照年、月、日的顺序从短文本中提取至少包含年、月、日三个字中至少一个字的文本?目息O优选地,根据数字年份信息、数字月份信息、和/或数字日数信息计算出符合预定时间格式的数字时间信息,包括:按照每个自然年的12个自然月的日数不同的特点,按照顺序对数字日数信息、数字月份信息、和/或数字年份信息进行更新和组合,得到数字时间信息;按照预定时间格式输出数字时间信息。本专利技术提供了一种时间信息提取装置,包括:第一提取模块,用于从当前文本中提取出中文时间信息;第一转换模块,用于根据预定的转换规则,对中文时间信息中的中文时间短语进行转换,得到数字年份信息、数字月份信息、和/或数字日数信息;计算模块,用于根据数字年份信息、数字月份信息、和/或数字日数信息计算出符合预定时间格式的数字时间信息。优选地,转换规则包括:数字年份信息=预先配置的年份差值X+当前年份的年份数字,其中,年份差值X代表中文时间短语中的中文年份与当前年份的数字差值;数字月份信息=预先配置的月份差值Y+当前月份的月份数字,其中,月份差值Y代表中文时间短语中的中文月份与当前月份的数字差值;数字日数信息=预先配置的日数差值Z+当前日数的日数数字,其中,日数差值Z代表中文时间短语中的中文日数与当前日数的数字差值。优选地,该装置还包括:第二转换模块,用于在第一转换模块根据预定的转换规贝1J,对中文时间信息中的中文时间短语进行转换之前,将中文时间信息中的中文数字转换成阿拉伯数字;第二提取模块,用于从阿拉伯数字中分别提取数字年份信息、数字月份信息、和/或数字日数信息,在提取失败的情况下,确定需要由第一转换模块使用转换规则对中文时间短语进行转换。优选地,第一提取模块包括:分割单元,用于按照预定的文本分割规则,对当前文本进行分割,得到短文本;提取单元,用于按照预定的提取规则,从短文本中提取中文时间?目息O优选地,文本分割规则包括:按照标点符号对用户输入文本进行分割;提取规则包括:按照年、月、日的顺序从短文本中提取至少包含年、月、日三个字中至少一个字的文本?目息O本专利技术还提供了一种智能问答系统,包括:上述时间信息提取装置。与现有技术相比,本专利技术所述的时间信息提取方法及装置、智能问答系统,可以从文本中提取与时间有关的中文数字和时间短语,将时间中文数字转换为时间信息,根据预先设定的转换规则对时间短语进行转换,得到时间信息,并最终输出符合预定时间格式的时间信息,通过这样的方式,可以满足用户对智能问答系统提取多样性时间信息的需求。【附图说明】图1是根据本专利技术实施例的时间信息提取方法流程图;图2是根据本专利技术优选实施例的日期提取流程图;图3是根据本专利技术优选实施例的日期计算流程图;图4是根据本专利技术实施例的时间信息提取装置的结构框图;图5是根据本专利技术优选实施例的时间信息提取装置的示意图;图6是根据本专利技术实施例的智能问答系统的结构框图;以及图7是根据本专利技术优选实施例的智能问答系统的结构示意图。【具体实施方式】下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域的普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。针对现有技术中缺乏一种有效的时间信息提取方案,以充分满足用户的时间信息多样化的需求的问题,本专利技术提供了一种可以把文本中的中文时间信息提取出来,并转换成标准日期格式或自定义日期格式的时间信息输出的方式。本专利技术实施例提供了一种时间信息提取方法。图1是根据本专利技术实施例的时间信息提取方法流程图,如图1所示,该流程包括以下步骤(步骤S102-步骤S106):步骤S102、从当前文本中提取出中文时间信息。在本实施例中,该步骤可以通过以下方式实现:先按照预定的文本分割规则,对当前文本进行分割,得到短文本;再按照预定的提取规本文档来自技高网
...

【技术保护点】
一种时间信息提取方法,其特征在于,包括:从当前文本中提取出中文时间信息;根据预定的转换规则,对中文时间信息中的中文时间短语进行转换,得到数字年份信息、数字月份信息、和/或数字日数信息;根据所述数字年份信息、所述数字月份信息、和/或所述数字日数信息计算出符合预定时间格式的数字时间信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:丁岩韩丙卫冯军
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1