一种人机交互文本中抽取日期时间的方法和装置制造方法及图纸

技术编号:24938082 阅读:21 留言:0更新日期:2020-07-17 20:57
本发明专利技术公开了一种人机交互文本中抽取日期时间的方法和装置。该方法包括以下步骤:S101,分割文本为若干文本段;S102,计算意图文本和各个分割的文本段的语义相似度;S103,比较所述各个分割的文本段语义相似度和阈值;S104,如果所述各个分割的文本段中任一分割的文本段的语义相似度大于阈值,则将所述任一分割的文本段所包含的时间文本标准化时间戳,生成应答返回。本发明专利技术的人机交互文本中抽取日期时间的方法,在外呼的多轮对话场景中,通过NLP中NER对用户的说话的文本打上time的时间标签,然后通过语义相似度模型匹配用户表达的意图,两者结合,就可以很好提高业务时间槽位抽取精确率,提升产品的交互体验。

【技术实现步骤摘要】
一种人机交互文本中抽取日期时间的方法和装置
本专利技术涉及人机交互
,尤其涉及一种人机交互文本中抽取日期时间的方法和装置。
技术介绍
在外呼的多轮交互场景中,由于业务的需要提取用户在某一轮交互中时间的信息,例如:催收场景中需要提取用户具体的还款时间,以便业务判断是否有逾期的风险。通过对时间的词典的进行模型训练,利用命名实体识别(NER)对于时间文本打上time的标签,如果是多个时间情况下,则以时间标签为分隔符进行分句,然后利用相识度模型进行相似度计算,可以选定初始阈值0.8(可以根据实际测试值云端配置),如果匹配到关键字或着相似度大于阈值,就认为是抽取时间是业务所需要的时间,然后在标准化具体的时间戳返回。通过自然语言处理(NLP)中的命名实体识别(NER)打上time标签,然后对于用户中的对话中文本提取时间的文本,在用户说话的文本如果含有有多个时间标签,这样抽取的时间信息,不仅不能有效的区分到底是否是业务需要的时间,并且严重影踪用户体验,甚至引起用户的投诉。
技术实现思路
为了解决上述问题,本专利技术基于自然语本文档来自技高网...

【技术保护点】
1.一种人机交互文本中抽取日期时间的方法,其特征在于,包括以下步骤:/nS101,分割文本为若干文本段;/nS102,计算意图文本和各个分割的文本段的语义相似度;/nS103,比较所述各个分割的文本段语义相似度和阈值;/nS104,如果所述各个分割的文本段中任一分割的文本段的语义相似度大于阈值,则将所述任一分割的文本段所包含的时间文本标准化时间戳,生成应答返回。/n

【技术特征摘要】
1.一种人机交互文本中抽取日期时间的方法,其特征在于,包括以下步骤:
S101,分割文本为若干文本段;
S102,计算意图文本和各个分割的文本段的语义相似度;
S103,比较所述各个分割的文本段语义相似度和阈值;
S104,如果所述各个分割的文本段中任一分割的文本段的语义相似度大于阈值,则将所述任一分割的文本段所包含的时间文本标准化时间戳,生成应答返回。


2.根据权利要求1所述的方法,其特征在于,所述S101中,包括以下步骤:
S1011,获取人机交互中用户说话的文本;
S1012,建立命名实体识别模型,并对时间的词典进行模型训练;
S1013,利用所述命名实体识别模型进行文本的基于自然语言处理中的命名实体识别,打上time标签;
S1014,以所述time标签为分隔符,将所述文本分割为若干文本段。


3.根据权利要求1或2所述的方法,其特征在于,所述S102中,包括以下步骤:
S1021,获取意图文本;
S1022,建立相似度模型;
S1023,利用所述相似度模型进行意图文本和各个分割的文本段的语义相似度的计算。


4.根据权利要求1-3任一所述的方法,其特征在于,所述S103中,包括以下步骤:
S1031,设置用于和所述各个分割的文本段语义相似度进行比较的初始的阈值;
S1032,分别进行所述各个分割的文本段语义相似度和阈值的比较。


5.根据权利要求1-4任一所述的方法,其特征在于,所述初始的阈值为0.8。


6.一种人...

【专利技术属性】
技术研发人员:李旭滨詹学君
申请(专利权)人:云知声智能科技股份有限公司厦门云知芯智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1