System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 显示设备及实体召回方法技术_技高网

显示设备及实体召回方法技术

技术编号:40874377 阅读:2 留言:0更新日期:2024-04-08 16:42
本申请提供了一种显示设备及实体召回方法,显示设备包括:显示器;控制器,控制器被配置为:接收用户输入的语音指令;对所述语音指令进行语音识别,得到用户问句;通过查询布隆过滤器和redis缓存获取所述用户问句中的实体信息;根据所述实体信息获取所述用户问句的响应结果;根据所述响应结果进行响应。本申请提高了实体召回的速度和准确性。

【技术实现步骤摘要】

本申请涉及语音识别,尤其涉及一种显示设备及实体召回方法


技术介绍

1、在nlu(natural language understanding,自然语言理解)领域,单实体(即纯电影名、电视剧名称等)的识别一直以来是该领域的难点和重点。在语义理解场景下,由于知识库的更新不及时以及用户表达多样化等原因,深度学习模型的实体识别难度大,特别是在多语言语义理解场景下,这个问题显得尤其突出,而实体无法准确识别,会导致语音助手无法识别和理解用户的需求,进而影响用户体验。相关技术中,为了准确识别实体,通过构建实体知识库和知识搜索与查询子系统,可供线上服务如语义理解服务进行实体召回,该系统需要满足实体查询速度足够快、准确率足够高的特点,这给实体召回算法带来了较大的压力。


技术实现思路

1、为解决上述技术问题,本申请提供了一种显示设备及实体召回方法。

2、第一方面,本申请提供了一种显示设备,该显示设备包括:

3、显示器;

4、控制器,与所述显示器通信连接,被配置为:

5、接收用户输入的语音指令;

6、对所述语音指令进行语音识别,得到用户问句;

7、通过查询布隆过滤器和redis缓存获取所述用户问句中的实体信息;

8、根据所述实体信息获取所述用户问句的响应结果;

9、根据所述响应结果进行响应。

10、在一些实施例中,所述通过查询布隆过滤器和redis缓存获取所述用户问句中的实体信息,包括:

11、获取所述用户问句对应的全量候选实体;

12、通过布隆过滤器过滤所述全量候选实体中的非实体子串,得到用户词典;

13、基于所述用户词典,通过最大匹配算法将所述用户问句进行切词,得到切词结果;

14、在redis缓存中遍历所述切词结果,得到所述切词结果对应的实体信息;

15、根据所述实体信息获取所述用户问句的响应结果。

16、在一些实施例中,所述获取所述用户问句对应的全量候选实体,包括:

17、确定所述用户问句的子串长度生成范围;

18、在所述用户问句中查找长度在子串长度生成范围内的子串,得到用户问句的全量候选实体。

19、在一些实施例中,所述确定所述用户问句的子串长度生成范围,包括:

20、计算所述用户问句中的词的总数量;

21、将子串长度生成范围确定为1到所述总数量。

22、在一些实施例中,所述控制器还被配置为:

23、收集影视名称实体;

24、设置所述影视名称实体的实体标签为影视标签;

25、构建包含所述影视名称实体和实体标签的redis缓存;

26、构建所述影视名称实体对应的布隆过滤器。

27、在一些实施例中,所述在redis缓存中遍历所述切词结果,得到所述切词结果对应的实体信息,包括:

28、在redis缓存中遍历所述切词结果;

29、若所述切词结果中的子串存在于所述redis缓存中,将所述子串的实体类别设置为所述子串在所述redis缓存中的实体标签;

30、若所述切词结果中的子串存在于所述redis缓存中,设置所述子串的实体类别为第二类别,所述实体信息包括所述实体类别。

31、第二方面,本申请提供了一种实体召回方法,该方法包括:

32、获取用户问句对应的全量候选实体;

33、通过布隆过滤器过滤所述全量候选实体中的非实体子串,得到用户词典;

34、基于所述用户词典,通过最大匹配算法将所述用户问句进行切词,得到切词结果;

35、在redis缓存中遍历所述切词结果,得到所述切词结果对应的实体信息。

36、所述获取所述用户问句对应的全量候选实体,包括:

37、确定所述用户问句的子串长度生成范围;

38、在所述用户问句中查找长度在子串长度生成范围内的子串,得到用户问句的全量候选实体。

39、在一些实施例中,所述确定所述用户问句的子串长度生成范围,包括:

40、计算所述用户问句中的词的总数量;

41、将子串长度生成范围确定为1到所述总数量。

42、在一些实施例中,所述方法还包括:

43、收集影视名称实体;

44、设置所述影视名称实体的实体标签为影视标签;

45、构建包含所述影视名称实体和实体标签的redis缓存;

46、构建所述影视名称实体对应的布隆过滤器。

47、本申请提供的显示设备及实体召回方法的有益效果包括:

48、本申请实施例通过查询布隆过滤器和redis缓存获取用户问句中的实体信息,利用了布隆过滤器和redis缓存查询速度快的优点,能从用户问句中快速识别出实体信息;并且,通过将布隆过滤器和redis缓存相结合进行查询,解决了redis缓存穿透的问题,实现在海量实体库中,快速、准确查询与匹配实体的目的,进而有效地解决了语音识别中的单实体欠召和过召问题。

本文档来自技高网
...

【技术保护点】

1.一种显示设备,其特征在于,包括

2.根据权利要求1所述的显示设备,其特征在于,所述通过查询布隆过滤器和redis缓存获取所述用户问句中的实体信息,包括:

3.根据权利要求2所述的显示设备,其特征在于,所述获取所述用户问句对应的全量候选实体,包括:

4.根据权利要求3所述的显示设备,其特征在于,所述确定所述用户问句的子串长度生成范围,包括:

5.根据权利要求2所述的显示设备,其特征在于,所述控制器还被配置为:

6.根据权利要求2所述的显示设备,其特征在于,所述在redis缓存中遍历所述切词结果,得到所述切词结果对应的实体信息,包括:

7.一种实体召回方法,其特征在于,包括:

8.根据权利要求7所述的实体召回方法,其特征在于,所述获取所述用户问句对应的全量候选实体,包括:

9.根据权利要求8所述的实体召回方法,其特征在于,所述确定所述用户问句的子串长度生成范围,包括:

10.根据权利要求7所述的实体召回方法,其特征在于,所述方法还包括:

【技术特征摘要】

1.一种显示设备,其特征在于,包括

2.根据权利要求1所述的显示设备,其特征在于,所述通过查询布隆过滤器和redis缓存获取所述用户问句中的实体信息,包括:

3.根据权利要求2所述的显示设备,其特征在于,所述获取所述用户问句对应的全量候选实体,包括:

4.根据权利要求3所述的显示设备,其特征在于,所述确定所述用户问句的子串长度生成范围,包括:

5.根据权利要求2所述的显示设备,其特征在于,所述控制器还被配置为:

6...

【专利技术属性】
技术研发人员:胡仁林陈昶旭
申请(专利权)人:VIDAA国际控股荷兰公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1