语义解析信息的领域识别方法及装置、设备及可读介质制造方法及图纸

技术编号:16270086 阅读:37 留言:0更新日期:2017-09-22 21:45
本发明专利技术提供一种语义解析信息的领域识别方法及装置、设备及可读介质。其所述方法包括:获取预设领域中、解析用户输入的语音数据生成语义解析信息所采用的至少一个预设关键词提取模板;各预设关键词提取模板中包括至少一个关键词;根据各关键词提取模板中各关键词在预设领域的重要程度标识,获取各关键词的主题权重;根据各关键词的主题权重计算语音解析信息的主题分值;根据语音解析信息的主题分值识别语音解析信息是否属于预设领域。通过采用本发明专利技术的技术方案,可以对语音解析信息所属的领域进行识别,从而可以保证识别的语言解析信息的领域的正确性,进而保证App根据该语义解析信息执行的操作的正确性。

【技术实现步骤摘要】
语义解析信息的领域识别方法及装置、设备及可读介质
本专利技术涉及计算机应用
,尤其涉及一种语义解析信息的领域识别方法及装置、设备及可读介质。
技术介绍
为了更加方便用户使用应用(Application;App),现有技术中,很多应用均支持语音输入,这样,用户在使用时仅需要向该App输入语音数据即可,操作简单,使用方便。具体地,现有技术中,用户在向App输入语音数据之后,App需要对用户输入的语音数据进行语音识别,然后使用预设的每个预设领域的一个或者多个模板(pattern)对语音识别的结果进行语义解析,获取各预设领域中该语音数据对应的语义解析信息。也就是说,该语义解析信息为语音数据具有相同的语义,这样,该App直接根据该语义解析信息,分析用户的需求,从而执行相应的操作,例如,用户可以使用语音数据请求App吊起某个应用,或者发送某条文字信息,或者查询某条信息,或者查询并订购酒店或者机票等等。但是,现有技术中,解析语义解析信息的时候可能使用了某预设领域的至少一个片段模板,而片段模板包含的信息量较少,不能准确标识对应的领域,导致该语义解析信息是否属于该预设领域的可靠性较低,而本文档来自技高网...
语义解析信息的领域识别方法及装置、设备及可读介质

【技术保护点】
一种语义解析信息的领域识别方法,其特征在于,所述方法包括:获取预设领域中、解析用户输入的语音数据生成语义解析信息所采用的至少一个预设关键词提取模板;各所述预设关键词提取模板中包括至少一个关键词;根据各所述预设关键词提取模板中各所述关键词在所述预设领域的重要程度标识,获取各所述关键词的主题权重;根据各所述关键词的主题权重计算所述语音解析信息的主题分值;根据所述语音解析信息的主题分值识别所述语音解析信息是否属于所述预设领域。

【技术特征摘要】
1.一种语义解析信息的领域识别方法,其特征在于,所述方法包括:获取预设领域中、解析用户输入的语音数据生成语义解析信息所采用的至少一个预设关键词提取模板;各所述预设关键词提取模板中包括至少一个关键词;根据各所述预设关键词提取模板中各所述关键词在所述预设领域的重要程度标识,获取各所述关键词的主题权重;根据各所述关键词的主题权重计算所述语音解析信息的主题分值;根据所述语音解析信息的主题分值识别所述语音解析信息是否属于所述预设领域。2.根据权利要求1所述的方法,其特征在于,获取预设领域中、解析用户输入的语音数据生成语义解析信息所采用的至少一个预设关键词提取模板之前,所述方法还包括:在各所述预设领域中,设置多个所述预设关键词提取模块,各所述预设关键词提取模板中包括至少两个所述关键词;在各所述预设领域的各所述预设关键词提取模板中,标识对应的所述预设关键词提取模板中包括的各所述关键词在对应的所述预设领域中的重要程度标识。3.根据权利要求2所述的方法,其特征在于,在各所述预设领域的各所述预设关键词提取模板中,标识对应的所述预设关键词提取模板中包括各所述关键词在对应的所述预设领域中的重要程度标识之前,所述方法还包括:获取各所述预设关键词提取模板中包括的各所述关键词在对应的所述预设领域中的重要程度标识。4.根据权利要求3所述的方法,其特征在于,获取各所述预设关键词提取模板中包括的各所述关键词在对应的所述预设领域中的重要程度标识,具体包括:采集各所述预设领域的数条语料,生成对应的所述预设领域的语料库;对所述语料库中的各所述语料进行分词,提取各所述语料中的有效分词作为所述语料包括的所述关键词;统计各所述关键词在所述语料库中的所述数条语料分词后得到的所有所述关键词中出现的频率,作为对应的所述关键词在所述语料库中的词频;根据各所述关键词在所述语料库中的词频占所述数条语料分词后得到的所有所述关键词出现的频率的概率,为对应的所述关键词设置在所述预设领域的重要程度标识。5.根据权利要求1-4任一所述的方法,其特征在于,根据各所述关键词提取模板中各所述关键词在所述预设领域的重要程度标识,获取各所述关键词的主题权重,具体包括:若所述预设关键词提取模板中的所述关键词在所述预设领域的重要程度标识为high,根据所述重要程度标识与主题权重的对应关系,获取所述high对应的主题权重为0;若所述预设关键词提取模板中的所述关键词在所述预设领域的重要程度标识为middle,根据所述重要程度标识与主题权重的对应关系,获取所述middle对应的主题权重为第一质数;或者若所述预设关键词提取模板中的所述关键词在所述预设领域的重要程度标识为low,根据所述重要程度标识与主题权重的对应关系,获取所述low对应的主题权重为第二质数;所述第二质数不等于第一质数;所述high标识的所述关键词在所述预设领域的重要程度,高于所述middle标识的所述关键词在所述预设领域的重要程度;所述middle标识的所述关键词在所述预设领域的重要程度,高于所述low标识的所述关键词在所述预设领域的重要程度。6.根据权利要求5所述的方法,其特征在于,根据各所述关键词的主题权重计算所述语音解析信息的主题分值,具体包括:将各所述关键词的主题权重相乘,得到所述语音解析信息的主题分值。7.根据权利要求6所述的方法,其特征在于,根据所述语音解析信息的主题分值识别所述语音解析信息是否属于所述预设领域,具体包括:若所述语音解析信息的主题分值为0,确定所述语音解析信息属于所述预设领域;或者若所述语音解析信息的主题分值对第一参数或者第二参数求余等于0,确定所述语音解析信息中包括所述重要程度标识为所述middle的所述关键词,且包括的所述关键词的数量大于1,确定所述语音解析信息属于所述预设领域;其中所述第一参数等于所述第一质数的平方,所述第二参数等于所述第一质数和所述第二质数的乘积;或者若所述语音解析信息的主题分值既不等于0,又对第一参数或者第二参数求余不等于0,则确定所述语音解析信息不属于所述预设领域。8...

【专利技术属性】
技术研发人员:瞿琴胡泽进
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1