佛学主题词识别方法、装置、设备及存储介质制造方法及图纸

技术编号:29159898 阅读:47 留言:0更新日期:2021-07-06 23:00
本发明专利技术涉及人工智能领域,公开了一种佛学主题词识别方法、装置、设备及存储介质,该方法包括:通过获取待识别的佛经内容,并根据佛经内容得到诵读语音,对佛经内容进行分词识别,得到第一主题词,对诵读语音进行语音识别得到第二主题词,并将第一主题词和第二主题词汇集成主题词备选集,经由主题词识别装置进行主题词识别得到识别结果,根据识别结果判断是否满足佛学主题词组合规则,最后输出满足于佛学主题词组合规则的主题词;本发明专利技术从语音识别维度和模型识别维度上解决了佛学主题词的识别问题,满足了用户所需,并且识别出的主题词更具精准性。此外,本发明专利技术还涉及区块链技术,佛学内容和主题词可存储于区块链中。

【技术实现步骤摘要】
佛学主题词识别方法、装置、设备及存储介质
本专利技术涉及人工智能领域,尤其涉及一种佛学主题词识别方法、装置、设备及存储介质。
技术介绍
佛经是一种特殊的文体,具备古汉语、文言文及梵文转译的特点,佛学领域的信众在阅读过程中存在难以发现主题词等问题,而在现有自然语言处理相关技术中,没有能够识别佛经体裁文本单元(卷/篇)主题词的实现方案。在现有技术中,对于主题词的识别主要是基于各种主题词识别模型,从模型识别的角度上解决主题词识别问题,而没有从其他角度考虑主题词的识别问题,也没有将主题词的识别技术引入到佛学领域,佛学领域的信众在进行佛经阅读时对于主题词的识别问题需待解决。
技术实现思路
本专利技术的主要目的在于通过语音识别技术与主题词识别模型相结合的方式解决佛学主题词的识别问题。本专利技术第一方面提供了一种佛学主题词识别方法,包括:获取待识别的佛经内容,并基于选择的人物语音样本将所述佛经内容转换为诵读语音;根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词;r>对所述诵读语音进本文档来自技高网...

【技术保护点】
1.一种佛学主题词识别方法,其特征在于,所述佛学主题词识别方法包括:/n获取待识别的佛经内容,并基于选择的人物语音样本将所述佛经内容转换为诵读语音;/n根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词;/n对所述诵读语音进行语音识别,得到至少一个第二主题词;/n基于所述第一主题词和所述第二主题词,创建主题词备选集;/n将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果;/n若所述识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。/n

【技术特征摘要】
1.一种佛学主题词识别方法,其特征在于,所述佛学主题词识别方法包括:
获取待识别的佛经内容,并基于选择的人物语音样本将所述佛经内容转换为诵读语音;
根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词;
对所述诵读语音进行语音识别,得到至少一个第二主题词;
基于所述第一主题词和所述第二主题词,创建主题词备选集;
将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果;
若所述识别结果满足佛学主题词组合规则时,将对应的主题词作为最终主题词输出。


2.根据权利要求1所述的佛学主题词识别方法,其特征在于,所述根据预设的佛学知识图谱,对所述佛经内容分词识别,得到至少一个第一主题词包括:
根据预设的佛学知识图谱,对所述佛经内容进行分词识别,得到分词后的文本数据;
利用预设的词频计算工具,对所述分词后的文本数据中的词语进行词频统计计算,得到词频排序;
基于所述词频排序,选择排序靠前的词语进行主题词识别,得到至少一个第一主题词。


3.根据权利要求1所述的佛学主题词识别方法,其特征在于,所述对所述诵读语音进行语音识别,得到至少一个第二主题词包括:
对所述诵读语音进行语音识别,得到与所述诵读语音相对应的语音波形;
根据所述语音波形,确定所述诵读语音中各个字符的语调特征,其中所述各个字符的语调特征通过该字符所包含的音素的频谱特征表征;
基于所述语调特征,确定所述诵读语音中各个字符的语调变化特征量;
基于预设的各字符的语调变化特征量与所述佛经内容的映射关系,根据各个字符的语调变化特征量,从所述佛经内容中查找到至少一个第二主题词。


4.根据权利要求3所述的佛学主题词识别方法,其特征在于,所述基于所述语调特征,确定所述诵读语音中各个字符的语调变化特征量包括:
对所述选择的人物语音样本进行语音识别,得到与所述人物语音样本对应的语音样本波形;
利用预设的语音识别声学模型,对所述语音样本波形进行识别,得到所述人物语音样本中针对于人物预定的音素的频谱特征;
将所确定的针对于所述人物预定的音素的频谱特征作为发音特征;
基于所述发音特征和所述语调特征,确定所述诵读语音中各个字符的语调变化特征量。


5.根据权利要求1-4中任一项所述的佛学主题词识别方法,其特征在于,所述将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,通过所述主题词识别模型对所述主题词备选集进行主题词的识别处理,得到识别结果包括:
将所述主题词备选集和预设的过滤词表输入至预设的主题词识别模型中,利用...

【专利技术属性】
技术研发人员:郝凯风杨艾琳李剑锋
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1