一种基于拼音转换的智能语义匹配方法组成比例

技术编号：21605899 阅读：33 留言：0更新日期：2019-07-13 18:21

本发明专利技术涉及一种基于拼音转换的智能语义匹配方法，所述方法包括：语义处理系统获取第一目标文本数据；对第一目标文本数据进行语义匹配，得到第一语义匹配结果数据；当第一语义匹配结果数据为空时，获取第一目标文本数据中的泛化对象信息和场景数据；对第一目标文本数据中的泛化对象信息进行拼音转换，得到泛化对象信息的拼音信息；根据泛化对象信息的拼音信息在与场景数据相对应的词语信息库中匹配相应的替换对象信息；根据替换对象信息更新第一目标文本数据，得到第二目标文本数据；对第二目标文本数据进行语义匹配，得到第二语义匹配结果数据，并输出。

An Intelligent Semantic Matching Method Based on Pinyin Conversion

全部详细技术资料下载

【技术实现步骤摘要】
一种基于拼音转换的智能语义匹配方法
本专利技术涉及数据处理
，尤其涉及一种基于拼音转换的智能语义匹配方法。
技术介绍
自然语言处理(NaturalLanguageProcessing，NLP)是人工智能中最为困难的问题之一，而对自然语言处理的研究也是充满挑战的。在一些情况中，用户通过输入法输入的文本可能会存在个别字词错误。例如，用户本应输入的正确的语句为“我想打电话给王晓明”，但用户输入的文本是“我想打电话给王小明”，而由于用户的电话簿中只有“王晓明”而没有“王小明”，因此语义匹配系统无法根据当前得到的“王小明”的文本匹配到电话簿中的“王晓明”，也就无法输出语义匹配结果。在另一些情况中，用户说出的语音可能是带有口音的，这也使得对于用户输入的语音数据进行语音识别后所得到的文本，可能与基于标准普通话应得到的文本不同，从而影响语义匹配结果。例如，用户本应输入的正确语音为“打电话给姚明”，由于方言影响，用户输出的带口音的语音为“打电话给要命”，此时语义处理系统根据当前语音数据无法匹配到相应的结果。因此，如何根据一个存在错误的文本进行合理的语义匹配，从而得到与用户本意相对应的答案，成为了本领域的难点之一。
技术实现思路
本专利技术的目的是针对现有技术的缺陷，提供一种基于拼音转换的智能语义匹配方法，可以实现在语义匹配的过程中，对语句中的错误的词进行拼音转换后修改为正确的词语，从而实现对语句中的同音异义词纠错，使得在原文本存在错误的情况下，仍可以在纠错后进行语义匹配。为实现上述目的，本专利技术提供了一种基于拼音转换的智能语义匹配方法，所述方法包括：语义处理系统获取第一...

【技术保护点】
1.一种基于拼音转换的智能语义匹配方法，其特征在于，所述方法包括：语义处理系统获取第一目标文本数据；对所述第一目标文本数据进行语义匹配，得到第一语义匹配结果数据；当所述第一语义匹配结果数据为空时，获取所述第一目标文本数据中的泛化对象信息和场景数据；对所述第一目标文本数据中的泛化对象信息进行拼音转换，得到所述泛化对象信息的拼音信息；根据所述泛化对象信息的拼音信息在与所述场景数据相对应的词语信息库中匹配相应的替换对象信息；根据所述替换对象信息更新所述第一目标文本数据，得到第二目标文本数据；对所述第二目标文本数据进行语义匹配，得到第二语义匹配结果数据，并输出。

【技术特征摘要】
1.一种基于拼音转换的智能语义匹配方法，其特征在于，所述方法包括：语义处理系统获取第一目标文本数据；对所述第一目标文本数据进行语义匹配，得到第一语义匹配结果数据；当所述第一语义匹配结果数据为空时，获取所述第一目标文本数据中的泛化对象信息和场景数据；对所述第一目标文本数据中的泛化对象信息进行拼音转换，得到所述泛化对象信息的拼音信息；根据所述泛化对象信息的拼音信息在与所述场景数据相对应的词语信息库中匹配相应的替换对象信息；根据所述替换对象信息更新所述第一目标文本数据，得到第二目标文本数据；对所述第二目标文本数据进行语义匹配，得到第二语义匹配结果数据，并输出。2.根据权利要求1所述的语义匹配方法，其特征在于，在所述语义处理系统获取第一目标文本数据之前，所述方法还包括：所述语义处理系统接收语句数据，对所述语句数据进行语音识别，得到第一目标文本数据。3.根据权利要求2所述的语义匹配方法，其特征在于，所述语句数据包括语句语音数据和语句文字数据；所述语义处理系统接收语句数据，对所述语句数据进行语音识别，得到第一目标文本数据具体为：所述语义处理系统的语音转换器接收所述语句数据，对所述语句数据中的语句语音数据进行识别，得到所述语句语音数据的语句文字数据，并将所述语句语音数据的语句文字数据插入所述语义处理系统的输入队列的末尾；所述语义处理系统的轮询器监听所述输入队列的数据插入，从所述输入队列中获取所述输入队列末尾的语句文字数据，得到所述第一目标文本数据。4.根据权利要求1所述的语义匹配方法，其特征在于，所述对所述第一目标文本数据中的泛化对象信息进行拼音转换具体为：将所述第一目标文本数据中的泛化对象信息拆分为一...

【专利技术属性】
技术研发人员：张海风，邵飞虎，孙晓光，
申请(专利权)人：北京博瑞彤芸文化传播股份有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人