文本识别方法、装置、设备及存储介质制造方法及图纸

技术编号：37151663 阅读：26 留言：0更新日期：2023-04-06 22:08

本发明专利技术公开了一种文本识别方法、装置、设备及存储介质。该文本识别方法包括：获取待识别文本和标准文本；对所述待识别文本进行中文分词，得到第一分词集，并对所述标准文本进行中文分词，得到第二分词集；基于所述第一分词集和所述第二分词集对所述待识别文本和所述标准文本进行文本比对和拼音比对，得到比对结果；根据所述比对结果确定文本识别结果。本发明专利技术能够解决现有的文本识别方法的准确性较差的问题。的问题。的问题。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法、装置、设备及存储介质

[0001]本专利技术涉及计算机
，尤其涉及一种文本识别方法、装置、设备、及存储介质。

技术介绍

[0002]随着AI技术的进步和应用的深入，基于机器学习的视觉、图像、语音、语言分析相关的技术核心效果、产品化成熟度、业务应用模式等方面都已达到了实用化程度。目前，AI技术已经广泛应用于电信运营商、银行、保险、证券、电力、交通等行业，已经成为现场业务合规、远程客户服务等场景下必备的技术支撑，也是国内各大保险公司的关注焦点。
[0003]智能双录质检(Intelligent Dual
‑
Recording System，简称IDRS)针对保险、银行等金融领域的双录(录音、录像)场景合规性要求，利用AI技术实现对销售过程中各类关键动作、语音、证件的检测，以及关键角色的面部追踪，实现对销售过程的智能化监控。其中，智能双录质检提供的App终端检测能力，可以让绝大部分销售合规检测在现场完成，实时发现问题、实时提示、实时纠正，极大地提升了销售的友好度和一次性通过率。
>[0004]在对智本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法，其特征在于，所述文本识别方法包括：获取待识别文本和标准文本；对所述待识别文本进行中文分词，得到第一分词集，并对所述标准文本进行中文分词，得到第二分词集；基于所述第一分词集和所述第二分词集对所述待识别文本和所述标准文本进行文本比对和拼音比对，得到比对结果；根据所述比对结果确定文本识别结果。2.如权利要求1所述的文本识别方法，其特征在于，所述基于所述第一分词集和所述第二分词集对所述待识别文本和所述标准文本进行文本比对和拼音比对，得到比对结果的步骤包括：获取所述第一分词集和所述第二分词集之间的第一交集；获取所述第一分词集与所述第二分词集的第一差集，并获取所述第二分词集与所述第一分词集的第二差集；将所述第一差集中的中文词转换成拼音，得到第一拼音集，并将所述第二差集中的中文词转换成拼音，得到第二拼音集；获取所述第一拼音集和所述第二拼音集之间的第二交集；根据所述第一分词集、所述第一交集和所述第二交集的元素数量，计算得到文本相似度。3.如权利要求2所述的文本识别方法，其特征在于，所述根据所述第一分词集、所述第一交集和所述第二交集的元素数量，计算得到文本相似度的步骤之前，所述文本识别方法还包括：获取所述第一拼音集与所述第二拼音集的第三差集，并获取所述第二拼音集与所述第一拼音集的第四差集；对所述第三差集进行相似音匹配，得到第一相似音集，并对所述第四差集进行相似音匹配，得到第二相似音集；获取所述第一相似音集和所述第二相似音集之间的第三交集；所述根据所述第一分词集、所述第一交集和所述第二交集的元素数量，计算得到文本相似度的步骤包括：根据所述第一分词集、所述第一交集、所述第二交集和所述第三交集的元素数量，计算得到文本相似度。4.如权利要求2或3所述的文本识别方法，其特征在于，所述根据所述比对结果确定文本识别结果的步骤包括：检测所述文本相似度是否大于预设值；若所述文本相似度大于...

【专利技术属性】
技术研发人员：张鹏飞，何晨亮，牟焱文，张磊，井绪海，周健，夏溧，
申请(专利权)人：北京中关村科金技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人