基于语义识别的记录生成方法、装置、设备及存储介质制造方法及图纸

技术编号：31496138 阅读：18 留言：0更新日期：2021-12-18 12:37

本发明专利技术涉及人工智能及数字医疗技术，揭露了一种基于语义识别的记录生成方法，包括：将访问语音转化为语音文本；对语音文本进行分词，得到文本分词；获取文本分词在预构建的语音文本库中的词频和频率指数，并根据词频和频率指数提取语音文本的特征词；根据筛选条件对特征词进行筛选得到目标特征词；将目标特征词与预设的类型标签进行匹配，得到目标标签；根据目标标签对目标特征词进行分类，并汇集相同类别的目标特征词，得到多个记录文本。本发明专利技术实施例中，所述访问语音可以医疗访问语音，并可存储于区块链的节点。本发明专利技术还提出一种基于语义识别的记录生成装置、电子设备以及存储介质。本发明专利技术可以解决获取的记录的结构性和条理性差的问题。性差的问题。性差的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于语义识别的记录生成方法、装置、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种基于语义识别的记录生成方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着信息化时代的快速发展，业务人员线上或线下拜访客户展业的时候，都需要做拜访记录并进行整理。包括客户的家庭情况、财产情况等等。以往，这种拜访记录都是业务人员通过笔记本的形式进行访后整理，经常存在对访问内容有遗漏或者记录不准确的情况。近年来，利用自动化信息处理逐渐成为主流，这种处理方式也存在一些弊端，如：整理的信息较为随意零散，结构化和条理性差，不利于后续查看与共享。

技术实现思路

[0003]本专利技术提供一种基于语义识别的记录生成方法、装置及计算机可读存储介质，其主要目的在于解决获取的记录的结构性和条理性差的问题。
[0004]为实现上述目的，本专利技术提供的一种基于语义识别的记录生成方法，包括：
[0005]获取访问语音，将所述访问语音转化为语音文本；
[0006]对所述语音文本进行分词，得

【技术保护点】

【技术特征摘要】
1.一种基于语义识别的记录生成方法，其特征在于，所述方法包括：获取访问语音，将所述访问语音转化为语音文本；对所述语音文本进行分词，得到文本分词；获取所述文本分词在预构建的语音文本库中的词频和频率指数，并根据所述词频和频率指数提取所述语音文本的特征词；获取用户预先设定的筛选条件，根据所述筛选条件筛选所述特征词，得到目标特征词；将所述目标特征词与预设的类型标签进行匹配，得到目标标签；根据所述目标标签对所述目标特征词进行分类，并汇集相同类别的目标特征词，得到多个记录文本。2.如权利要求1所述的基于语义识别的记录生成方法，其特征在于，所述对所述语音文本进行分词，得到文本分词，包括：获取预先构建的词典，其中，所述词典中包含多个标准词条；将所述语音文本按照预设的截取长度进行文本划分，得到检索词；将所述检索词在所述词典中进行检索，当从所述词典中检索到与所述检索词相同的标准词条时，确定所述检索词为所述语音文本的文本分词；返回上述的将所述语音文本按照预设的截取长度进行文本划分的步骤，直至对所述语音文本进行文本划分的次数达到预设次数，其中每次文本划分时采取的截取长度不同，得到所述语音文本对应的所有文本分词。3.如权利要求1所述的基于语义识别的记录生成方法，其特征在于，所述获取所述文本分词在预构建的语音文本库中的词频和频率指数，并根据所述词频和频率指数提取所述语音文本的特征词，包括：从所述文本分词中逐个选取其中一个分词为目标分词；统计所述目标分词在所述文本分词中的词频，并利用预设的关键词算法计算所述目标分词在预设分词库中的频率指数；根据所述词频和频率指数计算所述文本分词的特征值；选取所述特征值大于预设的特征阈值的文本分词为所述特征词。4.如权利要求1所述的基于语义识别的记录生成方法，其特征在于，所述获取用户预先设定的筛选条件，包括：获取所述筛选条件的存储路径；将所述存储路径编译为路径参数，利用所述路径参数对预设的数据接口进行赋值，并利用赋值后的所述数据接口调用所述筛选条件。5.如权利要求1所述的基于语义识别的记录生成方法，其特征在于，所述根据所述筛选条件筛选所述特征词，得到目标特征词，包括：将所述筛选条件作为预设的决策函数的参数，构建决策树模型；从所述特征词中逐个选取其中一个词语为输入特征词，利...

【专利技术属性】
技术研发人员：刘喜声，陈闽，彭粤，刘卓一，王文杰，满园园，梁亚妮，刘湘子，宁夏夏，陈子豪，廖可仪，王旭根，刘映，魏蓁，陈雯雯，周璇，许闻笳，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人