对话角色区分方法、装置、终端设备及存储介质制造方法及图纸

技术编号：19934090 阅读：32 留言：0更新日期：2018-12-29 04:30

本发明专利技术公开了一种对话角色区分方法、装置、终端设备及计算机可读存储介质，其方法包括：根据待区分对话及区分性词语库，获取所述待区分对话的所有区分性词语；其中，所述区分性词语库用于存储预先获取的区分性词语；所述待区分对话包括至少一句对话内容；根据所述待区分对话的所有区分性词语及预先通过支持向量机算法建立的对话角色判别模型，获取所述待区分对话中每一句对话内容对应的角色标签；根据所述待区分对话中每一句对话内容对应的角色标签，确定所述待区分对话中每一句对话内容所对应的角色；本发明专利技术能够提高对话角色识别的效率及准确率。

全部详细技术资料下载

【技术实现步骤摘要】
对话角色区分方法、装置、终端设备及存储介质
本专利技术涉及计算机数据处理领域，尤其涉及一种对话角色区分方法、装置、终端设备及计算机可读存储介质。
技术介绍
通常对话内容会涉及两个以上的对话角色，在一些场合需要针对某个对话角色的对白进行分析，以获取对应的信息，例如客服质检，即客服对客户服务的质量检验，它是一个客服中心进行自我的问题发现并改进客服质量的基础性工作。在进行分析之前，首先需要将对话角色进行区分，例如客服质量与客服态度的评价等都需要预先区分客服与客户的对话内容，以保证后续自然语言处理的正确性。传统的对话角色区分方法主要包括以下两种：第一种：通过识别说话者的声纹特征来区分说话者身份，并在语音转化为文本时根据说话者身份将对话内容的文本进行标签；第二种：收集对话内容数据，通过关键字匹配算法确定对话内容对应的对话角色。在实施本专利技术的过程中，专利技术人发现：在上述的第一种对话角色区分方法中，需要对不同人的声纹特征进行采集，花费的精力和成本比较高，而且其易受不同人的身体状况、年龄、情绪等因素的影响以及环境噪音的干扰，此外，在混合说话人的情形下人的声纹特征不易提取，导...

【技术保护点】
1.一种对话角色区分方法，其特征在于，包括以下步骤：根据待区分对话及区分性词语库，获取所述待区分对话的所有区分性词语；其中，所述区分性词语库用于存储预先获取的区分性词语；所述待区分对话包括至少一句对话内容；根据所述待区分对话的所有区分性词语及预先通过支持向量机算法建立的对话角色判别模型，获取所述待区分对话中每一句对话内容对应的角色标签；根据所述待区分对话中每一句对话内容对应的角色标签，确定所述待区分对话中每一句对话内容所对应的角色。

【技术特征摘要】
1.一种对话角色区分方法，其特征在于，包括以下步骤：根据待区分对话及区分性词语库，获取所述待区分对话的所有区分性词语；其中，所述区分性词语库用于存储预先获取的区分性词语；所述待区分对话包括至少一句对话内容；根据所述待区分对话的所有区分性词语及预先通过支持向量机算法建立的对话角色判别模型，获取所述待区分对话中每一句对话内容对应的角色标签；根据所述待区分对话中每一句对话内容对应的角色标签，确定所述待区分对话中每一句对话内容所对应的角色。2.根据权利要求1所述的对话角色区分方法，其特征在于，所述根据待区分对话及区分性词语库，获取所述待区分对话的所有区分性词语，具体为：响应于接收的角色区别操作，获取待区分对话；对所述待区别对话中的每一句对话内容进行分词，以获取待区分词语；将所述待区分词语与所述区分性词语库中的所有区分性词语进行匹配，获取所述待区分对话的所有区分性词语。3.根据权利要求2所述的对话角色区分方法，其特征在于，所述区分性词语库的建立过程包括以下步骤：对获取的目标领域的对话语料库中的所有对话内容进行分词，以获取所述对话语料库的所有词语；其中，所述对话语料库包括超过第一预设数量的标准对话内容，和对应于每一句标准对话内容的角色标签；基于所述对话语料库的所有词语，计算每一句标准对话内容中的各个词语的词频与逆文档频率；根据所述每一句标准对话内容中的各个词语的词频与逆文档频率，获取所述每一句标准对话内容的原始特征向量；根据每一句标准对话内容对应的角色标签及对应的原始特征向量，计算每一句标准对话内容中的各个词语的信息增益；根据所述每一句标准对话内容中的各个词语的信息增益，获取第二预设数量的词语作为区分性词语，以建立所述区分性词语库；其中，从所述对话语料库的所有词语中获取的所述区分性词语的信息增益大于剩余词语的信息增益。4.根据权利要求3所述的对话角色区分方法，其特征在于，所述对话角色判别模型的训练过程包括以下步骤：根据所述对话语料库中的每一句标准对话内容的原始特征向量及所述区分性词语库，获取所述每一句标准对话内容的区分特征向量；根据所有标准对话内容的区分特征向量及对应于每一句标准对话内容的角色标签，通过支持向量机算法进行对话角色判别模型训练，以获取包括有用于角色区分的分界线或者超平面的对话角色判别模型。5.根据权利要求4所述的对话角色区分方法，其特征在于，所述根据所述待区分对话的所有区分性词语及预先通过支持向量机算法建立的对话角色判别模型，获取所述待区分对话中每一句对话内容对应的角色标签，具体为：基于所述对话语料库的所有词语，计算所述待区分对话的每...

【专利技术属性】
技术研发人员：英高海，赵舒阳，李冬梅，
申请(专利权)人：广州杰赛科技股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人