一种基于图数据库的语句改写方法、系统及计算机存储介质技术方案

技术编号：35788214 阅读：17 留言：0更新日期：2022-12-01 14:36

本发明专利技术公开了一种基于图数据库的语句改写方法、系统及计算机存储介质，该语句改写方法包括：使用自然语言处理分词工具对大量现成的句子进行分词，将分词结果存储于图数据库中，电子设备接收到用户输入或其他设备发送的待处理语句；使用自然语言处理分词工具对待处理语句进行分词，并得出待处理语句中各个词语的词性；将所述待处理语句的分词结果与图数据库所储存的数据进行匹配，对所述待处理语句的词语进行重组，得出重构后的句子。该方法能够实现对句子中词语顺序的重组，尤其适用于针对语句改写时出现指代问题，倒装等特殊句式，且利用数据库的方式可以循环利用数据库数据，一次缓存之后改写效率非常高。次缓存之后改写效率非常高。次缓存之后改写效率非常高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图数据库的语句改写方法、系统及计算机存储介质

[0001]本专利技术涉及自然语言数据处理领域，更具体地，本专利技术涉及一种基于图数据库的语句改写方法、系统及计算机存储介质。

技术介绍

[0002]搭建基于自然语言的智能对话系统来与人类进行交流，是人工智能的一个重要研究目标。对话系统的种类多样，其中，任务型对话系统能够协助人类完成特定领域下的特定任务，因而在电子客服、个人助理、自助终端等业务中有广泛的应用前景，得到了研究界和工业界的重点关注。
[0003]在进行中文语句改写的时候，需要考虑中文独特的句子结构，句子中会出现大量的代词或者省略甚至倒装的格式，目前的句子改写大多是利用算法求特征值矩阵，根据特征值实现指代消解，甚至补充省略词语的作用。但是算法实现的语句改写在实现难度上较大，对专业要求性高，在前期模型构建时需要的数据量大，且不能实现倒装句的改写。

技术实现思路

[0004]本专利技术克服了现有技术的不足，提供一种基于图数据库的语句改写方法，以期望可以解决目前中文语句改写中的问题。
[0005]本专利技术的一种实施方式采用以下技术方案，一种基于图数据库的语句重组方法，包括以下步骤：
[0006]S1：使用自然语言处理(NLP)分词工具对大量现成的句子进行分词，分词后得到句子中各个词语的词性，根据词语词性以及词语在句子中的位置，确定词语在句子中的成分，并确定词语的顺序关系；
[0007]S2：使用图数据库存储词语词性、句子成分与顺序关系；
[0008]S...

【技术保护点】

【技术特征摘要】
1.一种基于图数据库的语句重组方法，其特征在于，包括以下步骤：S1：使用自然语言处理分词工具对大量现成的句子进行分词，分词后得到句子中各个词语的词性，根据词语词性以及词语在句子中的位置，确定词语在句子中的成分，并确定词语的顺序关系；S2：使用图数据库存储词语词性、句子成分与顺序关系；S3：电子设备接收到用户输入或其他设备发送的待处理语句；S4：使用自然语言处理分词工具对待处理语句进行分词，并得出待处理语句中各个词语的词性；S5：将所述待处理语句的分词结果与图数据库所储存的数据进行匹配，对所述待处理语句的词语进行重组，得出重构后的句子。2.如权利要求1所述的一种基于图数据库的语句重组方法，其特征在于，所述自然语言处理分词工具为HanLP工具包。3.如权利要求1所述的一种基于图数据库的语句重组方法，其特征在于，所述S1还包括，对分词后的词语赋予权重，具体为，对特定组合的词语赋予高权重，对没有自定义修改权重的词语赋予默认权重。4.如权利要求1所述的一种基于图数据库的语句重组方法，其特征在于，所述S5具体为，对所述待处理语句的分词结果与图数据库所储存的数据进行匹配，根据图数据库中的相同词性的词语之间的顺序关系，对所述待处理语句的词语进行重组，得出重构后的句子。5.如权利要求1所述的一种基于图数据库的语句重组方法，其特征在于，所述S5具体为，对所述待处理语句的分词结果与图数据库所储存的数据进行匹配，根据图数据库中的相同词性的词语的句子成分，判断待处理语句的词语句子成分；按照语言规则排列词语的先后顺序，对特殊词语按照图数据库中相应的顺序重组语句，对所述待处理语句的词语进行重组，得出重构后的句...

【专利技术属性】
技术研发人员：李俊明，周红，胡凯，梁艳，孙铭，程蕾，
申请(专利权)人：四川长虹电器股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人