System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,特别涉及一种基于人工智能的标准文本生成方法及系统。
技术介绍
1、标准文本指的是经正式批准并被广泛认可的文本。
2、在文本录入过程中,一般是依赖于人工对稿件校对来调整存在的问题,但是,如果涉及到专业领域的稿件,是需要依赖专业人员实现的,来保证该稿件先后内容排版的正确性,但是,在依赖人的过程中如果专业人员对专业术语、专业逻辑不知晓,那么在内容排版过程中会存在顺序先后错乱的情况,无疑会增加文本生成的时间。
3、因此,本专利技术提出一种基于人工智能的标准文本生成方法及系统。
技术实现思路
1、本专利技术提供一种基于人工智能的标准文本生成方法及系统,用以通过对待处理文本进行词汇语义的关联分析来获取语句以及独立分词,进而以分段语句为基础进行初步整合得到的文本,且结合独立分词的出现组合情况对初步整合的文本进行调整优化,来保证最后文本生成的可靠性,且有效提高生成效率以及有效避免文本逻辑先后排版的错乱。
2、本专利技术提供一种基于人工智能的标准文本生成方法,包括:
3、步骤1:对待处理文本进行词汇关联处理以及语义关联处理,得到所述待处理文本的多个分段语句以及多个独立分词;
4、步骤2:对所有分段语句进行整合得到第一标准文本,同时,确定每个独立分词基于每个分段语句的出现概率以及关联概率,确定对应独立分词涉及到的可能出现语句;
5、步骤3:对每个独立分词涉及到的可能出现语句的第一数量进行第一统计,同时,对每
6、步骤4:根据第一统计结果以及第二统计结果,确定所有可能出现语句的出现组合,并依次对每个出现组合进行融合分析,筛选得到最佳组合;
7、步骤5:依据所述最佳组合对第一标准文本进行调整,得到第二标准文本。
8、优选的,得到所述待处理文本的多个分段语句以及多个独立分词,包括:
9、对所述待处理文本中的每个待处理语句按照词汇关联数据库以及语义关联数据库进行关联确定;
10、基于关联确定结果,筛选关联确定结果中关联值最大且大于预设值的待处理语句作为最关联语句;
11、将存在最关联语句的待处理语句作为分段语句,将待处理文本中除分段语句外的待处理语句作为剩余语句;
12、将每个剩余语句分别与语义数据包进行匹配,确定每个剩余语句中每个语句词汇的出现位置以及出现位置的语义字段,并确定对应语义词汇的词定义系数;
13、从同个剩余语句下的所有语义字段中提取语句首字段以及语句末字段,并基于对应剩余语句的字段顺序输出,来截取基于语句首字段以及语句末字段所对应位置之间的位置段,得到对应剩余语句的句定义系数;
14、根据所述句定义系数以及词定义系数,筛选对应剩余语句中的独立分词。
15、优选的,对所有分段语句进行整合得到第一标准文本,包括:
16、获取每个分段语句的语句序列,并进行聚类处理得到若干序列簇,进而结合每个序列簇下的序列集合以及逻辑表向对应序列簇赋予逻辑表示;
17、根据同个分段语句所有子逻辑表示构建子逻辑树;
18、对所述最关联语句的出现频次进行统计,当所述最关联语句只出现一次时,将所述最关联语句与对应待处理语句进行第一绑定;
19、当所述最关联语句出现两次时,基于所述最关联语句对相应的第一语句以及第二语句进行过渡分析,并对第一语句、第二语句、最关联语句进行第二绑定;
20、当所述最关联语句出现三次及以上时,分别提取与所述最关联语句对应的每个匹配语句的第二关联语句,并分别基于所有第二关联语句建立所述最关联语句对应的所有匹配语句的关联关系,且结合最关联语句与每个匹配语句的启承关系,对最关联语句、每个匹配语句进行第三绑定;
21、基于子逻辑树,且根据每个分段语句之间的语义依赖关系以及所有绑定结果,建立最终逻辑树;
22、按照所述最终逻辑树的逻辑先后顺序对所有分段语句进行先后放置,得到第一标准文本。
23、优选的,确定对应独立分词涉及到的可能出现语句,包括:
24、统计每个独立分词基于每个分段语句的出现频次以及对应分段语句的分词总频次,得到对应的出现概率;
25、同时,确定每个独立分词与对应分段语句中每个其余分词的语义关系,且结合对应分段语句中每个其余分词的分词权重,确定关联概率;
26、根据所述出现概率以及关联概率,确定对应独立分词基于相应分段语句的依赖系数,并筛选满足依赖标准的分段语句作为第一可能语句;
27、同时,基于同个独立分词在每个剩余语句中的词定义系数并筛选最大系数;
28、若最大系数大于预设系数,则将对应剩余语句作为第二可能语句;
29、否则,不将对应剩余语句作为第二可能语句;
30、将所有第一可能语句以及第二可能语句作为可能出现语句。
31、优选的,确定每个独立分词在不同可能出现语句的出现组合,包括:
32、根据第一统计结果建立第一数量集s1={sdi,i=1,2,3,...,n1},其中,n1表示独立分词的分词量;sdi表示独立分词i涉及到的可能出现语句的第一数量;
33、根据第二统计结果建立第二数量集s2={skj,j=1,2,3,...,n2},其中,n2表示分段语句的数量;skj表示分段语句j中所出现的独立分词的第二数量;pji表示分段语句j中独立分词i的出现次数;
34、从第一数据集s1中筛选第一数量大于第一阈值的第一分词,同时,从第二数据集s2中筛选第二数量大于第二阈值的第三语句,并将第三语句中的独立分词作为第二分词;
35、对所述第一分词以及第二分词进行筛选得到重叠分词,并从所有可能出现语句中筛选重叠分词出现的第四语句;
36、对所有第四语句按照重叠分词的总出现数量进行先后排序,得到出现组合;
37、当总出现数量都不一样时,将得到的出现组合作为最佳组合;
38、当总出现数量存在一样时,对所有第二语句进行总数显数量大小的排列组合,得到若干个出现组合,并对每个出现组合进行融合分析确定融合系数;
39、从所有融合系数中筛选最大系数对应的出现组合作为最佳组合。
40、优选的,对每个出现组合进行融合分析确定融合系数,包括:
41、获取每个出现组合中总出现数量一致的第一个语句与最紧邻的总出现数量不一致语句的第一语义相似值,同时,获取每个出现组合中总出现数量一致的最后一个语句与最紧邻的总出现数量不一致语句的第二语义相似值;
42、获取每个出现组合中总出现数量一致的相邻语句之间的第三语义相似值;
43、根据所有第一语义相似值、第二语义相似值以及第三语义相似值,确定融合系数。
44、优选的,确定融合系数,包括:
45、
46本文档来自技高网...
【技术保护点】
1.一种基于人工智能的标准文本生成方法,其特征在于,包括:
2.根据权利要求1所述的基于人工智能的标准文本生成方法,其特征在于,得到所述待处理文本的多个分段语句以及多个独立分词,包括:
3.根据权利要求2所述的基于人工智能的标准文本生成方法,其特征在于,对所有分段语句进行整合得到第一标准文本,包括:
4.根据权利要求2所述的基于人工智能的标准文本生成方法,其特征在于,确定对应独立分词涉及到的可能出现语句,包括:
5.根据权利要求1所述的基于人工智能的标准文本生成方法,其特征在于,确定每个独立分词在不同可能出现语句的出现组合,包括:
6.根据权利要求5所述的基于人工智能的标准文本生成方法,其特征在于,对每个出现组合进行融合分析确定融合系数,包括:
7.根据权利要求6所述的基于人工智能的标准文本生成方法,其特征在于,确定融合系数,包括:
8.根据权利要求1所述的基于人工智能的标准文本生成方法,其特征在于,依据所述最佳组合对第一标准文本进行调整,得到第二标准文本,包括:
9.一种基于人工智能
...【技术特征摘要】
1.一种基于人工智能的标准文本生成方法,其特征在于,包括:
2.根据权利要求1所述的基于人工智能的标准文本生成方法,其特征在于,得到所述待处理文本的多个分段语句以及多个独立分词,包括:
3.根据权利要求2所述的基于人工智能的标准文本生成方法,其特征在于,对所有分段语句进行整合得到第一标准文本,包括:
4.根据权利要求2所述的基于人工智能的标准文本生成方法,其特征在于,确定对应独立分词涉及到的可能出现语句,包括:
5.根据权利要求1所述的基于人工智能的标准文本生成方...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。