基于RPA+NLP的多模态文字转换方法、系统及介质技术方案

技术编号：40358149 阅读：6 留言：0更新日期：2024-02-09 14:44

本发明专利技术公开了基于RPA+NLP的多模态文字转换方法、系统及介质，涉及文字转换技术领域，包括使用网络爬虫获取多个金融网站N；使用RPA机器人对样本金融网站1至样本金融网站N中的数据进行抓取；基于文字转换的结果得到样本金融网站的抽取模式；基于优化后得到的多个完善模式对多个样本金融网站进行文字转换；本发明专利技术用于解决现有技术中缺少在提取网站的数据中对文字转换方面的改进，这会导致当使用现有的文字转换方法提取网站中的数据时，会因提取时的数据较多导致对网站中的音频数据或图片数据造成遗漏或缺失等问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及文字转换，具体为基于rpa+nlp的多模态文字转换方法、系统及介质。

技术介绍

1、文字转换是指将一种语言或文字形式转换为另一种语言或文字形式的过程，也可以指将非文本形式的信息转换为文本形式的过程；文字转换通常是通过计算机软件或工具来实现的，可以应用于翻译、文本处理、语音识别等多个领域，它可以帮助人们更方便地理解和使用不同语言或格式的信息。

2、现有的用于文字转换的改进，通常是将音频数据接入文字转换设备进行转换，比如在申请公开号为cn101452705a的中国专利中，提出了语音文字转换、手语文字转换的方法和装置，该方案就是通过检测输入的音频数据，然后将该音频数据转换成相应的文字信息，最后使用编码器将该文字信息编码进入视频数据中，其他的用于文字转换方面的改进，通常是提高文字转换在语种多样性方面的改进，现有的改进方法中缺少在提取网站的数据中对文字转换方面的改进，这会导致当使用现有的文字转换方法提取网站中的音频数据、图片数据以及文字数据时，会因提取时的数据较多导致对网站中的音频数据或图片数据造成遗漏或缺失等问题，从而在文字转换的过程中无法对网站中的音频数据或图片数据进行完全转换，鉴于此，有必要对现有的文字转换方法进行改进。

技术实现思路

1、本专利技术旨在至少在一定程度上解决现有技术中的技术问题之一，通过提出基于rpa+nlp的多模态文字转换方法、系统及介质，用于解决现有技术中缺少在提取网站的数据中对文字转换方面的改进，这会导致当使用现有的文字转换方法提取网站中

2、为实现上述目的，第一方面，本专利技术提供一种基于rpa+nlp的多模态文字转换方法，包括：

3、使用网络爬虫获取多个金融网站，记为样本金融网站1至样本金融网站n；

4、使用rpa机器人对样本金融网站1至样本金融网站n中的数据进行抓取；

5、使用文本转换法对每个样本金融网站对应的多个文本样本以及多个音图样本进行文字转换，基于文字转换的结果得到样本金融网站的抽取模式；

6、基于每个样本金融网站的抽取模式对多个人工样本网站中的数据进行文字转换，基于文字转换的结果对文本转换法进行优化，基于优化后得到的多个完善模式对多个样本金融网站进行文字转换。

7、进一步地，使用rpa机器人对样本金融网站1至样本金融网站n中的数据进行抓取包括：

8、使用rpa机器人对样本金融网站1至样本金融网站n中的文本数据进行抓取，记为文本样本1至文本样本n；

9、使用rpa机器人对样本金融网站1至样本金融网站n中的视频数据以及图片数据进行抓取并记为样本金融网站的音图样本。

10、进一步地，使用文本转换法对每个样本金融网站对应的多个文本样本以及多个音图样本进行文字转换，基于文字转换的结果得到样本金融网站的抽取模式包括：

11、对于样本金融网站1至样本金融网站n中的任意一个样本金融网站x，每隔标准更新时间获取样本金融网站x的文本样本以及音图样本，得到样本金融网站x的多个文本样本以及多个音图样本；

12、使用文本转换法对每个样本金融网站的多个文本样本以及多个音图样本进行分析；

13、基于文本转换法的结果得到所有样本金融网站的抽取模式，依次记为抽取模式1至抽取模式n。

14、进一步地，文本转换法包括：

15、获取标准缩放级别下样本金融网站的高度以及宽度，记为标准高度以及标准宽度；

16、将音图样本中视频数据在样本金融网站中所占的区域分别记为视频区域1至视频区域j；

17、将音图样本中图片数据在样本金融网站中所占的区域分别记为图片区域1至图片区域k；

18、将与样本金融网站的宽平行的直线记为探测宽线；

19、将与样本金融网站的高平行的直线记为探测高线；

20、使用探测宽线从样本金融网站的顶端向下滑动，当探测宽线覆盖的区域与任意一个视频区域j1或任意一个图片区域k1重合时，获取此时探测宽线与样本金融网站的顶端的距离，记为视频区域j1的上距或图片区域k1的上距并使探测宽线继续向下移动，当探测宽线覆盖的区域恰好不与视频区域j1或图片区域k1重合时，获取此时探测宽线与样本金融网站的顶端的距离，记为视频区域j1的下距或图片区域k1的下距；

21、获取所有图片区域以及视频区域的上距和所有图片区域以及视频区域的下距。

22、进一步地，文本转换法还包括：

23、对于任意一个样本金融网站x，对于样本金融网站x的任意一个图片区域kx，获取图片区域kx在样本金融网站x的多个音图样本中的上距的平均值，记为图片区域kx的平均上距，获取图片区域kx在样本金融网站x的多个音图样本中的下距的平均值，记为图片区域jx的平均下距，依此类推获取样本金融网站x的所有图片区域以及所有视频区域的平均上距以及平均下距。

24、进一步地，文本转换法还包括：

25、对于任意一个样本金融网站x，获取样本金融网站x的文本样本并保留文本样本在样本金融网站x中的位置；

26、对于样本金融网站x中的任意一个图片样本k2，将图片样本k2的平均上距记为q1，将图片样本的平均下距记为q2；

27、获取从样本金融网站x的顶端向下q1高度的区域所包含的文本字数，记为图片样本k2的开始转换字数，获取从样本金融网站x的顶端向下q2高度的区域所包含的文本字数，记为图片样本k2的结束转换字数；

28、对于样本金融网站x中的任意一个视频样本j2，将视频样本j2的平均上距记为p1，将图片样本的平均下距记为p2；

29、获取从样本金融网站x的顶端向下p1高度的区域所包含的文本字数，记为视频样本j2的开始转换字数，获取从样本金融网站x的顶端向下p2高度的区域所包含的文本字数，记为视频样本j2的结束转换字数。

30、进一步地，文本转换法还包括：

31、对于任意一个样本金融网站x，样本金融网站x的抽取模式为：

32、当使用rpa机器人基于nlp技术在样本金融网站x中由上向下进行文字提取时，当文字提取的数量等于任意一个图片样本的开始转换字数时，获取此时文字下方最近的图片样本并对该图片中的文字进行文字提取，当文字提取的数量等于任意一个图片样本的结束转换字数时，将此时文字上方的图片样本记为已提取图片；

33、当使用rpa机器人基于nlp技术在样本金融网站x中由上向下进行文字提取时，当文字提取的数量等于任意一个视频样本的开始转换字数时，获取此时文字下方最近的视频样本并对该视频样本中的文字进行文字提取，当文字提取的数量等于任意一个视频样本的结束转换字数时，将此时文字上方的视频样本记为已提取视频。

34、进一步地，基于每个样本金融网站的抽取模式对多个人工样本网站中的数据进行文字转换，基于本文档来自技高网...

【技术保护点】

1.一种基于RPA+NLP的多模态文字转换方法，其特征在于，包括：

2.根据权利要求1所述的一种基于RPA+NLP的多模态文字转换方法，其特征在于，使用RPA机器人对样本金融网站1至样本金融网站N中的数据进行抓取包括：

3.根据权利要求2所述的一种基于RPA+NLP的多模态文字转换方法，其特征在于，使用文本转换法对每个样本金融网站对应的多个文本样本以及多个音图样本进行文字转换，基于文字转换的结果得到样本金融网站的抽取模式包括：

4.根据权利要求3所述的一种基于RPA+NLP的多模态文字转换方法，其特征在于，文本转换法包括：

5.根据权利要求4所述的一种基于RPA+NLP的多模态文字转换方法，其特征在于，文本转换法还包括：

6.根据权利要求5所述的一种基于RPA+NLP的多模态文字转换方法，其特征在于，文本转换法还包括：

7.根据权利要求6所述的一种基于RPA+NLP的多模态文字转换方法，其特征在于，文本转换法还包括：

8.根据权利要求7所述的一种基于RPA+NLP的多模态文字转换方法，其特征在于，

9.适用于权利要求1-8任意一项所述的一种基于RPA+NLP的多模态文字转换方法的系统，其特征在于，包括网站获取模块、数据抓取模块、模式生成模块以及模式优化模块：

10.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，运行如权利要求1-8任一项所述方法中的步骤。

...

【技术特征摘要】

1.一种基于rpa+nlp的多模态文字转换方法，其特征在于，包括：

2.根据权利要求1所述的一种基于rpa+nlp的多模态文字转换方法，其特征在于，使用rpa机器人对样本金融网站1至样本金融网站n中的数据进行抓取包括：

3.根据权利要求2所述的一种基于rpa+nlp的多模态文字转换方法，其特征在于，使用文本转换法对每个样本金融网站对应的多个文本样本以及多个音图样本进行文字转换，基于文字转换的结果得到样本金融网站的抽取模式包括：

4.根据权利要求3所述的一种基于rpa+nlp的多模态文字转换方法，其特征在于，文本转换法包括：

5.根据权利要求4所述的一种基于rpa+nlp的多模态文字转换方法，其特征在于，文本转换法还包括：

6.根据权利要求5所述的一种基于rpa+nlp的多模态...

【专利技术属性】
技术研发人员：古福冀，王兵，吴晓雯，
申请(专利权)人：深圳大数信科技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人