结合RPA和AI的信息获取方法、装置、计算机设备及介质制造方法及图纸

技术编号：26971299 阅读：26 留言：0更新日期：2021-01-06 00:02

本申请提出一种结合RPA和AI的信息获取方法、装置、计算机设备及介质，该方法包括采用机器人流程自动化RPA方法，获取待识别文本的上下文信息；采用RPA方法，根据上下文信息分析待识别文本对应的目标内容类别；根据目标内容类别和上下文信息，基于人工智能AI识别待识别文本中的信息。通过本申请能够有效避免信息获取的误召回，降低信息获取的人工操作成本，有效提升信息获取效率和获取的准确性，提升信息获取效果。

全部详细技术资料下载

【技术实现步骤摘要】
结合RPA和AI的信息获取方法、装置、计算机设备及介质
本申请涉及计算机
，尤其涉及一种结合RPA(RoboticProcessAutomation，机器人流程自动化)和AI(ArtificialIntelligence，人工智能)的信息获取方法、装置、计算机设备及介质。
技术介绍
机器人流程自动化(RoboticProcessAutomation，简称：RPA)是通过特定的“机器人软件”，模拟人在计算机上的操作，按规则自动执行流程任务。人工智能(ArtificialIntelligence，简称：AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。随着信息获取方法的广泛应用，许多场合下都需要识别或者限定一些共同的内容，如人名、公司名称等，在RPA方法的应用场景中，针对可以枚举的信息(如省市区)通常是提前利用各种渠道、公开数据等收集各种资源，作为词典预设在执行信息获取方法的系统中，而对于不可枚举的内容(如时间、姓名)则是利用领域专家提前总结出大量带有上下文的语义模式进行识别...

【技术保护点】
1.一种结合RPA和AI的信息获取方法，其特征在于，所述方法包括：/n采用机器人流程自动化RPA方法，获取待识别文本的上下文信息；/n采用所述RPA方法，根据所述上下文信息分析所述待识别文本对应的目标内容类别；/n根据所述目标内容类别和所述上下文信息，基于人工智能AI识别所述待识别文本中的信息。/n

【技术特征摘要】
1.一种结合RPA和AI的信息获取方法，其特征在于，所述方法包括：
采用机器人流程自动化RPA方法，获取待识别文本的上下文信息；
采用所述RPA方法，根据所述上下文信息分析所述待识别文本对应的目标内容类别；
根据所述目标内容类别和所述上下文信息，基于人工智能AI识别所述待识别文本中的信息。

2.如权利要求1所述的方法，其特征在于，在所述采用机器人流程自动化RPA方法，获取待识别文本的上下文信息之前，还包括：
接收用户通过文本上传接口上传的待识别文本；和/或，
接收用户通过语音录入接口录入的音频数据，解析所述音频数据中的语义内容，并对所述语义内容进行文本转换，得到所述待识别文本。

3.如权利要求1所述的方法，其特征在于，所述采用所述RPA方法，根据所述上下文信息分析所述待识别文本对应的目标内容类别，包括：
采用所述RPA方法，将所述上下文信息输入预先训练的内容识别模型之中；
将所述内容识别模型输出的样本内容类别作为所述目标内容类别，其中，所述内容识别模型已学习得到多种样本上下文信息，以及与每种所述样本上下文信息匹配的样本内容类别之间的对应关系。

4.如权利要求1所述的方法，其特征在于，所述根据所述目标内容类别和所述上下文信息，基于人工智能AI识别所述待识别文本中的信息，包括：
确定与所述目标内容类别匹配的专名识别模型，所述专名识别模型是所述人工智能AI中的模型；
采用所述RPA方法，根据所述目标内容类别和所述上下文信息，结合所述匹配的专名识别模型识别所述待识别文本中的信息。

5.如权利要求3所述的方法，其特征在于，在所述采用机器人流程自动化RPA方法，获取待识别文本的上下文信息之前，还包括：
获取海量的样本上下文信息；
采用所述RPA方法，针对各种所述样本上下文信息标注对应的样本内容类别；
采用所述RPA方法，根据所述样本上下文信息训练初始的内容识别模型，直至所述内容识别模型输出的中间内容类别与所标注的样本内容类别的损失值小于设定阈值时，所述内容识别模型训练完成。

6.如权利要求4所述的方法，其特征在于，所述采用所述RPA方法，根据所述目标内容类别和所述上下文信息，结合所述匹配的专名识别模型识别所述待识别文本中的信息，包括：
采用所述RPA方法，将所述目标内容类别和所述上下文信息输入所述专名识别模型之中；
获取所述专名识别模型输出的样本专名并作为目标专名，并将所述目标内容类别、所述上下文信息，以及所述目标专名共同作为识别到的所述信息；其中，所述专名识别模型已学习得到样本目标内容类别、样本上下文信息，以及与所述样本目标内容类别和所述样本上下文信息匹配的样本专名之间的对应关系。

7.如权利要求4或6所述的方法，其特征在于，其中，
所述专名识别模型为基于转换器的双向编码表征模型。

8.一种结合RPA和AI的信息获取装置，其特征在于，所述装置包括：
获取模...

【专利技术属性】
技术研发人员：胡一川，汪冠春，褚瑞，李玮，白龙飞，
申请(专利权)人：北京来也网络科技有限公司，北京奔影网络科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人