System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于识别和预测电子通信中的健康和安全风险的机器学习模型制造技术_技高网

用于识别和预测电子通信中的健康和安全风险的机器学习模型制造技术

技术编号:41111168 阅读:5 留言:0更新日期:2024-04-25 14:03
描述了与监视和检测与目标领域相关的电子信函中的健康和安全风险的机器学习系统相关联的系统、方法和其他实施例。在一个实施例中,一种方法包括监视网络上的电子邮件通信以识别与目标领域相关联的电子邮件。发起机器学习分类器,该机器学习分类器被配置为利用风险将来自电子邮件的文本分类为包括涉及安全风险或非风险的词汇。分类器生成电子邮件包括涉及安全风险的文本的概率风险值,并且至少部分地基于概率风险值将电子邮件标记为安全风险或非风险。响应于电子邮件被标记为涉及安全风险,生成并向远程设备传输电子通知以提供警报。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、在大多数大规模项目(诸如建设和工程项目)中,导致健康和安全风险的事故是常常发生的。这些安全事故使所有者、承包商、分包商、建筑师和顾问付出数百万美元的代价,从而影响整体项目。潜在问题的早期检测可以使得能够进行可以导致避免工地中的事故和安全漏洞的主动干预。

2、例如,数字平台被用于在项目过程中管理和传送日常电子信函(correspondence)。这些电子信函包含如果被正确破译则可以指示可能导致更大健康和安全事故的潜在问题的早期迹象的信息。这些早期迹象可以被用于识别与每个项目相关联的风险并且可以起到提供早期预警的作用。

3、然而,不存在作为用于识别项目的风险的此类早期迹象的计算机智能系统的现有系统。此外,不存在可以基于电子信函来预报或预测项目的潜在风险的现有系统。


技术实现思路

1、在一个实施例中,描述了一种计算机实现的方法,该方法包括监视网络上的电子邮件通信以识别电子邮件。响应于接收网络上的电子邮件,检测电子邮件并将电子邮件识别为与建设项目相关联。该方法将来自电子邮件的文本分词(tokenize)为多个词语;将多个词语中的每个词语向量化为将每个词语映射到数值的数值向量。发起机器学习分类器,该机器学习分类器被配置为识别建设术语(terminology)并利用风险将文本分类为涉及(refer to)或讨论安全风险或者没有涉及安全风险,因此是非风险(non-risk);以及将从电子邮件生成的数值向量输入到机器学习分类器中。机器学习分类器通过至少将数值向量与定义的安全风险词汇(vocabulary)的集合和定义的非风险词汇的集合对应来处理来自电子邮件的数值向量,并且通过机器学习分类器生成电子邮件包括涉及或讨论安全风险的词汇的概率风险值。至少部分地基于电子邮件涉及安全风险的概率风险值将电子邮件标记(label)为安全风险或非风险;以及响应于电子邮件被标记为涉及安全风险,生成并向远程设备传输电子通知以提供警报。

2、在另一个实施例中,该方法还包括:从建设项目用语(term)的词汇表(glossary)或数据库将建设术语输入到机器学习分类器;以及至少部分地基于具有与安全风险相关联或涉及安全风险的已知文本的信函的第一数据集和具有不涉及健康和安全风险的已知非风险文本的信函的第二数据集来训练机器学习分类器识别安全风险文本。

3、在另一个实施例中,描述了一种计算系统,包括:

4、至少一个处理器,被配置为执行指令;至少一个存储器,可操作地连接到该至少一个处理器;机器学习分类器,被配置为识别建设术语并利用风险将文本分类为安全风险或非风险;非暂态计算机可读介质,包括存储在其上的计算机可执行指令,该计算机可执行指令在由至少一个处理器执行时使得计算设备:

5、监视网络上的电子邮件通信以识别传输的电子邮件;响应于接收网络上的电子邮件,检测电子邮件并将电子邮件识别为与建设项目相关联;将来自电子邮件的文本分词为多个词语;

6、将从电子邮件生成的多个词语输入到机器学习分类器中;其中机器学习分类器被配置为通过至少将多个词语与定义的安全风险词汇的集合和定义的非风险词汇的集合对应来评估来自电子邮件的多个词语;

7、通过机器学习分类器生成电子邮件包括涉及安全风险的文本的概率风险值;至少部分地基于电子邮件包括涉及安全风险的文本的概率风险值将电子邮件标记为安全风险或非风险;以及

8、响应于电子邮件被标记为安全风险,生成并向远程设备传输电子通知,以与接收网络上的电子邮件相关地近实时地提供警报。

9、在另一个实施例中,描述了包括或执行计算机可执行指令的计算机实现的方法、计算机系统或非暂态计算机可读介质,该计算机可执行指令在由至少计算机的处理器执行时使得计算机:

10、监视网络上的电子邮件通信以识别与目标领域相关联的电子邮件;发起机器学习分类器,该机器学习分类器被配置为利用风险将来自电子邮件的文本分类为与安全风险相关或与非风险相关;通过机器学习分类器生成电子邮件与安全风险相关的概率风险值;通过机器学习分类器至少部分地基于指示电子邮件是安全风险的概率风险值将电子邮件标记为安全风险或非风险;以及响应于电子邮件被标记为安全风险,生成并向远程设备传输电子通知以提供警报。

本文档来自技高网...

【技术保护点】

1.一种由至少一个计算设备执行的计算机实现的方法,所述方法包括:

2.根据权利要求1所述的方法,

3.根据权利要求1至2中的任一项所述的方法,还包括:

4.根据权利要求1至3中的任一项所述的方法,还包括:

5.根据权利要求1至4中的任一项所述的方法,还包括:

6.根据权利要求1至5中的任一项所述的方法,其中:

7.一种计算系统,包括:

8.根据权利要求7所述的计算系统,其中机器学习分类器包括集成分类器,所述集成分类器包括多个独立机器学习分类器;

9.根据权利要求7或8中的任一项所述的计算系统,其中机器学习分类器至少包括第一机器学习分类器、第二机器学习分类器和第三机器学习分类器;

10.根据权利要求7至9中的任一项所述的计算系统,还包括在由所述至少一个处理器执行时使得处理器执行以下操作的指令:

11.根据权利要求7至10中的任一项所述的计算系统,还包括在由所述至少一个处理器执行时使得处理器执行以下操作的指令:

12.一种非暂态计算机可读介质,包括存储在其上的计算机可执行指令,所述计算机可执行指令在由至少计算机的处理器执行时使得计算机:

13.根据权利要求12所述的非暂态计算机可读介质,其中机器学习分类器包括集成分类器,所述集成分类器包括多个独立机器学习分类器;

14.根据权利要求12或13中的任一项所述的非暂态计算机可读介质,还包括在由至少处理器执行时使得处理器执行以下操作的指令:

15.根据权利要求12至14中的任一项所述的非暂态计算机可读介质,还包括在由至少处理器执行时使得处理器执行以下操作的指令:

...

【技术特征摘要】
【国外来华专利技术】

1.一种由至少一个计算设备执行的计算机实现的方法,所述方法包括:

2.根据权利要求1所述的方法,

3.根据权利要求1至2中的任一项所述的方法,还包括:

4.根据权利要求1至3中的任一项所述的方法,还包括:

5.根据权利要求1至4中的任一项所述的方法,还包括:

6.根据权利要求1至5中的任一项所述的方法,其中:

7.一种计算系统,包括:

8.根据权利要求7所述的计算系统,其中机器学习分类器包括集成分类器,所述集成分类器包括多个独立机器学习分类器;

9.根据权利要求7或8中的任一项所述的计算系统,其中机器学习分类器至少包括第一机器学习分类器、第二机器学习分类器和第三机器学习分类器;

10.根据权利要求7至9中的任一项所述的计算系统,还...

【专利技术属性】
技术研发人员:R·纳格P·南比亚尔S·普拉哈拉吉K·文卡塔苏布拉马尼安
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1