System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于知识图谱的化妆品不良事件分级预警方法及系统技术方案_技高网

一种基于知识图谱的化妆品不良事件分级预警方法及系统技术方案

技术编号:40007465 阅读:9 留言:0更新日期:2024-01-16 14:44
本发明专利技术公开了一种基于知识图谱的化妆品不良事件分级预警方法及系统,该方法包括获取化妆品相关新闻信息,获得新闻元数据;对获取的元数据进行预处理,获得元数据的特征向量;通过机器学习模型对新闻信息特征进行分类,过滤虚假信息;对真实新闻信息特征进行情感分析,得到不良事件评分;根据不良事件评分构建知识图谱;根据知识图谱中评分对化妆品进行预警通知。本发明专利技术通过结合知识图谱来减少人工成本,并通过语义分析来甄别不良事件来构成知识图谱,根据情感等级来划分事件等级并进行预警,使化妆品的不良事件可以得到更细致可靠的划分以及及时的预警。

【技术实现步骤摘要】

本专利技术涉及分级预警,具体涉及一种基于知识图谱的化妆品不良事件分级预警的方法及系统。


技术介绍

1、智能分级预警是将最新的大数据技术运用在社会中各个关键位置,以提高预警能力,达到提高预警质量的效果。在社会运转过程中有很多需要关注的事件,对实时发生的事件进行评级,并对超过阈值的事件进行预警已经是必不可少的工作。而随着数据大爆炸时代的来临,单纯通过人力来收集,甄别事件已经不可取,越来越多的行业使用人工智能技术来挖掘数据并进行分类,预警(如水利部门通过监察设备实时监控降雨量等信息,对即将超过,已经超过安全阈值的河段,地区进行不同级别的预警)。

2、目前化妆品不良事件的发生愈演愈烈,化妆品市场鱼龙混杂,无法有效甄别各种化妆品是否有过由于质量问题导致的不良事件以及不良事件的程度。大多数记录了不良、违规的化妆品信息都是零散存在于网络之中,这导致难以对化妆品的不良事件进行分级并预警,所以需要一个能收集信息并准确分析进行分级预警的方法。

3、近年来,随着大数据技术的发展,爬虫技术日渐成熟,可以在单位时间内爬取更多的高质量数据,所以利用爬虫来获取万维网中所需信息已成为获取信息的主要方式。将爬虫技术和知识图谱技术相结合,利用爬虫所获取的信息来构建知识图谱并进行语义情感分析,可以提高分级预警能力。再经过模型学习以及训练后,可以使系统的分级预警更加精准。

4、自然语言处理(nlp,natural language processing)技术计算机科学领域与人工智能领域中的一个重要方向。其中情感分析是重要的应用方向,它利用算法来分析提取文本中表达的情感。例如分析一个句子表达的好、中、坏等判断,高兴、悲伤、愤怒等情绪。如果能将这种文字转为情感的操作让计算机自动完成,可以节省了大量的时间。对于目前的海量文本数据来说,这是非常必要的。

5、由于互联网上公开可用的信息不断增长,在评论网站、论坛、博客和社交媒体中,可以获得大量表达意见的文本。在情感分析系统的帮助下,这种非结构化信息可以自动转换为结构化数据,关于产品、服务、品牌或人们可以表达意见的其他主题。这些数据对于商业应用非常有用,例如营销分析、公共关系、产品评论、网络发起人评分、产品反馈和客户服务。

6、知识图谱(knowledge graph,kg)是2010年由谷歌团队提出的语义知识库,它是人工智能技术的重要分支技术。知识图谱以符号形式来描述现实世界中的各种概念以及相互关系。它以实体和实体之间的关系的形式为信息来进行建模,遵循rdf(resourcedescription framework)标准,其中(主语,谓语,宾语)三元组是最常用的表达形式,其中主语和谓语是构建的实体,谓语表示它们之间的关系。通过组合多个三元组来构成多重图,其中节点表示实体(所有主题和对象),有向边表示实体间的关系。边的方向指示实体是作为主体还是作为对象出现,即边的指向是从主体到对象的方向。通过不同类型的边(边标签)表示不同的关系。这种结构就被称为知识图(kg),有时也称为异构信息网络。

7、在知识图谱出现之前,人工智能还处于感知智能阶段。感知阶段是指web 2.0产生的海量数据为机器学习和深度学习技术提供了大量标注数据,而gpu和cpu的算力增长,云计算技术的飞速发展为机器学习和深度学习的复杂数值计算提供了必要条件。机器学习和深度学习技术在语音、图像、交通领域均取得了突破性的进展,学习技术成果使得机器在感知能力上达到甚至超越了人类的水平,由此人工智能迈向了感知智能阶段。但深度学习的局限性也越专利技术显,主要表现在四个方面:第一点缺乏可解释性,由于它是端到端的黑盒模式使得很多模型不可解释,需要人参与决策,尤其是医疗诊断和金融投资方面;第二点常识缺失,特征数据的抽取缺乏关联逻辑,丧失了人类日常活动所需要的大量常识背景知识支持;第三点缺乏语义理解,模型并不了解数据中的语义知识,缺乏推理总结能力,对未知的数据模型泛化能力差;第四点依赖大量样本数据,大多数模型需要大量已标注数据来进行训练。而知识图谱的出现让人工智能由感知智能阶段迈向了认知智能阶段。在这个阶段,人工智能的计算能力逐渐从数据计算转化为知识计算,使机器拥有推理和总结能力,模型可以利用先验知识总结出人可以理解的、模型可以复用的知识。知识图谱提供一种基于符号语义的模型使用客观概念,实体,实体间的关系来描述现实世界中的关系,不仅增加了可解释性,而且可以为深度学习模型提供先验知识,将机器学习的结果转化为可复用的符号知识累积起来。

8、知识图谱已经成功运用在多个领域并发挥重要作用,国外知名的知识图谱有freebase、dbpedia、cyc、wordnet,国内也有openkg,阿里电商知识图谱、美团知识图谱、xlore(清华大学)等知识图谱。

9、目前,知识图谱在医疗、推荐系统、问答系统都有了成熟的应用,但在化妆品不良事件预警方面缺乏应用方法。而随着社会的发展,各类化妆品层出不穷,不良事件的发生也与日俱增。由于不良事件涉及的产品,公司关系复杂,相关数据难以统计和管理。及时发现,收集化妆品不良信息并进行分级对相关人员来说是困难的。此外,能够高效地对化妆品不良信息进行分级预警对于消费者和相关企业有着较高的意义,对于消费者的权益和健康起到了一定的保护作用。

10、当前化妆品分级预警所面临的问题主要有以下几点:(1)如何有效收集化妆品相关信息,并区分出其中不良信息;(2)如何划分不良事件的等级划分。这一问题同样也是知识图谱的化妆品分级预警所面临的问题,虚假的信息或非不良信息会直接影响不良事件的等级划分,各个等级的划分边界直接影响预警的功能及效率。

11、一般的分级预警系统都是使用已经标注好的数据进行统计分析,需要专门的人员来进行数据的收集、清洗以及标注,极大地增加了人力成本且无法做到实时更新。尤其是在化妆品分级预警中更难进行准确的数据标注,化妆品分级预警系统上线后,还需要专人核对数据进行检测,极大地增加了成本,随着化妆品数据规模的日益增加,这个问题会更加严重。通过利用知识图谱对化妆品不良事件进行分级预警,业界几乎还是空白。因此通过构建化妆品不良事件知识图谱并对化妆品不良事件进行分级预警就显得尤为迫切和重要


技术实现思路

1、有鉴于此,本专利技术的目的之一是提供一种基于知识图谱的化妆品不良事件分级预警方法,能够克服
技术介绍
中存在的问题;本专利技术的目的之二是提供一种基于知识图谱的化妆品不良事件分级预警系统;本专利技术的目的之三是提供了一种计算机可读存储介质。

2、本专利技术的目的之一是通过以下技术方案实现的:

3、一种基于知识图谱的化妆品不良事件分级预警方法,包括以下步骤:

4、步骤s1:通过收集化妆品相关新闻信息,获得新闻元数据集;

5、步骤s2:对获取的元数据进行预处理,获得元数据的特征向量;

6、步骤s3:通过机器学习模型对新闻信息特征进行分类,过滤虚假信息;

7、步骤s4:对真实新闻信息特征进行情感分析本文档来自技高网...

【技术保护点】

1.一种基于知识图谱的化妆品不良事件分级预警方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于知识图谱的化妆品不良事件分级预警方法,其特征在于,所述步骤S1具体包括:

3.根据权利要求2所述的基于知识图谱的化妆品不良事件分级预警方法,其特征在于,所述步骤S2中,对新闻元数据进行特征提取的公式如下所示:

4.根据权利要求3所述的基于知识图谱的化妆品不良事件分级预警方法,其特征在于,所述步骤S3中,通过机器学习模型对新闻信息特征进行分类,过滤虚假信息的训练公式如下所示:

5.根据权利要求4所述的基于知识图谱的化妆品不良事件分级预警方法,其特征在于,所述步骤S4具体包括:

6.根据权利要求5所述的基于知识图谱的化妆品不良事件分级预警方法,其特征在于,所述步骤S5具体包括:

7.根据权利要求6所述的基于知识图谱的化妆品不良事件分级预警方法,其特征在于,所述步骤S6具体包括:

8.一种基于知识图谱的化妆品不良事件分级预警系统,包括存储器、处理器及储存在存储器上并能够在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的方法。

9.一种计算机可读存储介质,其上储存有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的方法。

...

【技术特征摘要】

1.一种基于知识图谱的化妆品不良事件分级预警方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的基于知识图谱的化妆品不良事件分级预警方法,其特征在于,所述步骤s1具体包括:

3.根据权利要求2所述的基于知识图谱的化妆品不良事件分级预警方法,其特征在于,所述步骤s2中,对新闻元数据进行特征提取的公式如下所示:

4.根据权利要求3所述的基于知识图谱的化妆品不良事件分级预警方法,其特征在于,所述步骤s3中,通过机器学习模型对新闻信息特征进行分类,过滤虚假信息的训练公式如下所示:

5.根据权利要求4所述的基于知识图谱的化妆品不良事件分级预警方法,其特征在于...

【专利技术属性】
技术研发人员:唐洁李利王曦华薇舒晓红熊丽丹李朝霞霍维邹琳汤莹
申请(专利权)人:四川大学华西医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1