菜谱类内容的识别方法、装置、终端及可读存储介质制造方法及图纸

技术编号:23099669 阅读:20 留言:0更新日期:2020-01-14 20:42
本申请关于一种菜谱类内容的识别方法、装置、终端及存储介质,属于人工智能领域,该方法包括:获取网络平台中的用户原创内容,网络平台中提供有用户原创内容发布功能;从用户原创内容中提取文本特征;将文本特征输入菜谱识别模型,得到至少两组识别结果,其中,菜谱识别模型用于根据文本特征确定用户原创内容对菜谱类内容的包含情况;当至少两组识别结果符合匹配条件时,确定用户原创内容中包含菜谱类内容。本申请通过对用户原创内容进行文本特征的提取,并将文本特征输入可获得至少两组识别结果的菜谱识别模型并与菜谱匹配条件进行比较,确定用户原创内容是否包含菜谱类内容的方式,提高了对于用户原创内容是否包含菜谱类内容的识别的正确率。

Identification method, device, terminal and readable storage medium of recipe content

【技术实现步骤摘要】
菜谱类内容的识别方法、装置、终端及可读存储介质
本申请涉及人工智能
,特别涉及一种菜谱类内容的识别方法、装置、终端及可读存储介质。
技术介绍
在一些与食品有关的应用程序的平台上,部分用户会通过发表评论的方式公开菜谱。在部分应用程序当中,将会对发表菜谱的用户进行奖励,或对关于菜谱的评论进行展示。相关技术中,对于用户评论菜谱的检测方法通常为关键词集检索的方式,具有用户原创内容发布功能的平台通常通过使用菜谱中常见的关键词对评论进行检索及筛选,区别出带有菜谱的评论。具有用户原创内容(UserGeneratedContent,UGC)发布功能的平台对于菜谱相关的关键词进行设定,当用户发表的评论中含有具有用户原创内容发布功能的平台设定的关键词时,则认为该条评论为带有菜谱的评论。然而,在关键词检索的方式中,仅当用户发表的评论中含有关键词的评论,该评论才会被视为带有菜谱的评论,而由于菜谱类评论内容扩展性较强,当用户发表的内容属于菜谱类内容而不包含预设关键词时,则对该内容的检测结果产生错误,故利用关键词检测的方法识别网络信息是否属于菜谱的正确率较低。
技术实现思路
本申请关于一种菜谱类内容的识别方法、装置、终端及可读存储介质,可以解决通过相关技术中用关键词检测的方法识别网络信息是否属于菜谱的正确率较低的问题。该技术方案如下:一方面,提供了一种菜谱类内容的识别方法,该方法包括:获取网络平台中的用户原创内容,网络平台中提供有用户原创内容发布功能;从用户原创内容中提取文本特征;将文本特征输入菜谱识别模型,得到至少两组识别结果,菜谱识别模型中包括通过不同识别算法对文本特征进行识别的至少两个模型,其中,菜谱识别模型用于根据文本特征确定用户原创内容对菜谱类内容的包含情况;当至少两组识别结果符合菜谱匹配条件时,确定用户原创内容中包含菜谱类内容。在一个可选的实施例中,菜谱识别模型中包括第一识别模型;将用户原创内容以及文本特征输入菜谱识别模型,得到至少两组识别结果,包括:将用户原创内容以及文本特征输入第一识别模型,得到第一识别结果,第一识别结果是第一识别模型通过逻辑回归算法对文本特征进行识别得到的结果。在一个可选的实施例中,菜谱识别模型中包括第二识别模型:将用户原创内容以及文本特征输入菜谱识别模型,得到至少两组识别结果,包括:将用户原创内容以及文本特征输入第二识别模型,得到第二识别结果,第二识别结果是第二识别模型通过双向长短期记忆人工神经网络算法对文本特征进行识别得到的结果。在一个可选的实施例中,每组识别结果中包括目标概率,目标概率用于表示用户原创内容中包含菜谱类内容的概率;当至少两组识别结果符合菜谱匹配条件时,确定用户原创内容中包含菜谱类内容,包括:当识别结果对应的目标概率达到概率阈值时,确定识别结果为符合菜谱匹配条件的目标识别结果;当至少两组识别结果中,目标识别结果的占比达到比例阈值时,确定用户原创内容中包含菜谱类内容。在一个可选的实施例中,从用户原创内容中提取文本特征,包括:根据菜谱类内容的特性对用户原创内容进行特征提取,得到字特征和词特征。当词特征包含至少两个字特征时,从文本特征中滤除词特征中包含的字特征。在一个可选的实施例中,用户原创内容是目标账号发布在网络平台中的,在确定用户原创内容中包含菜谱类内容后,还包括:对目标账号触发具有用户原创内容发布功能的平台的奖励机制。另一方面,提供了一种基于人工智能的菜谱类内容的识别装置,该装置包括:获取模块,用于获取具有用户原创内容发布功能的平台中的用户原创内容;获取模块,用于从用户原创内容中提取文本特征;输入模块,用于将文本特征输入菜谱识别模型,得到至少两组识别结果,菜谱识别模型中包括通过不同识别算法对文本特征进行识别的至少两个模型,其中,菜谱识别模型用于根据文本特征确定用户原创内容对菜谱类内容的包含情况;确定模块,用于当至少两组识别结果符合菜谱匹配条件时,确定用户原创内容中包含菜谱类内容。在一个可选的实施例中,菜谱识别模型中包括第一识别模型;输入模块,还用于将用户原创内容和文本特征输入第一识别模型,得到第一识别结果,第一识别结果是第一识别模型通过逻辑回归算法对文本特征进行识别得到的结果。在一个可选的实施例中,菜谱模型中包括第二识别模型;输入模块,还用于将用户原创内容和文本特征输入第二识别模型,得到第二识别结果,第二识别结果是第二识别模型通过双向长短期记忆人工神经网络算法对文本特征进行识别得到的结果。在一个可选的实施例中,每组识别结果中包括目标概率,目标概率用于表示用户原创内容中包含菜谱类内容的概率;确定模块,还用于当识别结果对应的目标概率达到概率阈值时,确定识别结果为符合菜谱匹配条件的目标识别结果;确定模块,还用于当识别结果中,目标识别结果的占比达到比例阈值时,确定用户原创内容中包含菜谱类内容。在一个可选的实施例中,获取模块,还用于根据菜谱类内容的特性对用户原创内容进行特征提取,得到字特征和词特征。在一个可选的实施例中,当词特征包含至少两个字特征时,从文本特征中滤除词特征中包含的字特征。在一个可选的实施例中,用户原创内容是目标账号发布在网络平台中的,在确定用户原创内容中包含菜谱类内容后,还包括:对目标账号触发具有用户原创内容发布功能的平台的奖励机制。另一方面,提供了一种计算机设备,计算机设备包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述本申请实施例中提供的菜谱类内容的识别方法。另一方面,提供了一种计算机可读存储介质,可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述本申请实施例中提供的菜谱类内容的识别方法。本申请提供的技术方案带来的有益效果至少包括:通过对用户原创内容进行文本特征的提取,并将文本特征输入可获得至少两组识别结果的菜谱识别模型并与菜谱匹配条件进行比较,确定用户原创内容是否包含菜谱类内容的方式,从多个维度对用户原创内容进行识别,提高了对于用户原创内容是否包含菜谱类内容的识别的正确率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了本申请一个示例性实施例提供的具有用户原创内容发布功能的平台的界面示意图;图2示出了菜谱类内容的文本详细信息的界面图;图3示出了相关技术中基于关键字词识别的菜谱类内容的识别方法的流程图;图4示出了相关技术中一个基于关键字词识别的菜本文档来自技高网...

【技术保护点】
1.一种菜谱类内容的识别方法,其特征在于:/n获取网络平台中的用户原创内容,所述网络平台中提供有用户原创内容发布功能;/n从所述用户原创内容中提取文本特征;/n将所述用户原创内容以及所述文本特征输入菜谱识别模型,得到至少两组识别结果,所述菜谱识别模型中包括通过不同识别算法对所述文本特征进行识别的至少两个模型,其中,所述菜谱识别模型用于确定所述用户原创内容对菜谱类内容的包含情况;/n当所述至少两组识别结果符合菜谱匹配条件时,确定所述用户原创内容中包含所述菜谱类内容。/n

【技术特征摘要】
1.一种菜谱类内容的识别方法,其特征在于:
获取网络平台中的用户原创内容,所述网络平台中提供有用户原创内容发布功能;
从所述用户原创内容中提取文本特征;
将所述用户原创内容以及所述文本特征输入菜谱识别模型,得到至少两组识别结果,所述菜谱识别模型中包括通过不同识别算法对所述文本特征进行识别的至少两个模型,其中,所述菜谱识别模型用于确定所述用户原创内容对菜谱类内容的包含情况;
当所述至少两组识别结果符合菜谱匹配条件时,确定所述用户原创内容中包含所述菜谱类内容。


2.根据权利要求1所述的方法,其特征在于,所述菜谱识别模型中包括第一识别模型;
所述将所述用户原创内容以及所述文本特征输入菜谱识别模型,得到至少两组识别结果,包括:
将所述用户原创内容以及所述文本特征输入所述第一识别模型,得到第一识别结果,所述第一识别结果是所述第一识别模型通过逻辑回归算法对所述文本特征进行识别得到的结果。


3.根据权利要求1所述的方法,其特征在于,所述菜谱识别模型中包括第二识别模型:
所述将所述用户原创内容以及所述文本特征输入菜谱识别模型,得到至少两组识别结果,包括:
将所述用户原创内容以及所述文本特征输入所述第二识别模型,得到第二识别结果,所述第二识别结果是所述第二识别模型通过双向长短期记忆人工神经网络算法对文本特征进行识别得到的结果。


4.根据权利要求1至3任一所述的方法,其特征在于,每组所述识别结果中包括目标概率,所述目标概率用于表示所述用户原创内容中包含所述菜谱类内容的概率;
所述当所述至少两组识别结果符合菜谱匹配条件时,确定所述用户原创内容中包含所述菜谱类内容,包括:
当所述识别结果对应的所述目标概率达到概率阈值时,确定所述识别结果为符合所述菜谱匹配条件的目标识别结果;
当所述至少两组识别结果中,所述目标识别结果的占比达到比例阈值时,确定所述用户原创内容中包含所述菜谱类内容。


5....

【专利技术属性】
技术研发人员:石锋江峰黄尚志
申请(专利权)人:汉海信息技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1