【技术实现步骤摘要】
基于AI大数据的技术交易推荐系统及方法
[0001]本专利技术涉及交易数据处理
,具体涉及一种基于AI大数据的技术交易推荐系统及方法。
技术介绍
[0002]随着专利数量以及技术成果的不断丰富,对于新技术的需求也在不断增加,如何将有用的技术成果转换成看得见的经济效益是一个重点关注的问题,也因此出现了技术转移并建立了技术转移信息服务平台,技术转移不仅在研究和产业之间起着重要的连接作用,并且能够促进区域内的知识流动。
[0003]目前在技术转移信息服务平台搜索自身需求的相关技术信息时,往往是以文本相似度的匹配为主,对于文本相似度的匹配最常用的方法便是基于TF
‑
IDF算法,利用传统的TF
‑
IDF算法对文本的关键词进行提取以进行匹配,但该方法忽略了不同词的重要程度以及词的分布状况,对于权重的调整精确度较低,且没有考虑到词所在位置的重要性,因此会导致匹配结果不够精准。
技术实现思路
[0004]为了解决上述技术问题,本专利技术的目的在于提供一种基于AI大数据的技术交易推荐系统及方法,所采用的技术方案具体如下:第一方面,本专利技术一个实施例提供了一种基于AI大数据的技术交易推荐方法,该方法包括以下步骤:收集所有用户账号的浏览记录,所述浏览记录中包括至少两个技术文本,所有用户账号的技术文本构成推荐集;对每个技术文本进行文本位置的划分,同时对每个技术文本进行分词,统计特定长度词出现的文本位置以及在对应文本位置出现的数量,以得到每个文本位置中词的出现比例;根据所有词 ...
【技术保护点】
【技术特征摘要】
1.一种基于AI大数据的技术交易推荐方法,其特征在于,该方法包括以下步骤:收集所有用户账号的浏览记录,所述浏览记录中包括至少两个技术文本,所有用户账号的技术文本构成推荐集;对每个技术文本进行文本位置的划分,同时对每个技术文本进行分词,统计特定长度词出现的文本位置以及在对应文本位置出现的数量,以得到每个文本位置中词的出现比例;根据文本位置中词的数量以及所有词出现的文本位置数量得到每个文本位置的重要程度;将每个技术文本进行句子划分得到分句,根据分句中每个词在技术文本中出现的频次筛选分句,得到剩余分句;根据所述剩余分句中所有的词构建矩阵,根据所述矩阵得到每个词的共现值;统计每个词在技术文本中出现的行位置信息,根据每个词出现的行位置信息获取对应的离散程度;根据每个词出现的文本位置的数量、每个词的共现值以及离散程度得到每个词的校正因子;根据所述每个词的校正因子、每个文本位置的重要程度及每个词在每个文本位置中词的出现比例更新TFIDF算法中的关键值函数求得技术文本中每个词的关键值;根据每个词的关键值提取所述推荐集中的相似文本,并获取每个所述相似文本的相似度,根据所述相似度对所述相似文本进行降序排列得到推荐结果。2.根据权利要求1所述的一种基于AI大数据的技术交易推荐方法,其特征在于,所述根据文本位置中词的数量以及所有词出现的文本位置数量得到每个文本位置的重要程度,包括:其中,表示第个文本位置的重要程度;表示第个文本位置中词的数量;表示第种词出现的文本位置数量;表示所有的词的种类的数量,U表示文本位置的数量。3.根据权利要求1所述的一种基于AI大数据的技术交易推荐方法,其特征在于,所述根据每个词出现的文本位置的数量、每个词的共现值以及离散程度得到每个词的校正因子,包括:W表示第种词的校正因子;表示第种词出现的文本位置数量;表示第种词的共现值;表示第种词的离散程度。4.根据权利要求1所述的一种基于AI大数据的技术交易推荐方法,其特征在于,所述根据所述每个词的校正因子、每个文本位置的重要程度及每个词在每个文本位置中词的出现比例更新TFIDF算法中的关键值函数求得技术文本中每个词的关键值,包括:
其中,表示第u种词的关键值,表示文本位置的数量;表示第个文本位置的重要程度;表示第种词在第个文本位置中的出现比例;表示第种词在技术文本中出现的技术文本的数量;表示所有技术文本的数量;表示第u种词的校正因子。5.根据权利要求1所述的一种基于AI大数据的技术交易推荐方法,其特征在于,所述将每个技术文本进行句子划分得到分句,根据分句中每个词在技术文本中出现的频次筛选分句,得到剩余分句,包括:根据技术文本中的标点符号将技术文本划分为多个分句,统计分句中每种词在技术文本中出现的频次,当出现的频次大于预设次数时将该词进行保留;当出现的频次不大于预设次数时,将该词进行舍弃;最终...
【专利技术属性】
技术研发人员:杨高林,兰毅,宋文力,
申请(专利权)人:果子青岛数字技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。