上海二三四五网络科技有限公司专利技术

上海二三四五网络科技有限公司共有152项专利

  • 本申请公开了一种文件下载方法、装置、设备及存储介质,针对手机助手中的文件下载,根据目标文件的大小对目标文件进行分块,得到至少一个待下载分块文件,基于各待下载分块文件对应的分块信息对多个待下载文件同时进行下载操作,可以实现手机助手的大文件...
  • 本申请公开了基于时间衰减因素的热门内容计算方法及装置,所述方法包括:获取用户近N天的点击曝光行为数据;计算用户对物品发生点击/曝光行为的日期距离当前日期的间隔天数;由点击曝光行为数据及计算出的用户对物品发生点击/曝光行为的日期距离当前日...
  • 本发明提供了一种数据仓库及数据仓库的数据模型建立方法,所述数据仓库包括公共模型层和ADS层,所述公共模型层包括DWD层和DWS层;其中,所述DWD层、所述DWS层和所述ADS层按照数据域分级的方式,建立规范统一化的数据模型。本发明数据仓...
  • 本发明提供了一种数据仓库系统以及统一模型表创建方法,包括数据源、数据仓库和数据操作模块;数据仓库包括数据仓库逻辑层,数据仓库逻辑层被划分为多个分层单元;在每个分层单元以统一模型表建立数据模型,统一模型表基于Flink表存储创建,支持同时...
  • 本申请公开了一种基于语义理解的文本标签自动生成方法及装置,通过将待处理游戏对应的文本数据进行分词处理,获取文本数据所有的关键词,然后基于事先构建的标签词表对文本数据所有的关键词进行筛选,进而获得新的文本标签,通过将当前标签和新的文本标签...
  • 本申请公开了基于文本标签计算文本相似度的方法及装置,将字符串形式的文本标签先转换成转表的列形式,通过笛卡尔积方式获取每个文本与所有文本两两对应关系,并通过标签关联进行筛选,再设置标签权重值,基于标签权重值计算文本之间的相似度,并进行归一...
  • 本发明提供一种基于综合相似度的用户裂变作弊识别方法及装置,根据用户设备、行为数据和身份数据的多维度的衍生指标进行相似性判定,对存在相似性的各衍生指标赋予自定义的权重值,即相似性评分,再将各衍生指标的相似性评分进行累加,获得邀请人的综合相...
  • 本发明提供了一种数据仓库的数据质量校验系统及校验方法,包括:ODBC配置模块,用于对不同的数据仓库配置不同的ODBC数据驱动,连接不同的数据仓库;校验表生成模块,用于配置数据仓库的库表,生成校验表;预警表生成模块,用于配置数据仓库的库表...
  • 本申请公开了一种基于用户行为序列的双聚类热门推荐方法及装置,所述方法包括:基于用户行为序列数据构建物品的网络图;使用Graph Embedding方法得到各物品节点的向量表示;将物品节点的向量聚类至K个类簇;将用户产生过行为的物品按类簇...
  • 本申请公开了一种基于特征多时间态的处理方法、系统、设备及介质,所述处理方法包括:特征处理器中构建一个7天的周级别的时间轮盘,时间轮盘随着时间天数的推移自动旋转,每隔一周为一个完整循环;每个刻度上的时间存储当天特征的形态数据,用于描述特征...
  • 本申请公开了一种基于Spark合并hive小文件的方法及系统,所述方法包括:配置需要合并的库、表、分区信息;读取分区路径的总存储空间和文件个数;根据分区路径的文件个数和文件大小来判断是否需要合并文件;结合HDFS的块大小,计算合并之后的...
  • 本申请公开了一种基于BLEU指标的热门信息流推荐方法及装置,所述方法包括:爬取多个第一资源的资源信息,获取第一信息流内容;将第一信息流内容进行数据清洗,得到第一信息流集合;获取第二资源的资源信息,得到第二信息流集合;将第一信息流集合与第...
  • 本申请公开了一种个性化的推荐物品冷启动方法及装置,所述方法包括:获取指定时间内的新物品集;获取用户历史的点击行为数据集;将新物品集按照物品类别进行分组,不同类别下的物品放在各自不同的集合中,并组装成Map;对用户的点击行为数据集进行统计...
  • 本申请公开了基于展现位置因素改进的Hacker热门内容计算方法,该方法包括:对位于最小索引和最大索引范围内的每个曝光位置计算索引权重值;从用户的点击行为数据中处理获得用户信息;将用户点击物品时物品所处的展现位置关联索引权重值,得到数据集...
  • 本申请公开了一种基于新闻图片特点的推荐方法、装置、设备及介质,本申请从用户点击行为数据中选取页面访问量PV大于第一预设阈值、或者UV点击率大于第二预设阈值且独立访问量UV大于第三预设阈值的行为数据作为训练的正样本,选择UV点击率小于第四...
  • 本申请公开了一种预测用户是否流失的方法、装置、设备及介质,所述方法包括:用户活跃天数大于n、且连续m日不活跃,则启动流失预测,如连续j天不活跃就视为该用户流失,标签为流失用户;获取最近k天每天符合预测定义的用户和标签,用户和设备基本属性...
  • 本申请公开了基于聚类的用户个性化热门计算方法、装置、设备及介质,所述方法包括:基于用户行为序列数据构建物品网络图;使用Graph Embedding得到各物品节点的向量表示;对物品节点的向量数据进行聚类,生成K个类簇;计算各类簇下每个物...
  • 本发明公开了一种基于BERT的新闻热点预测方法,其预测待预测新闻成为热点新闻的概率,包括如下步骤:a.将一个或多个第一待预测新闻特征处理后代入热点新闻预测模型,并确定一个或多个热点新闻模型预测结果为正的第二待预测新闻以及与所述第二待预测...
  • 本申请公开了基于聚类技术的用户多兴趣推荐方法、装置、设备及介质,所述方法包括:S1,基于用户行为序列数据构建物品的网络图;S2,使用Graph Embedding方法得到各物品节点的向量表示;S3,对物品节点的向量数据进行聚类,生成K个...
  • 本申请公开了基于点击位置因素改进的CTR热门内容计算方法及装置,所述方法包括:S1,获取用户近期的点击曝光行为数据;S2,从点击曝光行为数据中获取点击集合A和曝光集合B;S3,将曝光集合B与点击集合A进行内关联得到集合C;S4,从集合C...