当前位置: 首页 > 专利查询>南开大学专利>正文

基于推荐系统的互动绘本生成系统技术方案

技术编号:16873834 阅读:52 留言:0更新日期:2017-12-23 11:46
基于推荐系统的互动绘本生成系统,包括用户信息采集模块、绘本资源管理模块、绘本资源推荐模块和绘本生成模块。所述绘本资源推荐模块采用基于短文本语义相似度计算的绘本资源推荐方法,针对绘本信息的短文本的特征稀疏造成的相似度计算精度不高的缺点对绘本资源相关文本特征使用显性特征和隐性特征相结合的方法进行了有效扩展,从而使绘本资源在应用过程中具有更精确的关联性,在资源推荐应用中的体验得到优化。该方法通过采集用户在平台产生的相关短文本数据,基于短文本语义相似度计算的方法将用户交互信息特征和绘本资源文本特征两部分进行相似度计算,从而推荐出最优的绘本资源,以减少操作人员负担,满足用户个性化定制化的需求。

Interactive picture book generation system based on recommendation system

The interactive picture book generation system based on recommender system includes user information collection module, picture book resource management module, picture book resource recommendation module and picture book generation module. The picture book recommendation module uses short text semantic similarity calculation based on the picture book resource recommendation method, method of similarity for short text feature caused by sparse picture information of the calculation accuracy of picture resources related to text feature using the dominant and recessive characteristics by combining the effective expansion, so that resources are picture books Association of more accurate in the application process, are optimized in the Resource Recommendation application experience. The method by collecting related essays in the user platform to generate the data, calculation method of short text semantic similarity based on the two part of the user interaction characteristics of information and picture resources text feature similarity calculation, and recommended the optimum picture resources, to reduce the burden of operating personnel, meet the user's personalized customized demand.

【技术实现步骤摘要】
基于推荐系统的互动绘本生成系统
本专利技术属于图书及教育领域,特别涉及一种基于短文本语义相似度计算的绘本资源推荐方法,以及基于推荐系统的互动绘本生成系统。
技术介绍
绘本是以图文并茂的形式的少儿图书。绘本的主要特色是提供读者在视觉方面的真实的或是美感的经验,现已广泛用于教育领域。绘本的内容常具有简单的故事大纲,有时候也会集中呈现某种简单的意义和结构。随着绘本学习及个性化需求程度的增加,绘本应用于线上线下教育的应用逐年增加。传统绘本内容生成完全基于固定的文案及图片。手工绘制生成故事较为单一,图片及故事内容固定,不能满足各个年龄段儿童的个性化需求和教育诉求,已不再满足当今个性化教育的趋势。国内的定制化绘本概念还停留在或者只是简单地更换姓名、头像的阶段,或者只是简单地信息展现而不能与绘本内容完美结合,尚没有类型项目能够做到将读者的个人信息直接嵌入绘本内容且富于变化的水平。在文本匹配方面,常通过设定一定的字段来进行确定性的搜索或采用长文本匹配。绘本图片资源均配有相应的短文本描述信息。这些图片资源描述及绘本文本资源均属于一种短文本类型,而短文本的信息处理方法又区别于长文本的信息处理的一般方法,其最大的不同点在于短文本具有非常稀疏的特征。在短文本上直接应用传统的文本表示模型表现效果不佳。向量空间模型是文本建模一般情况下最常用的模型之一,由于短文本特征稀疏的这一特性,使用原始待测文本的词语作为特征项使得文本内容表现力不足,衡量文本间的相似度效果不佳。
技术实现思路
本专利技术目的是解决绘本信息短文本的特征稀疏造成的相似度计算精度不高的问题,提供一种基于推荐系统的互动绘本生成系统。本专利技术对文本特征使用显性特征和隐性特征相结合的方法进行了有效扩展,从而使绘本资源在生成绘本过程中具有更精确的关联性。通过前期绘制和编纂工作,本专利技术已经拥有大量手绘绘本图片资源(包含背景,图片块等),及大量短文本信息。本系统挖掘这些资源的相关性将其生成为一本完整的绘本。基于推荐系统的在绘本生成系统中运用兼容内容搜索、语义分析、逻辑匹配、大数据分析的智能文档格式对绘本进行在线生成。系统采用短文本语义相似度计算及推荐算法对素材库中文字及图片源进行推荐,并在线整合资源生成独一无二的个性化绘本。本专利技术的技术方案:基于推荐系统的互动绘本生成系统,主要包括用户信息采集模块、绘本资源管理模块、绘本资源推荐模块和绘本生成模块;用户信息采集模块,通过收集用户在平台交互的信息,完成用户信息的存储与交互;绘本资源管理模块,管理所有绘本资源信息的增删和更新,绘本资源包含图片及文本两个部分,每部分资源均有200字以内的短文本对资源进行相应的描述;具体包含绘本背景资源、绘本图片块资源、绘本短文本资源和绘本故事线资源;该模块极大地方便了大量绘本资源的维护和管理;绘本资源推荐模块,通过与前两个模块的交互,完成对特定用户绘本资源的推荐工作;绘本生成模块,将绘本资源进行整合拼接,根据其坐标的动态调整和内容的适配,完成最终的个性化绘本。所述绘本资源推荐模块提供了一种为用户提供个性化绘本资源的基于短文本语义相似度计算的绘本资源推荐方法。该方法针对绘本信息的短文本的特征稀疏造成的相似度计算精度不高的缺点对绘本资源相关文本特征使用显性特征和隐性特征相结合的方法进行了有效扩展,从而使绘本资源在应用过程中具有更精确的关联性,在资源推荐应用中的体验得到优化。该方法通过采集用户在平台的行为产生的相关短文本数据,对该类数据进行数据清洗后,基于短文本语义相似度计算的方法将用户交互信息特征和绘本资源文本特征两部分进行相似度计算,从而推荐出最优的绘本资源即绘本文本及图片资源,然后存入数据库中组成该用户的绘本资源库用于后续定制化绘本的生成,以减少操作人员负担,满足用户个性化定制化的需求。基于短文本语义相似度计算的绘本资源推荐方法,包括以下步骤:第1、资源推荐开始;第2、读取用户基本信息及相关短文本信息;第3、用户信息与背景资源计算文本相似度进行匹配;第4、用户信息与图片块资源计算文本相似度进行匹配;第5、用户信息与文本资源计算文本相似度进行匹配;第6、检查第3步至第5步三步匹配结果是否符合相关性,经过人工校验后判断是否符合逻辑关联,若为否则返回第3步进行循环,若为是将匹配资源存储至数据库,进行下一步;第7、结束。所述第3步至第5步中的匹配算法具体为:步骤1.选取绘本资源库中的描述性的(图片资源)短文本数据及(纯文本故事)文本数据作为文本数据,分析绘本资源特点,对文本字符串进行分词、去停用词,过滤低频词等文本预处理,达到初步去噪和特征的有效降维。步骤2.通过分析短文本与长文本在特征表示中的差别,提出使用显性特征与隐性特征相结合的方法。对于短文本特征稀疏的问题,使用基于LDA主题模型的方法处理。Gibbs采样构建LDA模型的步骤如下:①.对每个文本词项语料库中的所有词项都按一定概率分配各自对应的一个主题编号;②.重复遍历文本词项语料库,使用Gibbs采样每个词对应的主题,同时刷新文本词项语料库;③.对以上的文本词项语料库的采样过程进行多次,直到函数收敛;④.统计主题-词概率模型,文本-主题概率模型,得到LDA主题模型。基于短文本语义相似度计算的绘本资源推荐方法中,使用了独创的基于LDA主题模型的特征项扩展方法,针对不同长度的待测文本依据动态比例扩展对应数量的特征词。其核心思想是,将待测文本使用训练后的主题模型进行预测,会使待测文本对主题模型生成的所有主题都有一个语义倾向概率,而主题模型中的每个隐含主题都是由倾向于该主题的词构成的集合,通过把最大概率的主题对应的词扩展到待测文本预处理后的词序列中,使待测文本语义得到不同程度的表达。本专利技术的优点和积极效果:(1)本专利技术提供的绘本生成系统,管理方便操作简单。智能搜集用户个人信息,对用户信息完成个性化推荐生成独一无二的绘本,节省了大量人力成本,极大的降低了绘本制作成本。(2)本专利技术运用基于短文本语义相似度计算的绘本资源推荐方法,根据短文本中特征,提出使用显性特征与隐性特征相集合的方法。极大提高了绘本资源推荐的准确程度。(3)本专利技术告别传统绘本内容生成完全基于固定的文案及图片,满足各个年龄段儿童的个性化需求和教育诉求。运用全新的智能绘本生成技术,对行业有重大的指导和示范意义。附图说明图1为基于推荐系统的的互动绘本生成系统的系统架构图。图2为基于推荐系统的互动绘本生成系统业务流程图。图3为绘本资源推荐模块总体实验流程示意图。图4文本特征项扩展具体方法流程图。图5文本特征项扩展具体方法流程图。图6基于主题的特征的扩展示意图。图7困惑度随主题数K的变化曲线。图8拓展不同比例特征词对F1的影响图9特征扩展前后分类F1值分布。具体实施方式实施例1:本专利技术提供的基于推荐系统的互动绘本生成系统,系统采用B/S模式,以PHP作为后台语言开发。数据库采用radis、MongoDb、MySql三种数据库相结合。其系统总体架构图如图1所示。主要包括用户信息采集模块、绘本资源管理模块、绘本资源推荐模块和绘本生成模块。其主要业务流程及各模块关系如图2所示。用户信息采集模块,通过收集用户在平台交互的信息,完成用户信息的存储与交互;用户在系统前端以游戏的方式进行交互。系统通过用户的点击行为和输入本文档来自技高网...
基于推荐系统的互动绘本生成系统

【技术保护点】
一种基于推荐系统的互动绘本生成系统,包括用户信息采集模块、绘本资源管理模块、绘本资源推荐模块和绘本生成模块;用户信息采集模块,通过收集用户在平台交互的信息,完成用户信息的存储与交互;绘本资源管理模块,管理所有绘本资源信息的增删和更新,所述绘本资源包含绘本背景资源、绘本图片块资源、绘本短文本资源和绘本故事线资源;该模块极大地方便了大量绘本资源的维护和管理;绘本资源推荐模块,通过与前两个模块的交互,完成对特定用户绘本资源的推荐工作;绘本生成模块,将绘本资源进行整合拼接,根据绘本资源坐标的动态调整和内容的适配,完成最终的个性化绘本。

【技术特征摘要】
1.一种基于推荐系统的互动绘本生成系统,包括用户信息采集模块、绘本资源管理模块、绘本资源推荐模块和绘本生成模块;用户信息采集模块,通过收集用户在平台交互的信息,完成用户信息的存储与交互;绘本资源管理模块,管理所有绘本资源信息的增删和更新,所述绘本资源包含绘本背景资源、绘本图片块资源、绘本短文本资源和绘本故事线资源;该模块极大地方便了大量绘本资源的维护和管理;绘本资源推荐模块,通过与前两个模块的交互,完成对特定用户绘本资源的推荐工作;绘本生成模块,将绘本资源进行整合拼接,根据绘本资源坐标的动态调整和内容的适配,完成最终的个性化绘本。2.根据权利要求1所述的基于推荐系统的互动绘本生成系统,其特征在于,所述绘本资源推荐模块提供了一种为用户提供个性化绘本资源的基于短文本语义相似度计算的绘本资源推荐方法;该方法针对绘本信息的短文本的特征稀疏造成的相似度计算精度不高的缺点对绘本资源相关文本特征使用隐性语义特征的方法进行扩充,从而使绘本资源在应用过程中具有更精确的关联性,在资源推荐应用中的体验得到优化;该方法通过用...

【专利技术属性】
技术研发人员:曹先宋佳慧陈杰戴舟
申请(专利权)人:南开大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1