System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及软件开发,更具体地说,涉及一种基于文档处理的在线网页生成方法及装置。
技术介绍
1、目前市面上的静态网页生成方式,需要专业的前端开发人员使用超文本标记语言(hyper textmarkup language,html)、层叠样式表(cascading style sheets,css)和直译式脚本语言(javascript,js)代码等全球广域网(world wide web,web)前端语言,来手动编写网页代码,对网页内容和样式进行搭建和排版。
2、通过使用web前端语言手动编写网页代码对网页内容和样式进行搭建和排版,这种方式对开发人员的技术要求较高,且会导致网页开发的效率低。
3、因此,如何提高网页开发的效率,是本申请亟需解决的问题。
技术实现思路
1、有鉴于此,本申请公开了一种基于文档处理的在线网页生成方法及装置,旨在降低了网页开发的门槛、网页制作难度和人力成本,提高网页生成效率。
2、为了实现上述目的,其公开的技术方案如下:
3、本申请第一方面公开了一种基于文档处理的在线网页生成方法,所述方法包括:
4、获取待转换文档;
5、通过预训练的文档解析深度学习模型,对所述待转换文档进行解析,得到关键信息;
6、将所述关键信息进行转化,得到文档内容特征;
7、通过预训练的网页模板推荐引擎和所述文档内容特征,得到目标网页模板;所述目标网页模板为所述文档内容特征与模板特征的相似度得
8、将关键信息中的文档内容数据对应填充到所述目标网页模板,并生成对应的初始网页;
9、通过预设布局分析方式对所述初始网页进行布局分析,得到最优布局方案;所述预设布局分析方式为对视觉元素的特征和视觉元素的空间关系进行分析的方式;
10、根据所述最优布局方案动态调整所述初始网页,得到目标网页。
11、优选的,所述文档解析深度学习模型至少包括命名实体识别模型、文本摘要模型、语义角色标注模型和情感分析模型,所述通过预训练的文档解析深度学习模型,对所述待转换文档进行解析,得到关键信息,包括:
12、对所述待转换文档进行预处理,得到预设格式的待转换文档;所述预处理至少包括清洗、分词和去停用词;
13、通过所述命名实体识别模型识别所述待转换文档的关键实体;
14、利用预设算法从所述待转换文档中提取出关键词;
15、通过所述文本摘要模型生成所述待转换文档的摘要;
16、通过所述语义角色标注模型识别所述待转换文档的语义角色;
17、通过所述情感分析模型确定待转换文档的情感倾向;
18、从所述关键实体、所述关键词、所述摘要、所述语义角色和所述情感倾向中提取出关键信息。
19、优选的,所述通过预训练的网页模板推荐引擎和所述文档内容特征,得到目标网页模板,包括:
20、将所述文档内容特征转化为标准化的特征向量表示;
21、将所述标准化的特征向量表示与模板特征库中的模板特征向量进行相似度计算,得到当前文档的相似性;
22、通过协同过滤算法、用户历史选择模板和当前文档的相似性,进行模板的个性化推荐,得到协同过滤结果;
23、通过深度学习中的神经网络模型卷积神经网络,对所述文档内容特征和所述模板特征向量进行语义匹配,得到深度学习结果;
24、通过强化学习技术和预设推荐模板反馈,优化网页模板推荐引擎的推荐算法,得到强化学习结果;
25、根据所述协同过滤结果、所述深度学习结果和所述强化学习结果,得到模板推荐列表;
26、从所述模板推荐列表中选取所述文档内容特征与模板特征的相似度得分最高的目标网页模板。
27、优选的,所述将关键信息中的文档内容数据对应填充到所述目标网页模板,并生成对应的初始网页,包括:
28、遍历目标网页模板的超文本标记语言代码;
29、通过所述超文本标记语言代码识别出目标网页模板的各类占位符;
30、确定关键信息中的文档内容数据的各类内容元素;
31、通过预设匹配规则,将各类内容元素与各类占位符进行匹配;其中,所述预设匹配规则为根据占位符的类型寻找对应的内容元素的规则;
32、对匹配后的各类内容元素对应的文本进行智能改写与优化;所述智能改写用于使文本简洁和文本流畅;所述优化用于提高网页的浏览和信息获取的效率;
33、对智能改写与优化后的各类内容元素对应填充至所述目标网页模板的占位符,生成填充后的内容;
34、将填充后的内容进行智能排版和格式调整,生成对应的初始网页;所述智能排版至少包括自适应布局和添加交互效果;所述格式调整用于使填充后的内容与目标网页模板的设计风格相协调。
35、优选的,所述通过预设布局分析方式对所述初始网页进行布局分析,得到最优布局方案,包括:
36、对所述初始网页进行截图,并对所述截图进行图像预处理;
37、通过特征提取方法,对图像预处理后的截图进行视觉元素的特征提取,得到网页的各个关键视觉元素;
38、分析网页的各个关键视觉元素之间的空间关系,得到空间关系信息;
39、根据所述各个关键视觉元素和所述空间关系信息,构建布局优化的强化学习模型;所述布局优化的强化学习模型至少包括网页布局状态表示、动作空间、奖励函数和强化学习算法;
40、通过所述布局优化的强化学习模型,得到最优布局方案。
41、优选的,所述根据所述最优布局方案动态调整所述初始网页,得到目标网页,包括:
42、根据所述最优布局方案,确定对应的修改参数;
43、在响应式布局下,根据修改参数动态调整所述初始网页中的内容块的层叠样式表,得到目标网页;其中,所述响应式布局根据设备类型和屏幕尺寸确定。
44、优选的,还包括:
45、当接收到网页个性化请求时,通过预先构建的用户画像和意图理解模型,确定网页个性化请求对应的个性化调整参数;所述个性化调整参数至少包括内容推荐、样式风格和交互方式;
46、在目标网页生成的过程中,根据所述个性化调整参数动态调整目标网页。
47、优选的,还包括:
48、通过智能网页质量测试和优化引擎,对目标网页进行多维度评估;所述多维度评估至少包括页面性能评估、用户体验评估和搜索引擎优化友好度评估。
49、优选的,在根据所述最优布局方案动态调整所述初始网页,得到目标网页之后,还包括:
50、通过预设web服务器对所述目标网页进行托管,并对目标网页进行搜索引擎优化。
51、本申请第二方面公开了一种基于文档处理的在线网页生成装置,所述装置包括:
52、第一获取单元,用于获取待转换文档;
53、解本文档来自技高网...
【技术保护点】
1.一种基于文档处理的在线网页生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述文档解析深度学习模型至少包括命名实体识别模型、文本摘要模型、语义角色标注模型和情感分析模型,所述通过预训练的文档解析深度学习模型,对所述待转换文档进行解析,得到关键信息,包括:
3.根据权利要求1所述的方法,其特征在于,所述通过预训练的网页模板推荐引擎和所述文档内容特征,得到目标网页模板,包括:
4.根据权利要求1所述的方法,其特征在于,所述将关键信息中的文档内容数据对应填充到所述目标网页模板,并生成对应的初始网页,包括:
5.根据权利要求1所述的方法,其特征在于,所述通过预设布局分析方式对所述初始网页进行布局分析,得到最优布局方案,包括:
6.根据权利要求1所述的方法,其特征在于,所述根据所述最优布局方案动态调整所述初始网页,得到目标网页,包括:
7.根据权利要求1所述的方法,其特征在于,还包括:
8.根据权利要求1所述的方法,其特征在于,还包括:
9.根据权利要求1所述
10.一种基于文档处理的在线网页生成装置,其特征在于,所述装置包括:
...【技术特征摘要】
1.一种基于文档处理的在线网页生成方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述文档解析深度学习模型至少包括命名实体识别模型、文本摘要模型、语义角色标注模型和情感分析模型,所述通过预训练的文档解析深度学习模型,对所述待转换文档进行解析,得到关键信息,包括:
3.根据权利要求1所述的方法,其特征在于,所述通过预训练的网页模板推荐引擎和所述文档内容特征,得到目标网页模板,包括:
4.根据权利要求1所述的方法,其特征在于,所述将关键信息中的文档内容数据对应填充到所述目标网页模板,并生成对应的初始网页,包括:
...【专利技术属性】
技术研发人员:周俊熙,龚宇,刘繁,沈建雄,
申请(专利权)人:小芒电子商务有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。