版权的多粒度拆分及其商业价值的挖掘方法技术

技术编号：22187367 阅读：12 留言：0更新日期：2019-09-25 03:59

本申请属于人工智能技术领域，进一步地，是涉及版权的多粒度拆分及其商业价值的挖掘方法，包括版权的多粒度拆分方法和版权商业价值的挖掘方法，版权的多粒度拆分方法包括场景角度拆分和特定人物拆分,所述版权的多粒度拆分方法还包括面向全文的语言特征挖掘和以场景角度拆分为基础的场景特征挖掘、人物特征挖掘、人物关系特征挖掘，所述版权商业价值的挖掘方法包括版权题材挖掘、版权质量判定和版权商业价值定价。本申请可以解决现有技术中机器识别无法对版权进行正确的质量判断，易错失优质版权，无法实现基于自动形成的版权质量评估报告，无法构建大规模的版权孵化平台等问题。

Multi-granularity Splitting of Copyright and Its Business Value Mining Method

全部详细技术资料下载

【技术实现步骤摘要】
版权的多粒度拆分及其商业价值的挖掘方法
本申请属于人工智能
，进一步地，是涉及版权的多粒度拆分及其商业价值的挖掘方法。
技术介绍
目前发现优质版权的主要路径为：成名作者的新版权；专业人员的人工评审，如出版公司的图书策划人员、影视公司的项目开发人员，有相当一部分精力放在发现优质版权上；海量用户的试读，如各种网文站点，会分配一部分流量给新网文，再根据后继的阅读深度、口碑等决定该版权的流量分配额度。但一方面现有机器识别效果不佳，相较于人工识别还存在差距，使用机器识别易错过优质版权；成名作者的产量有限，行业需要新作者的不断涌现，以提升版权资源的供给，进而，对新作者的发现能力决定了每个版权孵化公司的收益上限；与此同时，专业人员审核的成本极高，且相对于千万量级的新版权，专业人员能够处理的数量极为有限；此外千万量级的新版权分配至用户试读，会造成极大的用户伤害。
技术实现思路
本申请解决的主要问题是提供版权的多粒度拆分及其商业价值的挖掘方法，以解决现有技术中机器识别版权时，对版权的拆分不完全，导致对版权的认识不完全，从而导致无法对版权进行正确的质量判断，易错失优质版权，与此同时，现有技术中并不存在对版权的商业价值评估，因此无法实现基于自动形成的版权质量评估报告，无法构建大规模的版权孵化平台，与此同时，非机器识别的人工识别审核的成本极高，且相对于千万量级的新版权，专业人员能够处理的数量极为有限，与此同时，由于并没有对版权进行正确的质量判断，如果将千万量级的新版权分配至用户试读，会造成极大的用户伤害等问题。版权的多粒度拆分及其商业价值的挖掘方法，包括版权的多粒度拆分方法和版...

【技术保护点】
1.版权的多粒度拆分及其商业价值的挖掘方法，包括版权的多粒度拆分方法和版权商业价值的挖掘方法，版权的多粒度拆分方法包括场景角度拆分和特定人物拆分,其特征在于，所述版权的多粒度拆分方法还包括面向全文的语言特征挖掘和以场景角度拆分为基础的场景特征挖掘、人物特征挖掘、人物关系特征挖掘，所述版权商业价值的挖掘方法包括版权题材挖掘、版权质量判定和版权商业价值定价。

【技术特征摘要】
1.版权的多粒度拆分及其商业价值的挖掘方法，包括版权的多粒度拆分方法和版权商业价值的挖掘方法，版权的多粒度拆分方法包括场景角度拆分和特定人物拆分,其特征在于，所述版权的多粒度拆分方法还包括面向全文的语言特征挖掘和以场景角度拆分为基础的场景特征挖掘、人物特征挖掘、人物关系特征挖掘，所述版权商业价值的挖掘方法包括版权题材挖掘、版权质量判定和版权商业价值定价。2.根据权利要求1所述的版权的多粒度拆分及其商业价值的挖掘方法，其特征在于，所述全文语言特征挖掘的包括：情感特征挖掘、文采特征挖掘和语义特征挖掘，所述情感特征挖掘包括词情感分布。3.根据权利要求2所述的版权的多粒度拆分及其商业价值的挖掘方法，其特征在于，所述情感特征挖掘包括收集整理常用词的情感取值和统计版权正文中每种词性下的词情感分布(分区间统计)。4.根据权利要求2所述的版权的多粒度拆分及其商业价值的挖掘方法，其特征在于，所述文采特征挖掘包括：词长度分布，统计每种词性下单字词、双字词……N字词的占比情况；词常见性分布，统计每种词性下常见词、非常见词的占比情况(按idf排名分区间统计)；单句中词数量分布，统计每种词性下在单个句子中的数量分布；词丰富度度量，统计每种词性下的词丰富度(用信息熵度量)。5.根据权利要求2所述的版权的多粒度拆分及其商业价值的挖掘方法，其特征在于，所述语义特征挖掘包括：文档的词特征，由信息增益(IG)选取前N个词，统计每个词在当前版权中的tfidf权重；文档的语义分布，由词向量(通过word2vec获得常用词的词向量...

【专利技术属性】
技术研发人员：徐兴军，吴又，杨宇航，
申请(专利权)人：北京云莱坞文化传媒有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人