【技术实现步骤摘要】
汉藏语多方言多模态的资源推荐方法和装置
[0001]本申请涉及推荐
,具体涉及一种汉藏语多方言多模态的资源推荐方法和装置。
技术介绍
[0002]我国西藏地区幅员辽阔,各地方言相差很大。藏语分为卫藏、康、安多三种方言,同时西藏也在大力推广汉语普通话,所以西藏当地居民养成了藏语方言和汉语同时使用的日常习惯。同时,藏语各方言在文字写法上基本相同,但口语发音上差异较大,各方言之间的人群往往无法采用藏语进行流畅交流,需要使用汉语。
[0003]市面上基于推荐引擎为主打造的信息流内容推荐产品,例如各种社交平台,主要采用汉语提供内容推荐服务,还没有为西藏当地居民量身打造的内容推荐产品。
[0004]例如,藏族安多方言的同胞采用安多方言录制的短视频,如果通过推荐产品推送给卫藏方言的藏族人群,虽然卫藏方言的同胞可以通过阅读字幕文字或听取语音转录合成后的卫藏语音结果进行理解,但阅读字幕会消耗用户的时间精力,语音合成目前的技术水平无法完美的还原音色,这些方法都不能带来很好的用户体验。
技术实现思路
[0005]为至少在一定程度上克服相关技术中存在的多方言/语种场景下资源内容匹配推荐效果较差的问题,本申请提供一种汉藏语多方言多模态的资源推荐方法和装置。
[0006]根据本申请实施例的第一方面,提供一种汉藏语多方言多模态的资源推荐方法,包括如下步骤:识别出每一条内容资源所属的语种/方言类型,根据识别结果给所述内容资源打上相应的资源
‑
语言类型标签;提取用户的语言类型和兴趣点;从 ...
【技术保护点】
【技术特征摘要】
1.一种汉藏语多方言多模态的资源推荐方法,其特征在于,包括如下步骤:识别出每一条内容资源所属的语种/方言类型,根据识别结果给所述内容资源打上相应的资源
‑
语言类型标签;提取用户的语言类型和兴趣点;从各种类型的内容资源中筛选出第一内容资源,将所述第一内容资源在对应的目标人群内进行冷启试探;根据冷启试探结果从所述第一内容资源中筛选出第二内容资源,将所述第二内容资源在多语言人群间进行传播扩散。2.根据权利要求1所述的汉藏语多方言多模态的资源推荐方法,其特征在于,所述资源
‑
语言类型标签的种类包括:图文
‑
汉语、图文
‑
藏语、短视频
‑
汉语、短视频
‑
卫藏方言、短视频
‑
康方言和/或短视频
‑
安多方言。3.根据权利要求2所述的汉藏语多方言多模态的资源推荐方法,其特征在于,识别出每一条内容资源所属的语种/方言类型,包括如下步骤:调用现有通用的藏汉多模态机器翻译技术接口,将每条内容资源识别出所属的语种/方言类型;将多模态的内容资源统一翻译成汉语文字存储入内容模型;其中,多模态的内容资源包括:藏语图文文字、藏语短视频方言语音和/或藏语短视频字幕。4.根据权利要求1所述的汉藏语多方言多模态的资源推荐方法,其特征在于,从各种类型的内容资源中筛选出第一内容资源,包括如下步骤:针对每一种类型的内容资源,通过先验质量资源筛选,筛选出第一内容资源。5.根据权利要求1
‑
4任一项所述的汉藏语多方言多模态的资源推荐方法,其特征在于,将所述第一内容资源在对应的目标人群内进行冷启试探,包括如下步骤:获取预设的多语种/方言对应关系;根据第一内容资源的语言类型确定对应的目标语言人群;将第一内容资源推送给目标语言人群,进行冷启试探。6.根据权利要求5所述的汉藏语多方言多模态的资源推荐方法,其特征在于,预设的多语种/方言对应关系包括:图文
‑
汉语类型的内容资源对应汉语用户、卫藏方言用户、康方言用户和安多方言用户;图文
‑
藏语类型的内容资源对应卫藏方言用户、康方言用户和安多方言用户;短视频
‑
...
【专利技术属性】
技术研发人员:于满泉,莫倩,王升,张传文,贾承斌,朱若曦,央金拉姆,
申请(专利权)人:网智天元科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。