语料资源的展示方法及装置、存储介质、电子装置制造方法及图纸

技术编号：26690326 阅读：37 留言：0更新日期：2020-12-12 02:40

本发明专利技术提供了一种语料资源的展示方法及装置、存储介质、电子装置，其中，该方法包括：通过阅读器获取待翻译的源语料资源，其中，所述源语料资源为第一语种的语料资源；根据单词属性在所述源语料资源中选择目标单词集合；获取所述目标单词集合中每个单词的释义内容，其中，所述释义内容为第二语种的语料资源；在所述阅读器中展示所述源语料资源和所述释义内容。通过本发明专利技术，解决了相关技术中不能在源语料资源中自动匹配和展示释义内容的技术问题，实现了一种选择性自动翻译的方案，减少了全篇翻译的时间，同时避免了用户不关注的释义内容在阅读器中占用大量篇幅。

全部详细技术资料下载

【技术实现步骤摘要】
语料资源的展示方法及装置、存储介质、电子装置
本专利技术涉及数据处理领域，具体而言，涉及一种语料资源的展示方法及装置、存储介质、电子装置。
技术介绍
相关技术中，用户为了掌握某种语言，如英语，会使用到学习软件，如词典软件，翻译软件，通过学习任务来提升语言能力。相关技术中，在学习软件中的助读功能通常是简单的翻译功能，通过输入单词或者是文本，助读模块将其翻译成中文或者是目标语种，首先是获取源语料的形式单一，用户只能手动输入或者是文本复制，不能获取网页或者是文档中的语料，其次，通过粗暴的通篇翻译，而用户往往只关注文本中少数生僻的或者正在学习中的词汇，很难在长篇的翻译稿中找到需要释义的内容，用户体验不好。针对相关技术中存在的上述问题，目前尚未发现有效的解决方案。
技术实现思路
本专利技术实施例提供了一种语料资源的展示方法及装置、存储介质、电子装置。根据本专利技术的一个实施例，提供了一种语料资源的展示方法，包括：通过阅读器获取待翻译的源语料资源，其中，所述源语料资源为第一语种...

【技术保护点】
1.一种语料资源的展示方法，其特征在于，包括：/n通过阅读器获取待翻译的源语料资源，其中，所述源语料资源为第一语种的语料资源；/n根据单词属性在所述源语料资源中选择目标单词集合；/n获取所述目标单词集合中每个单词的释义内容，其中，所述释义内容为第二语种的语料资源；/n在所述阅读器中展示所述源语料资源和所述释义内容。/n

【技术特征摘要】
1.一种语料资源的展示方法，其特征在于，包括：
通过阅读器获取待翻译的源语料资源，其中，所述源语料资源为第一语种的语料资源；
根据单词属性在所述源语料资源中选择目标单词集合；
获取所述目标单词集合中每个单词的释义内容，其中，所述释义内容为第二语种的语料资源；
在所述阅读器中展示所述源语料资源和所述释义内容。

2.根据权利要求1所述的方法，其特征在于，根据单词属性在所述源语料资源中选择目标单词集合包括以下至少之一：
根据单词的难度属性在所述源语料资源中选择第一目标单词集合，其中，所述难度属性用于表征单词的难度级别；
根据单词的状态属性在所述源语料资源中选择第二目标单词集合，其中，所述状态属性用于表征单词的用户掌握状态。

3.根据权利要求1所述的方法，其特征在于，根据单词属性在所述源语料资源中选择目标单词集合包括：
计算所述源语料资源每个单词的出现频率；
在所述源语料资源中选择出现频率在预定范围内的第三目标单词集合。

4.根据权利要求3所述的方法，其特征在于，计算所述源语料资源每个单词的出现频率包括：
在所述源语料资源提取单词属性为生词的第一单词集合；
计算所述第一单词集合中每个单词的出现频率。

5.根据权利要求1所述的方法，其特征在于，通过阅读器获取待翻译的源语料资源包括以下之一：
将所述阅读器中加载的源文本上传至网络服务器，其中，所述网络服务器用于通过自然语言处理算法对所述源文本中的语料资源进行分词，将分词后单词的变形形态还原成原始形态，得到目标文本，将目标文本封装成超文本标记语言HTML静态文件；接收所述网络服务器回传的所述HTML静态文件；
通过js注入将所述阅读器中输入网址的网页HTML源码上传至服务器，其中，所述网络服务器用于获取所述输入网址的网页元素中的源文本文件，通过自然语言处理算法对所述文本文件中的语料资源进行分词，将分词后单词的变形形态还原成原始形态，得到目标文本，将目标文本封装成map文件；通过js接口接收所述网络服务器回传的所述map文件；将所述输入网址的网页中的源文本文件替换为所述map文件。

6.根据权利要求1所述的方法，其特征在于，通过阅读器获取待翻译的源语料资源包括：
通过阅读器提取源文本中的第一语料资源；
通过自然语言处理算法对所述第一语料资源进行分词，并将分词后单词的变形形态还原成原始形态，得到第二语料资源。

7.根据权利要求1所述的方法，其特征在于，通过阅读器获取待翻译的源语料资源包括：
通过阅读器中的浏览器组件加载源网页的网页元素，其中，所述网页元素包括以下至少之一：文本、图片、链接；
提取所述网页元素中的文本内容，得到第三语料资源；
通过自然语言处理算法对所述第三语料资源进行分词，并将分词后单词的变形形态还原成原始形态，得到第四语料资源。

8.根据权利要求1所述的方法，其特征在于，在所述阅读器中展示所述源语料资源和所述释义内容包括：
在所述源语料资源中...

【专利技术属性】
技术研发人员：李明，夏文兵，代云兴，刘效宇，李上，
申请(专利权)人：完美世界控股集团有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人