【技术实现步骤摘要】
一种文本内容划词标识的方法及装置
本专利技术涉及资源共享
,尤其涉及一种文本内容划词标识的方法及装置。
技术介绍
内容标识又称内容标引,即给内容添加关键字标签或分类标签,是内容检索、分类基础。总体来说,内容标识分为人工标识、计算机自动标识、计算机辅助标识(推荐标识,让人工进一步选择确认)。近年来,随着自然语言处理技术的发展,文本内容的计算机自动标识技术取得了长足的进步,在通用领域如财经、体育有着较高的准确度。但在许多应用场景、特别是垂直行业领域,依然是人工标识的方法。手势的应用在移动设备上应用较多,但基本都是对应预设的指令,比如翻页、解锁,切换等动作。鼠标手势(按住鼠标左键或右键,移动鼠标形成轨迹)应用相对较少,但也全都是对应指定的动作。划词功能在搜索上应用较多,但在内容标识上未见报道。现有技术中,自动标识系统在垂直行业的应用有以下难点:1.准确度不高,无法满足企业高标准的需求。2.第三方开放平台无法满足企业的个性化需求。垂直行业领域,需要建立专门的行业本体,并需求大量的行业语料做样本训练,才可以做关键词提取、内容分类。腾讯、阿里、百度到那个第三方NLP(自 ...
【技术保护点】
1.一种文本内容划词标识的方法,适于在计算设备中执行,其特征在于,至少包括如下步骤:识别鼠标手势;在预定义库中查询与所述鼠标手势对应的维度,并确定与所述维度对应的目标表和匹配方法;将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户;根据选定的匹配结果,生成标签,并将所述标签存入用户页面缓存区;重复上述步骤,直至响应用户的保存指令,将所述用户页面缓存区的所有标签插入到数据库表中,作为文本内容的标识数据。
【技术特征摘要】
1.一种文本内容划词标识的方法,适于在计算设备中执行,其特征在于,至少包括如下步骤:识别鼠标手势;在预定义库中查询与所述鼠标手势对应的维度,并确定与所述维度对应的目标表和匹配方法;将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户;根据选定的匹配结果,生成标签,并将所述标签存入用户页面缓存区;重复上述步骤,直至响应用户的保存指令,将所述用户页面缓存区的所有标签插入到数据库表中,作为文本内容的标识数据。2.根据权利要求1所述的文本内容划词标识的方法,其特征在于,当用户只选定匹配结果时,所述标签为二元组标签,包括维度和属性值;当用户同时选定匹配结果和关联度时,所述标签为三元组标签,包括维度、属性值和关联度。3.根据权利要求1所述的文本内容划词标识的方法,其特征在于,在识别鼠标手势之前,还包括:预定义鼠标手势和维度的关系,以及维度与目标表和匹配方法的关系。4.根据权利要求1所述的文本内容划词标识的方法,其特征在于,所述鼠标手势为以选定文本内容中的部分连续字符串区域为起始位置,划词的移动轨迹。5.根据权利要求1所述的文本内容划词标识的方法,其特征在于,在所述将所述鼠标手势所选定的字符串作为关键词,在所述目标表中使用所述匹配方法,对所述关键词进行匹配,并将匹配结果呈现给用户之后,还包括:当所述匹配结果为两个及以上时,根据用户选定的匹配结果获取数据表中对应的ID;当所述匹配结果为一个时,直接选定该匹配结果,并获取数据表中对应的ID。6.根据权利要求1所述的文本内容划词标识的方法,其特征在于,所述标识数据的...
【专利技术属性】
技术研发人员:成洪山,吴忠辉,
申请(专利权)人:广州市西美信息科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。