【技术实现步骤摘要】
用户数据更新方法及装置
本公开涉及电子出版物领域,特别涉及一种用户数据更新方法及装置。
技术介绍
电子出版物以其修订周期短、修订代价低的优势,越来越受人们的喜爱。在阅读电子出版物时,用户可以生成诸如书签、批注和书摘等用户数据。这些用户数据包括:引用内容和针对该引用内容的用户阅读信息。用户数据中的引用内容一般利用物理偏移量来表示。也即,一个引用内容可以用(位置,长度)来表示,其中‘位置’表示了引用内容在整本电子出版物中的文本偏移位置,‘长度’表示了引用内容的文本长度。比如,一个批注可以表示为“引用内容(第120305字符,共32个字符),批注内容(这段文字写的真好)”。但是由于电子出版物可能会发生多次修订,在电子出版物中的内容发生增删之后,利用物理偏移量表示的引用内容很可能会发生改变。为此,相关技术提供了一种用户数据更新方法:在电子出版物发生修订时,采用类似Patch(补丁)文件的方式,记录每个版本详细的修订记录,通过该修订记录来重新计算用户数据中的引用内容。公开人在实现本公开的过程中,发现上述方式至少存在如下缺陷:由于Patch文件在生成时计算代价非常高,且需要单独维护,所以上述用户数据更新方法不利于大范围使用。
技术实现思路
为了解决相关技术中Patch文件在生成时计算代价非常高,且需要单独维护,上述用户数据更新方法不利于大范围使用的问题,本公开实施例提供了一种用户数据更新方法及装置,所述技术方案如下:根据本公开实施例的第一方面,提供一种用户数据更新方法,该方法包括:获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;在修订后的该电子出版物中对 ...
【技术保护点】
一种用户数据更新方法,其特征在于,所述方法包括:获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;在修订后的所述电子出版物中对所述原文字符串进行匹配;在匹配成功时,根据匹配结果更新所述用户数据中的引用内容,得到更新后的所述用户数据。
【技术特征摘要】
1.一种用户数据更新方法,其特征在于,所述方法包括:获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;在修订后的所述电子出版物中对所述原文字符串进行匹配;在匹配成功时,根据匹配结果更新所述用户数据中的引用内容,得到更新后的所述用户数据;所述在修订后的所述电子出版物中对所述原文字符串进行匹配,包括:对所述原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的所述电子出版物中按序对所述n个句子进行匹配;或,在修订后的所述电子出版物中对所述原文字符串直接进行匹配;在直接匹配不成功时,对所述原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的所述电子出版物中按序对所述n个句子进行匹配;所述在修订后的所述电子出版物中按序对所述n个句子进行匹配,包括:从搜索起始位置对第i个句子进行匹配,1≤i≤n;当i=1时,所述搜索起始位置为所述原文字符串所在章节的起始位置;在所述第i个句子匹配成功时,将所述搜索起始位置更新为所述第i个句子的匹配内容的结束位置,并从更新后的所述搜索起始位置对第i+1个句子进行匹配,i+1≤n;在所述第i个句子匹配不成功时,从所述第i个句子所对应的搜索位置对第i+1个句子进行匹配;在所述n个句子全部匹配后,若存在与所述n个句子完全匹配的匹配内容或存在与所述n个句子中的部分个句子匹配,但匹配程度属于预定匹配范围时,确定分句匹配成功,所述匹配程度为匹配到的字符串的长度与所述原文字符串的长度的比值。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述n个句子中匹配成功的最先一个句子不是第1个句子,则将所述第1个句子至所述匹配成功的最先一个句子之前的所有句子进行分词,得到按序排列的m个分词,m为正整数;从所述匹配成功的最先一个句子的匹配内容的起始位置开始,逆序对所述m个分词进行匹配,所述从所述匹配成功的最先一个句子的匹配内容的起始位置开始,逆序对所述m个分词进行匹配包括:从所述匹配成功的最先一个句子的匹配内容的起始位置开始向第1个句子的起始位置匹配,在匹配的过程中,从所述m个分词中逆序地取词进行匹配;将匹配成功的最后一个分词的匹配内容的起始位置作为所述原文字符串在修订后的所述电子出版物中所对应的起始位置。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述n个句子中匹配成功的最后一个句子不是第n个句子,则将所述匹配成功的最后一个句子之后至所述第n个句子之间的所有句子进行分词,得到按序排列的q个分词,q为正整数;从所述匹配成功的最后一个句子的匹配内容的结束位置开始,顺序对所述q个分词进行匹配;将匹配成功的最后一个分词的匹配内容的结束位置作为所述原文字符串在修订后的所述电子出版物中所对应的结束位置。4.一种用户数据更新装置,其特征在于,所述装置包括:获取模块,被配置为获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;匹配模块,被配置为在修订后的所述电子出版物中对所述原文字符串进行匹配;更新模块,被配置为在匹配成功时,根据匹配结果更新所述用户数据中的引用内容,得到更新后的所述用户数据;所述匹配模块,被配置为对所述原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的所述电子出版物中按序对所述n个句子进行匹配;或,所述匹配模块,被配置为在修订后的所述电子出版物中对所述原文字符串直接进行匹配;在直接匹配不成功时,对所述原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的所述电子出版物中按序对所述n个句子进行匹配;所述匹配模块,包括:匹配单元,被配置为从搜索起始位置对第i个句子进行匹配,1≤i≤n;当i=1...
【专利技术属性】
技术研发人员:张磊,
申请(专利权)人:小米科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。