用户数据更新方法及装置制造方法及图纸

技术编号:10515557 阅读:127 留言:0更新日期:2014-10-08 15:07
本公开是关于一种用户数据更新方法及装置,属于电子出版物领域。所述方法包括:获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;在修订后的该电子出版物中对该原文字符串进行匹配;在匹配成功时,根据匹配结果更新该用户数据中的引用内容,得到更新后的该用户数据。所述装置包括:获取模块、匹配模块和更新模块。本公开通过获取用户数据引用的原文字符串,在修订后的电子出版物只能够对该原文字符串进行匹配,根据匹配结果更新用户数据中引用内容。节省了生成Patch文件的计算代价,且本公开实施例提供的用户数据更新方法无需单独维护,使用范围较广。

【技术实现步骤摘要】
用户数据更新方法及装置
本公开涉及电子出版物领域,特别涉及一种用户数据更新方法及装置。
技术介绍
电子出版物以其修订周期短、修订代价低的优势,越来越受人们的喜爱。在阅读电子出版物时,用户可以生成诸如书签、批注和书摘等用户数据。这些用户数据包括:引用内容和针对该引用内容的用户阅读信息。用户数据中的引用内容一般利用物理偏移量来表示。也即,一个引用内容可以用(位置,长度)来表示,其中‘位置’表示了引用内容在整本电子出版物中的文本偏移位置,‘长度’表示了引用内容的文本长度。比如,一个批注可以表示为“引用内容(第120305字符,共32个字符),批注内容(这段文字写的真好)”。但是由于电子出版物可能会发生多次修订,在电子出版物中的内容发生增删之后,利用物理偏移量表示的引用内容很可能会发生改变。为此,相关技术提供了一种用户数据更新方法:在电子出版物发生修订时,采用类似Patch(补丁)文件的方式,记录每个版本详细的修订记录,通过该修订记录来重新计算用户数据中的引用内容。公开人在实现本公开的过程中,发现上述方式至少存在如下缺陷:由于Patch文件在生成时计算代价非常高,且需要单独维护,所以上述用户数据更新方法不利于大范围使用。
技术实现思路
为了解决相关技术中Patch文件在生成时计算代价非常高,且需要单独维护,上述用户数据更新方法不利于大范围使用的问题,本公开实施例提供了一种用户数据更新方法及装置,所述技术方案如下:根据本公开实施例的第一方面,提供一种用户数据更新方法,该方法包括:获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;在修订后的该电子出版物中对该原文字符串进行匹配;在匹配成功时,根据匹配结果更新该用户数据中的引用内容,得到更新后的该用户数据。一个实施例,该在修订后的该电子出版物中对该原文字符串进行匹配,包括:在修订后的该电子出版物中对该原文字符串直接进行匹配;或,对该原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的该电子出版物中按序对该n个句子进行匹配;或,在修订后的该电子出版物中对该原文字符串直接进行匹配;在直接匹配不成功时,对该原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的该电子出版物中按序对该n个句子进行匹配。一个实施例,该在修订后的该电子出版物中按序对该n个句子进行匹配,包括:从搜索起始位置对第i个句子进行匹配,1≤i≤n;当i=1时,该搜索起始位置为该原文字符串所在章节的起始位置;在该第i个句子匹配成功时,将该搜索起始位置更新为该第i个句子的匹配内容的结束位置,并从更新后的该搜索起始位置对第i+1个句子进行匹配,i+1≤n;在该第i个句子匹配不成功时,从该第i个句子所对应的搜索位置对第i+1个句子进行匹配;在该n个句子全部匹配后,若存在与该n个句子完全匹配的匹配内容或存在与该n个句子部分匹配但匹配程度属于预定匹配范围的匹配内容时,确定分句匹配成功。一个实施例,该方法还包括:若该n个句子中匹配成功的最先一个句子不是第1个句子,则将该第1个句子至该匹配成功的最先一个句子之前的所有句子进行分词,得到按序排列的m个分词,m为正整数;从该匹配成功的最先一个句子的匹配内容的起始位置开始,逆序对该m个分词进行匹配;将匹配成功的最后一个分词的匹配内容的起始位置作为该原文字符串在修订后的该电子出版物中所对应的起始位置。一个实施例,该方法还包括:若该n个句子中匹配成功的最后一个句子不是第n个句子,则将该匹配成功的最后一个句子之后至该第n个句子之间的所有句子进行分词,得到按序排列的q个分词,q为正整数;从该匹配成功的最后一个句子的匹配内容的结束位置开始,顺序对该q个分词进行匹配;将匹配成功的最后一个分词的匹配内容的结束位置作为该原文字符串在修订后的该电子出版物中所对应的结束位置。根据本公开实施例的第二方面,提供一种用户数据更新装置,该装置包括:获取模块,被配置为获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;匹配模块,被配置为在修订后的该电子出版物中对该原文字符串进行匹配;更新模块,被配置为在匹配成功时,根据匹配结果更新该用户数据中的引用内容,得到更新后的该用户数据。一个实施例,该匹配模块,被配置为在修订后的该电子出版物中对该原文字符串直接进行匹配;或,该匹配模块,被配置为对该原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的该电子出版物中按序对该n个句子进行匹配;或,该匹配模块,被配置为在修订后的该电子出版物中对该原文字符串直接进行匹配;在直接匹配不成功时,对该原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的该电子出版物中按序对该n个句子进行匹配。一个实施例,该匹配模块,包括:匹配单元,被配置为从搜索起始位置对第i个句子进行匹配,1≤i≤n;当i=1时,该搜索起始位置为该原文字符串所在章节的起始位置;位置更新单元,被配置为在该第i个句子匹配成功时,将该搜索起始位置更新为该第i个句子的匹配内容的结束位置,并从更新后的该搜索起始位置对第i+1个句子进行匹配,i+1≤n;继续匹配单元,被配置为在该第i个句子匹配不成功时,从该第i个句子所对应的搜索位置对第i+1个句子进行匹配;确定单元,被配置为在该n个句子全部匹配后,若存在与该n个句子完全匹配的匹配内容或存在与该n个句子部分匹配但匹配程度属于预定匹配范围的匹配内容时,确定分句匹配成功。一个实施例,该装置还包括:第一分词单元,被配置为在该n个句子中匹配成功的最先一个句子不是第1个句子时,将该第1个句子至该匹配成功的最先一个句子之前的所有句子进行分词,得到按序排列的m个分词,m为正整数;分词匹配单元,被配置为从该匹配成功的最先一个句子的匹配内容的起始位置开始,逆序对该m个分词进行匹配;起始确定单元,被配置为将匹配成功的最后一个分词的匹配内容的起始位置作为该原文字符串在修订后的该电子出版物中所对应的起始位置。一个实施例,第二分词单元,被配置为在该n个句子中匹配成功的最后一个句子不是第n个句子,则将该匹配成功的最后一个句子之后至该第n个句子之间的所有句子进行分词,得到按序排列的q个分词,q为正整数;分词匹配单元,被配置为从该匹配成功的最后一个句子的匹配内容的结束位置开始,顺序对该q个分词进行匹配;结束确定单元,被配置为将匹配成功的最后一个分词的匹配内容的结束位置作为该原文字符串在修订后的该电子出版物中所对应的结束位置。根据本公开实施例的第三方面,提供一种用户数据更新装置,该装置包括:处理器;用于存储该处理器的可执行指令的存储器;其中,该处理器被配置为:获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;在修订后的该电子出版物中对该原文字符串进行匹配;在匹配成功时,根据匹配结果更新该用户数据中的引用内容,得到更新后的该用户数据。本公开实施例提供的技术方案可以包括以下有益效果:通过获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;在修订后的该电子出版物中对该原文字符串进行匹配;在匹配成功时,根据匹配结果更新该用户数据中的引用内容,得到更新后的该用户数据。采用本公开实施例提供的用户数据更新方法,节省了生成Patch文件的计算代价,且本公开本文档来自技高网...
用户数据更新方法及装置

【技术保护点】
一种用户数据更新方法,其特征在于,所述方法包括:获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;在修订后的所述电子出版物中对所述原文字符串进行匹配;在匹配成功时,根据匹配结果更新所述用户数据中的引用内容,得到更新后的所述用户数据。

【技术特征摘要】
1.一种用户数据更新方法,其特征在于,所述方法包括:获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;在修订后的所述电子出版物中对所述原文字符串进行匹配;在匹配成功时,根据匹配结果更新所述用户数据中的引用内容,得到更新后的所述用户数据;所述在修订后的所述电子出版物中对所述原文字符串进行匹配,包括:对所述原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的所述电子出版物中按序对所述n个句子进行匹配;或,在修订后的所述电子出版物中对所述原文字符串直接进行匹配;在直接匹配不成功时,对所述原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的所述电子出版物中按序对所述n个句子进行匹配;所述在修订后的所述电子出版物中按序对所述n个句子进行匹配,包括:从搜索起始位置对第i个句子进行匹配,1≤i≤n;当i=1时,所述搜索起始位置为所述原文字符串所在章节的起始位置;在所述第i个句子匹配成功时,将所述搜索起始位置更新为所述第i个句子的匹配内容的结束位置,并从更新后的所述搜索起始位置对第i+1个句子进行匹配,i+1≤n;在所述第i个句子匹配不成功时,从所述第i个句子所对应的搜索位置对第i+1个句子进行匹配;在所述n个句子全部匹配后,若存在与所述n个句子完全匹配的匹配内容或存在与所述n个句子中的部分个句子匹配,但匹配程度属于预定匹配范围时,确定分句匹配成功,所述匹配程度为匹配到的字符串的长度与所述原文字符串的长度的比值。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述n个句子中匹配成功的最先一个句子不是第1个句子,则将所述第1个句子至所述匹配成功的最先一个句子之前的所有句子进行分词,得到按序排列的m个分词,m为正整数;从所述匹配成功的最先一个句子的匹配内容的起始位置开始,逆序对所述m个分词进行匹配,所述从所述匹配成功的最先一个句子的匹配内容的起始位置开始,逆序对所述m个分词进行匹配包括:从所述匹配成功的最先一个句子的匹配内容的起始位置开始向第1个句子的起始位置匹配,在匹配的过程中,从所述m个分词中逆序地取词进行匹配;将匹配成功的最后一个分词的匹配内容的起始位置作为所述原文字符串在修订后的所述电子出版物中所对应的起始位置。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述n个句子中匹配成功的最后一个句子不是第n个句子,则将所述匹配成功的最后一个句子之后至所述第n个句子之间的所有句子进行分词,得到按序排列的q个分词,q为正整数;从所述匹配成功的最后一个句子的匹配内容的结束位置开始,顺序对所述q个分词进行匹配;将匹配成功的最后一个分词的匹配内容的结束位置作为所述原文字符串在修订后的所述电子出版物中所对应的结束位置。4.一种用户数据更新装置,其特征在于,所述装置包括:获取模块,被配置为获取用户数据中的引用内容在修订前的电子出版物中所对应的原文字符串;匹配模块,被配置为在修订后的所述电子出版物中对所述原文字符串进行匹配;更新模块,被配置为在匹配成功时,根据匹配结果更新所述用户数据中的引用内容,得到更新后的所述用户数据;所述匹配模块,被配置为对所述原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的所述电子出版物中按序对所述n个句子进行匹配;或,所述匹配模块,被配置为在修订后的所述电子出版物中对所述原文字符串直接进行匹配;在直接匹配不成功时,对所述原文字符串进行分句,得到按序排列的n个句子,n为正整数;在修订后的所述电子出版物中按序对所述n个句子进行匹配;所述匹配模块,包括:匹配单元,被配置为从搜索起始位置对第i个句子进行匹配,1≤i≤n;当i=1...

【专利技术属性】
技术研发人员:张磊
申请(专利权)人:小米科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1