下载文本串的二次散列提取的技术资料

文档序号:5408948

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明涉及数据压缩和关键词识别。第一遍走查文本串、生成各个项、为每个生成项计算散列值。对于每个散列值,创建一个散列桶,其中维护相关联的出现计数。散列桶可以根据出现计数进行排序,并且少数几个排在前面的桶得到保留。一旦知道了这些排在前面的桶,则...
该专利属于微软公司所有,仅供学习研究参考,未经过微软公司授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。