通讯录已有联系人的人名抽取方法技术

技术编号:34279107 阅读:106 留言:0更新日期:2022-07-24 17:53
本发明专利技术涉及通信技术领域,且公开了通讯录已有联系人的人名抽取方法,包括以下步骤:S1:先创建信息抽取系统;S2:向信息抽取系统内录入相关信息;S3:识别姓氏;S4:抽取姓氏后,进行检验;S5:输出结果。优选的,所述信息抽取系统内包括存储单元、采集单元、选取单元、抽取单元,存储单元包括创建模块、录入模块、存储模块,创建模块的信号输出端与录入模块的信号接收端连接,录入模块的信号输出端与存储模块的信号接收端连接方便对手机中的联系人进行抽取,在对联系人进行查找的时候,只需要输入关键词即可自动跳出多个软件中的多个备选项,然后根据需要选取即可,不需要一个一个软件中自己翻找,提高效率。提高效率。提高效率。

Name extraction method of existing contacts in address book

【技术实现步骤摘要】
通讯录已有联系人的人名抽取方法


[0001]本专利技术涉及通信
,具体为通讯录已有联系人的人名抽取方法。

技术介绍

[0002]通讯录是互联网用户管理联系人信息的基本工具,当今的通讯录可以涵盖多项内容。如:姓名、电话号码、单位电话、移动电话、传真号、电子邮件、QQ、MSN、个人主页、公司、街道、邮编、生日、大头贴、车牌、银行账号、俱乐部名称、爱好等等。通讯录中的联系人姓名,是一种应用广泛的基础数据,可用于自动抽取人名、自动搜索人名、收发消息自动生成姓名等领域。但用户保存通讯录联系人信息的时候,往往输入不规范、不标准的联系人姓名,导致自动提取人名不精准。因此需要一种通讯录已有联系人的人名抽取方法。

技术实现思路

[0003]本专利技术的目的在于提供了通讯录已有联系人的人名抽取方法,达到解决上述
技术介绍
中提出的问题的目的。
[0004]为实现上述目的,本专利技术提供如下技术方案:通讯录已有联系人的人名抽取方法,包括以下步骤:
[0005]S1:先创建信息抽取系统;
[0006]S2:向信息抽取系统内录入相关信息;
[0007]S3:识别姓氏;
[0008]S4:抽取姓氏后,进行检验;
[0009]S5:输出结果。
[0010]优选的,所述信息抽取系统内包括存储单元、采集单元、选取单元、抽取单元,存储单元包括创建模块、录入模块、存储模块,创建模块的信号输出端与录入模块的信号接收端连接,录入模块的信号输出端与存储模块的信号接收端连接。
[0011]优选的,所述采集单元包括收集模块、分类模块、复查模块,收集模块的信号输出端与分类模块的信号接收端连接,分类模块的信号输出端与复查模块的信号接收端连接。
[0012]优选的,所述选取单元包括识别模块一、识别模块二、识别模块三,识别模块一的信号输出端与识别模块二的信号接收端连接,识别模块二的信号输出端与识别模块三的信号接收端连接。
[0013]优选的,所述抽取单元包括抽取模块、检测模块、数据反馈,抽取模块的信号输出端与检测模块的信号接收端连接,检测模块的信号输出端与数据反馈的信号接收端连接。
[0014]优选的,所述收集模块是对通讯录联系人的名字文本进行收集,通讯录包括手机通讯录、邮箱通讯录、即时通讯软件通讯录、客户关系管理系统通讯录,分类模块是对收集模块中收集的名字文本中的单字进行分词,复查模块是对分类模块中分词过后的结果进行复核。
[0015]优选的,所述识别模块一是对不可单独成词的连体多个姓数据集、不可单独成词
的单个姓数据集进行识别,识别模块二是对可单独成词的连体多个姓数据集、可单独成词的单个姓数据集进行识别,识别模块三用于对混合连体多个姓数据集进行识别。
[0016]优选的,所述抽取模块是对选取单元中的结果进行抽取,检测模块是对抽取模块的结果进行再次检验是否正确,数据反馈是将检测过后的结果进行输出。
[0017]本专利技术提供了通讯录已有联系人的人名抽取方法。具备以下有益效果:本专利技术在抽取单元中,由抽取模块对选取单元中的结果进行抽取,然后通过检测模块对抽取模块的结果进行再次检验是否正确,正确的话由数据反馈将检测过后的结果进行输出,错误的话再由识别模块一、识别模块二、识别模块三进行重新识别,进一步保证了识别结果的正确性。
附图说明
[0018]图1为本专利技术的步骤图;
[0019]图2为本专利技术的系统图。
具体实施方式
[0020]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。
[0021]所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。
[0022]在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。
[0023]在本专利技术中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本专利技术中的具体含义。
[0024]如图1

2所示,本专利技术提供一种技术方案:通讯录已有联系人的人名抽取方法,包括以下步骤:
[0025]S1:先创建信息抽取系统;
[0026]S2:向信息抽取系统内录入相关信息;
[0027]S3:识别姓氏;
[0028]S4:抽取姓氏后,进行检验;
[0029]S5:输出结果。
[0030]信息抽取系统内包括存储单元、采集单元、选取单元、抽取单元,存储单元包括创建模块、录入模块、存储模块,创建模块的信号输出端与录入模块的信号接收端连接,录入
模块的信号输出端与存储模块的信号接收端连接,采集单元包括收集模块、分类模块、复查模块,收集模块的信号输出端与分类模块的信号接收端连接,分类模块的信号输出端与复查模块的信号接收端连接,选取单元包括识别模块一、识别模块二、识别模块三,识别模块一的信号输出端与识别模块二的信号接收端连接,识别模块二的信号输出端与识别模块三的信号接收端连接,抽取单元包括抽取模块、检测模块、数据反馈,抽取模块的信号输出端与检测模块的信号接收端连接,检测模块的信号输出端与数据反馈的信号接收端连接,收集模块是对通讯录联系人的名字文本进行收集,通讯录包括手机通讯录、邮箱通讯录、即时通讯软件通讯录、客户关系管理系统通讯录,分类模块是对收集模块中收集的名字文本中的单字进行分词,复查模块是对分类模块中分词过后的结果进行复核,识别模块一是对不可单独成词的连体多个姓数据集、不可单独成词的单个姓数据集进行识别,识别模块二是对可单独成词的连体多个姓数据集、可单独成词的单个姓数据集进行识别,识别模块三用于对混合连体多个姓数据集进行识别。
[0031]数据库群包括《姓氏词语库群》、《称呼库群》、《字词库群》、《包含姓氏的专用词库群》、《招呼问候礼貌用语库》。
[0032]《姓氏词语库群》包括《不可单独成词的姓氏数据库》、《可单独成词的姓氏数据库》、《不可作名字的禁忌词库》、《姓氏库》。
[0033]《称呼库群》包括《人名称呼库》、《职称本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.通讯录已有联系人的人名抽取方法,其特征在于:包括以下步骤:S1:先创建信息抽取系统;S2:向信息抽取系统内录入相关信息;S3:识别姓氏;S4:抽取姓氏后,进行检验;S5:输出结果。2.根据权利要求1所述的通讯录已有联系人的人名抽取方法,其特征在于:所述信息抽取系统内包括存储单元、采集单元、选取单元、抽取单元,存储单元包括创建模块、录入模块、存储模块,创建模块的信号输出端与录入模块的信号接收端连接,录入模块的信号输出端与存储模块的信号接收端连接。3.根据权利要求2所述的通讯录已有联系人的人名抽取方法,其特征在于:所述采集单元包括收集模块、分类模块、复查模块,收集模块的信号输出端与分类模块的信号接收端连接,分类模块的信号输出端与复查模块的信号接收端连接。4.根据权利要求2所述的通讯录已有联系人的人名抽取方法,其特征在于:所述选取单元包括识别模块一、识别模块二、识别模块三,识别模块一的信号输出端与识别模块二的信号接收端连接,识别模块二的信号输出端与识别模块三的信号接收端连接。5.根据权利要求2所述的通讯录已有联系人的人名抽取方...

【专利技术属性】
技术研发人员:陈包容
申请(专利权)人:长沙鸽儿们智能技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1