号码分类方法和装置制造方法及图纸

技术编号:29255904 阅读:18 留言:0更新日期:2021-07-13 17:27
本申请实施例提供的号码分类方法和装置,能够提高号码分类的精确性。该方法包括:确定终端上待分类的目标号码;将所述目标号码和所述目标号码的分类参考信息输入号码分类模型,得到所述目标号码的分类结果,所述目标号码的分类参考信息用于对所述目标号码进行分类,所述目标号码的分类结果用于指示所述目标号码所属的分类,所述号码分类模型是利用训练数据样本集训练得到的,所述训练数据样本集中包括多个号码、所述多个号码中每个号码的分类结果和对所述每个号码进行分类所使用的分类参考信息。

【技术实现步骤摘要】
号码分类方法和装置
本申请涉及终端
,并且更具体地,涉及终端
中的号码分类方法和装置。
技术介绍
随着互联网技术的不断发展,人们的隐私泄露越来越普遍,诈骗、保险、推销等骚扰电话趋于定向化,严重影响人们的日常生活,如何对骚扰号码进行有效分辨成为亟待解决的问题。现有的号码分类方法,主要通过引导广大用户在终端侧对陌生号码所属的号码分类进行标记,并将标记后的号码传输至云端进行存储。然而,由于现有的号码分类方法依赖用户标记的数据,很多用户没有主动标记号码所属的号码分类的意愿,甚至还有部分用户恶意标记号码所属的号码分类,这样一来,号码分类的精确性较低。
技术实现思路
本申请实施例提供一种号码分类方法和装置,能够提高号码分类的精确性。第一方面,本申请实施例提供一种号码分类方法,所述方法包括:确定终端上待分类的目标号码;将所述目标号码和所述目标号码的分类参考信息输入号码分类模型,得到所述目标号码的分类结果,所述目标号码的分类参考信息用于对所述目标号码进行分类,所述目标号码的分类结果用于指示所述目标号码所属的分类,所述号码分类模型是利用训练数据样本集训练得到的,所述训练数据样本集中包括多个号码、所述多个号码中每个号码的分类结果和对所述每个号码进行分类所使用的分类参考信息。采用本申请实施例提供的号码分类方法,通过多维度信息训练得到的号码分类模型对目标号码进行分类,能够提高号码分类的精确性。在一种可能的实现方式中,所述目标号码的分类参考信息包括以下信息中的至少一项:所述目标号码的通话语音中包括的关键词、所述终端的通讯录、所述终端的通话记录、所述终端的短消息、所述终端的应用数据或所述终端的传感器数据,其中,所述传感器数据用于指示所述终端的运动状态。可选地,所述目标号码的分类参考信息可以包括以下信息中的至少一项:(1)所述目标号码的通话语音中包括的关键词。所述目标号码的通话语音中包括的关键词是指所述目标号码的通话语音中属于所述关键词分类词库的多个关键词。其中,所述关键词分类词库包括多个分类以及所述多个分类中每个分类包括的关键词。例如,所述关键词分类词库包括推销—教育推销分类和推销—保险推销分类两种分类,其中,推销—教育推销分类包括的关键词有:精品课程、优秀教师、寒假补课班、同步辅导、五年高考三年模拟、课外辅导、课时安排、教育机构、学校等;推销—保险推销分类包括的关键词有:寿险、财产险、保额、受益人、保费、利率、重疾险、意外险等。需要说明的是,上面的例子仅以该关键词分类词库包括两种分类为例,该关键词分类词库中还可以包括其他分类,以及其它分类包括的关键词,本申请实施例对此不作限定。可选地,所述目标号码的分类参考信息还可以包括所述通话语音中包括的每个关键词所属的分类。例如,目标号码的通话语音中包括寿险、重疾险等关键词,则可以根据关键词分类词库初步判断这些关键词属于推销—保险推销分类,并把初步判断的分类结果作为分类参考信息进行进一步分类。(2)所述终端的通讯录。例如:所述终端的通讯录中包括联系人、联系人的号码、联系人所属的分组等。(3)所述终端的通话记录。例如:通话记录中所述目标号码的通话频率、通话时长等。(4)所述终端的短消息。例如:短消息内容中包括的关键词、每个关键词所属的分类等。(5)所述终端的应用数据。所述终端的应用数据是指所述终端的各应用中与通讯相关的信息。例如:所述目标号码的分类参考信息可以包括购物或外卖软件中卖家的电话信息以及快递员的电话信息。(6)所述终端的传感器数据。其中,所述传感器数据用于指示所述终端的运动状态。例如:所述目标号码的分类信息可以包括所述终端的加速度传感器、重力传感器、三轴姿态传感器等的数据。可选地,所述目标号码的分类参考信息还可以包括上述(1)~(6)中每个信息的衍生信息。例如,通讯录中还可以包括所述目标号码与其他联系人是否有关联,如所述目标号码与其他联系人是否为微信好友等。可选地,可以根据预设的规则,确定所述目标号码的分类结果。可选地,上述预设的规则可以包括以下规则中的至少一项:(1)若通讯录中包括所述目标号码,且所述通讯录中所述目标号码的标记信息为亲朋好友,则直接将该标记信息指示的分类确定为所述目标号码的分类结果。需要说明的是,所述通讯录中所述目标号码的标记信息可以包括联系人名称、联系人分组、联系人备注等。(2)若从应用数据中能够获取所述目标号码所属的分类的相关信息,则直接将该应用数据确定的分类确定为所述目标号码的分类结果。(3)若本地存储所述目标号码和所述目标号码的分类结果之间的映射关系,则根据该映射关系确定所述目标号码的分类结果。可选地,所述终端可以为通过预设的规则确定所述目标号码的分类结果,和通过号码分类模型确定所述目标号码的分类结果设置优先级,根据两者的优先级情况,采用相应的方法确定所述目标号码的分类结果。在第一种可能的实现方式中,规则的优先级可以高于号码分类模型的优先级。也就是说,如果所述终端能通过所述预设的规则判定所述目标号码的分类结果,就可以直接将通过所述规则判定的结果作为所述目标号码的分类结果,无需通过号码分类模型进行号码分类,能够提高分类的效率和精确性。在第二种可能的实现方式中,规则的优先级可以低于号码分类模型的优先级。也就是说,所述终端将通过所述号码分类模型判定的结果作为所述目标号码的分类结果,无需通过规则进行号码分类,能够提高分类效率和精确性。在第三种可能的实现方式中,规则的优先级可以等于号码分类模型的优先级。也就是说,所述终端可以根据号码分类模型确定出的第一分类结果和根据预设的规则确定出的第二分类结果,确定所述目标号码的分类结果。需要说明的是,所述第一分类结果可以包括至少一个第一分类和所述目标号码属于所述至少一个第一分类中每个第一分类的概率值,所述第二分类结果可以包括至少一个第二分类和所述目标号码属于所述至少一个第二分类中每个第二分类的概率值。其中,“第一”分类和“第二”分类仅用于区分属于不同的分类结果。可选地,所述终端可以通过多种方式根据所述第一分类结果和所述第二分类结果,确定所述目标号码的分类结果,本申请实施例对此不作限定。在第一种可能的实现方式中,所述终端可以判断两个分类结果中概率值最大的分类是否一致;若一致,则根据预设的第一分类结果和第二分类结果的权重,对所述第一分类结果和所述第二分类结果中概率值最大的分类的概率值进行加权,得到目标概率值,并将概率值最大的分类和所述目标概率值确定为所述目标号码的分类结果。例如:以第一分类结果和第二分类结果的权重均为0.5为例,第一分类结果包括分类1—75%、分类2—52%、分类3—37%,第二分类结果包括分类1—85%、分类3—48%、分类4—4%时,目标号码的分类结果为分类1—80%。在第二种可能的实现方式中,所述终端可以判断两个本文档来自技高网...

【技术保护点】
1.一种号码分类方法,其特征在于,包括:/n确定终端上待分类的目标号码;/n将所述目标号码和所述目标号码的分类参考信息输入号码分类模型,得到所述目标号码的分类结果,所述目标号码的分类参考信息用于对所述目标号码进行分类,所述目标号码的分类结果用于指示所述目标号码所属的分类,所述号码分类模型是利用训练数据样本集训练得到的,所述训练数据样本集中包括多个号码、所述多个号码中每个号码的分类结果和对所述每个号码进行分类所使用的分类参考信息。/n

【技术特征摘要】
1.一种号码分类方法,其特征在于,包括:
确定终端上待分类的目标号码;
将所述目标号码和所述目标号码的分类参考信息输入号码分类模型,得到所述目标号码的分类结果,所述目标号码的分类参考信息用于对所述目标号码进行分类,所述目标号码的分类结果用于指示所述目标号码所属的分类,所述号码分类模型是利用训练数据样本集训练得到的,所述训练数据样本集中包括多个号码、所述多个号码中每个号码的分类结果和对所述每个号码进行分类所使用的分类参考信息。


2.根据权利要求1所述的方法,其特征在于,所述目标号码的分类参考信息包括以下信息中的至少一项:
所述目标号码的通话语音中包括的关键词、所述终端的通讯录、所述终端的通话记录、所述终端的短消息、所述终端的应用数据或所述终端的传感器数据,其中,所述传感器数据用于指示所述终端的运动状态。


3.根据权利要求1或2所述的方法,其特征在于,在所述将所述目标号码和所述目标号码的分类参考信息输入号码分类模型,得到所述目标号码的分类结果之前,所述方法还包括:
确定是否存在预设的规则;
若存在所述规则,则根据所述规则,确定所述目标号码的分类结果。


4.根据权利要求1或2所述的方法,其特征在于,所述号码分类模型输出的是第一分类结果,所述方法还包括:
根据预设的规则,确定第二分类结果;
根据所述第一分类结果和所述第二分类结果,确定所述目标号码的分类结果。


5.根据权利要求3或4所述的方法,其特征在于,所述规则包括以下各项中的任一项:
若通讯录中包括所述目标号码,且所述通讯录中的所述目标号码被标记为亲戚分类或朋友分类,则将所述通讯录中所述目标号码被标记的分类确定为所述目标号码的分类结果;或,
若所述终端的应用数据中包括用于确定所述目标号码所属分类的应用信息,则根据所述目标号码和所述应用信息,确定所述目标号码的分类结果;或,
若本地存储有所述目标号码和所述目标号码的分类结果之间的映射关系,则根据所述目标号码和所述映射关系,确定所述目标号码的分类结果。


6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
当所述目标号码的分类结果为诈骗分类的概率值大于预设的第一概率值时,对所述目标号码的分类结果进行验证,得到验证结果,所述验证结果用于验证所述目标号码的分类结果是否正确。


7.根据权利要求6所述的方法,其特征在于,所述对所述目标号码的分类结果进行验证,得到验证结果,包括:
从所述目标号码的通话语音中提取来电人的声纹;
根据所述来电人的声纹,对所述目标号码的分类结果进行验证,得到所述验证结果。


8.根据权利要求7所述的方法,其特征在于,所述根据所述来电人的声纹,对所述目标号码的分类结果进行验证,得到所述验证结果,包括:
对所述来电人的声纹进行声纹检测,得到声纹检测结果,所述声纹检测结果用户指示所述来电人的声纹是否为仿冒的或合成的;
根据所述声纹检测结果,确定所述验证结果。


9.根据权利要求7所述的方法,其特征在于,所述根据所述来电人的声纹,对所述目标号码的分类结果进行验证,得到所述验证结果,包括:
将所述来电人的声纹与声纹黑名单进行比对,确定所述声纹黑名单中是否包括第一声纹,所述第一声纹与所述来电人的声纹的相似度大于预设的第一阈值;
当所述声纹黑名单中包括所述第一声纹时,确定所述验证结果正确;
当所述声纹黑名单中不包括所述第一声纹时,确定所述验证结果不正确。


10.根据权利要求6所述的方法,其特征在于,所述对所述目标号码的分类结果进行验证,得到验证结果,包括:
根据所述目标号码、所述目标号码的分类参考信息和知识图谱,对所述目标号码的分类结果进行验证,得到所述验证结果,所述知识图谱包括多个号码之间的关联关系以及所述多个号码对应的多个联系人之间的关联关系。


11.根据权利要求1至10中任一项所述的方法,其特征在于,所述确定终端上待分类的目标号码,包括:
在所述终端收到来电时,响应于用户在来电显示界面上触发的号码分类请求,确定所述号码分类请求中携带的所述目标号码;或,
在所述终端接收到来电时,将所述来电显示的号码确定为所述目标号码。


12.根据权利要求1至11中任一项所述的方法所述的方法,其特征在于,在所述将所述目标号码和所述目标号码的分类参考信息输入号码分类模型,得到所述目标号码的分类结果之前,所述方法还包括:
周期性从服务器下载所述号码分类模型;或,
向所述服务器发送模型请求,并接收所述服务器根据所述模型请求发送的所述号码分类模型。


13.根据权利要求1至12中任一项所述的方法,其特征在于,所述方法还包括:
根据所述目标号码的分类结果,对所述目标号码进行号码管理。


14.根据权利要求13所述的方法,其特征在于,所述号码管理包括以下各项中的至少一项:
在所述终端处于免打扰状态下,若所述目标号码为属于预设的第一分类的非重要来电,则对所述目标号码进行自动拦截;或,
若所述目标号码为属于预设的第二分类的重要来电,则提醒用户有重要来电;或,
若所述目标号码属于目标通话主题,则为所述用户推荐符合所述目标通话主题的好友或应用,其中,所述目标通话主题是根据所述目标号码的分类结果和主题参考信息确定的,所述主题参考信息包括所述终端的通话记录、网络浏览记录或所述目标号码的通话语音中包括的关键词中的至少一项。


15.根据权利要求1至10中任一项所述的方法,其特征在于,所述确定终端上待分类的目标号码,包括:
接收所述终端发送的分类请求,所述分类请求携带所述目标号码;
根据所述分类请求,确定所述目标号码。


16.根据权利要求1至10中任一项所述的方法,其特征在于,在将所述目标号码和所述目标号码的分类参考信息输入号码分类模型,得到所述目标号码的分类结果之前,所述方法还包括:
接收所述终端发送的所述目标号码的分类参考信息;或,
调取本地存储的所述目标号码的分类参考信息。


17.根据权利要求1至16中任一项所述的方法,其特征在于,所述每个号码的分类结果包括所述每个号码所属的主分类和所述主分类下的至少一级子分类。


18.根据权利要求1至17中任一项所述的方法,其特征在于,所述目标号码的分类结果包括所述目标号码所属的分类和所述目标号码属于所述分类的概率值。


19.一种号码分类方法,其特征在于,包括:
终端向服务器发送号码分类请求,所述号码分类请求包括所述终端上待分类的目标号码和所述目标号码的分类参考信息,所述目标号码的分类参考信息用于所述服务器对所述目标号码进行分类;
所述终端接收所述服务器发送的所述目标号码的分类结果。


20.根据权利要求19所述的方法,其特征在于,所述目标号码的分类参考信息包括以下信息中的至少一项:
所述目标号码的通话语音中包括的关键词、所述终端的通讯录、所述终端的通话记录、所述终端的短消息、所述终端的应用数据或所述终端的传感器数据,其中,所述传感器数据用于指示所述终端的运动状态。


21.根据权利要求19或20所述的方法,其特征在于,在所述终端向服务器发送号码分类请求之前,所述方法还包括:
在所述终端收到来电时,响应于用户在来电显示界面上触发的号码分类请求,确定所述号码分类请求中携带的所述目标号码;或,
在所述终端接收到来电时,将所述来电显示的号码确定为所述目标号码。


22.根据权利要求19至21中任一项所述的方法,其特征在于,在终端向服务器发送号码分类请求之前,所述方法还包括:
所述终端判断当前的网络状态,所述网络状态包括有网状态、断网状态或网络信号不佳;
当所述网络状态为所述有网状态时,所述终端向所述服务器发送所述号码分类请求;
当所述网络状态为所述断网状态或所述网络信号不佳时,所述终端将所述目标号码和所述目标号码的分类参考信息输入本地存储的号码分类模型,得到所述目标号码的分类结果,所述目标号码的分类参考信息用于对所述目标号码进行分类,所述目标号码的分类结果用于指示所述目标号码所属的分类,所述号码分类模型是利用训练数据样本集训练得到的,所述训练数据样本集中包括多个号码、所述多个号码中每个号码的分类结果和对所述每个号码进行分类所使用的分类参考信息。


23.一种号码分类装置,其特征在于,包括:处理器和与所述处理器耦合的收发器;
所述处理器用于确定终端...

【专利技术属性】
技术研发人员:李怡
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1