当前位置: 首页 > 专利查询>易征宇专利>正文

基于人工智能的起名方法技术

技术编号:23239400 阅读:49 留言:0更新日期:2020-02-04 18:39
本发明专利技术公开基于人工智能的起名方法,涉及计算机自然语言处理技术和机器学习。主要解决计算机起名过程中筛选规则刚性、可选模式有限、重名率偏高、风格迁移困难、个性化定制不足、排序输出不优等问题。方法如下:训练词向量模型获得字词向量集,训练排序模型获得打分函数;由使用者提供任意名字本身作为模板,或/和对名字的要求作为标签,从字词向量集中查找模板、标签和预提供名字的字词向量,通过计算向量距离,获得相关性最高的多个候选名字,由打分函数计算得分并排序输出。本发明专利技术能够帮助使用者获得与模板风格相似、意象关联,与标签要求符合、好名优先的候选名字序列,达到在更高起点上提高计算机起名效果与效率的目的。

Naming method based on Artificial Intelligence

【技术实现步骤摘要】
基于人工智能的起名方法
本申请涉及计算机自然语言处理技术和机器学习,具体涉及基于人工智能的起名方法。
技术介绍
每个自然人和机构都有起名需求:新生儿出生后需要取名上户口,户籍登记后可能会改名,机构发起或变更时同样需要起名或改名,为了让名字具有良好的意蕴、深刻的内涵、清晰的发音,人们往往会花费大量时间找出候选名字依次斟酌,但由于个体水平差异,往往费时颇多而收效不尽如人意。互联网相关网站和计算机中有关程序已经可以提供计算机自动起名功能,从公开文献和互联网搜索的结果来看,目前的计算机起名主要包括以下模式:模式1.基于民俗设计显式规则对名字库中名字进行筛选;模式2.输入文本形式起名要求后,从一个更大文本集或名字库中采用字符直接命中规则进行摘抄;模式3.是对模式2的扩展,由使用者提供一个名字范例,基于汉语字词的读音、字形、含义规则对该范例进行一轮扩展,扩大字符命中和摘抄的范围,其中基于字词含义的扩展主要靠查字典辞典、预设同义词表或联想词表进行;模式4.预设数目有限的类别,每个类别有固定的常用字和常用名,根据使用者意愿与预设类别的匹配度,将最相似类本文档来自技高网...

【技术保护点】
1.基于人工智能的起名方法,其特征在于:根据使用者提供的任意名字作为模板,或/和对名字的要求作为标签,基于词向量模型和排序模型,生成候选名字序列。/n

【技术特征摘要】
1.基于人工智能的起名方法,其特征在于:根据使用者提供的任意名字作为模板,或/和对名字的要求作为标签,基于词向量模型和排序模型,生成候选名字序列。


2.根据权利要求1所述基于人工智能的起名方法,其特征在于:所述模板是使用者希望获得的候选名字范例,所述标签是使用者对名字意蕴的要求;模板和标签数量任意、可以是文字、图片、音频、视频等数据格式;所有模板和标签组成集合T。


3.根据权利要求1所述基于人工智能的起名方法,其特征在于:所述词向量模型,经语料库训练后,可以生成字词向量集V;所述语料库通过对预先搜集的文本集清洗、分词、去停用词和高频词后获得;字词向量集V中包含语料库中字词的特征向量;从V中查找模板和标签集合T中元素的字词向量,得到V的子集VT;同样从V中查找预设名字集H中所有名字对应的字词向量,得到V的另一个子集VH,计算VH中每个向量与VT所有向量在向量空间中距离,获得与模板和标签距离最小、相关度最大的x个名字。


4.根据权利要求3所述的向量在向量空间中距离,用于表征名字与模板或标签的相关度;对于模板和标签的集合T={T1,T2,...Ti,...Tn)、名字集合H={H1,H2,...,Hj,...Hm)来说,如果V同时收录了任意Ti和Hj对应的字词向量,那么直接计算字词向量间距离可获得Ti和Hj的相关度;如果V没有同时收录Ti和Hj的字词向量,但收录了组成Ti和Hj的所有单个文字的字词向量,且单个文字数目相等均为s时,分别计算Ti和Hj对应顺位上文字的字词向量距离,获得距离序列D={D1,D2,...,Dk,...Ds),其中Dk是Ti与Hj各自第k个文字的字词向量距离,此时Ti和Hj的相关度为


5.根据权利要求4所述的向量空间中距离,其特征在于距离的类型包括但不限于余弦夹角(Cosine)、欧氏距离(EuclideanDistance)、马氏距离(MahalanobisDistance)、曼哈顿距离(ManhattanDistance)、切比雪夫距离(ChebyshevDistance)、相关系数(Correlationcoefficient)等;本发明的一个优选实施例采用将余弦夹角和欧氏距离归一化后加权求和的方式计算;另一个优选实施例采用将余弦夹角和马氏距离归一化后加权求和的方法。


6.根据权利要求1所述的基于人工智能的起名方法,特征在于所述排序模型采用的算法:包括但不限于基于listwise的ListNet、ListMLE等算法,或基于Pairwise的RankNet、LambdaRank等算法;本发明的一个优选实施例采用ListMLE算法;考虑到计算复杂度,另一个优选实施例采用LambdaMART算法;采用上述各类算法的模型通过对训练数据的学习后可得到...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:易征宇
类型:发明
国别省市:北京;11

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1