题库生成方法、服务器及计算机可读存储介质技术

技术编号:17779800 阅读:32 留言:0更新日期:2018-04-22 08:21
本发明专利技术公开了一种题库生成方法,该方法包括:获取招聘网站的招聘职位描述信息;将所述职位描述信息转换成具有完整信息的事实句;将所述事实句按照问题生成模板生成行业问题;将所述行业问题按照行业分类存储,以生成不同行业的题库。本发明专利技术还提供一种服务器及计算机可读存储介质。本发明专利技术提供的题库生成方法、服务器及计算机可读存储介质自动根据招聘职位的描述信息生成行业问题,并按行业分类存储,节省人力。

【技术实现步骤摘要】
题库生成方法、服务器及计算机可读存储介质
本专利技术涉及计算机应用领域,尤其涉及一种题库生成方法、服务器及计算机可读存储介质。
技术介绍
在招聘过程中,面试及笔试可以综合考察应聘者的知识储备、专业技能、思维逻辑及其他素质特征。目前无论是现场笔试、网上测试、面试都是需要招聘方预先根据不同的职位拟好相应的问题,而不能自动根据职位生成问题,给招聘方带来极大的不便。
技术实现思路
有鉴于此,本专利技术提出一种题库生成方法、服务器及计算机可读存储介质,能够根据自动根据招聘职位的描述信息生成行业问题,并按行业分类存储,节省人力。首先,为实现上述目的,本专利技术提出一种题库生成方法,该方法应用于服务器,所述方法包括:获取招聘网站的招聘职位描述信息;将所述职位描述信息转换成具有完整信息的事实句;将所述事实句按照问题生成模板生成行业问题;将所述行业问题按照行业分类存储,以生成不同行业的题库。可选地,所述将所述职位描述信息转换成具有完整信息的事实句的步骤,具体包括如下步骤:将所述职位描述信息的各个词语单独归为一类;根据所述词语之间的亲疏程度,将最可能指代同一实体的词语结合在一起;以逐次聚合的方式将词语聚类,进而分离成几个具有完整信息的事实句。可选地,所述将事实句按照标准语法生成行业问题的步骤,具体包括:将所述事实句分解成树状的语法结构,以分析得到事实句的语法树;解析所述语法树,得到问题的主体部分;调取所述服务器预存储的问题生成模板;将所述问题的主体部分匹配所述问题生成模板,生成行业问题。可选地,所述调取所述服务器预存储的问题生成模板,匹配所述问题的主体部分,生成行业问题的步骤之后,还包括如下步骤:构建标注样本深度学习的文本分类模型;利用所述标注样本深度学习的文本分类模型检查所述行业问题是否通顺;如果所述行业问题语句不通顺,所述标注样本深度学习的文本分类模型调整所述行业问题。可选地,所述将所述行业问题按照行业分类存储,以生成不同行业的题库的步骤,具体包括如下步骤:构建termfrequency–inversedocumentfrequency(TFIDF)模型;利用所述TFIDF模型检查所述行业问题在所述题库中是否已经存在类似的问题;若已经存在类似的行业问题,删除当前生成的所述行业问题。可选地,所述题库生成方法还包括如下步骤:提取所述职位描述的关键词;扩展出与所述关键词有关的相关词;根据所述相关词生成行业问题。此外,为实现上述目的,本专利技术还提供一种服务器,所述服务器包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的题库生成系统,所述题库生成系统被所述处理器执行时实现如下步骤:获取招聘网站的招聘职位描述信息;将所述职位描述信息转换成具有完整信息的事实句;将所述事实句按照问题生成模板生成行业问题;将所述行业问题按照行业分类存储,以生成不同行业的题库。可选地,所述将所述职位描述信息转换成具有完整信息的事实句的步骤,具体包括如下步骤:将所述职位描述信息的各个词语单独归为一类;根据所述词语之间的亲疏程度,将最可能指代同一实体的词语结合在一起;以逐次聚合的方式将词语聚类,进而分离成几个具有完整信息的事实句。可选地,所述将事实句按照标准语法生成行业问题的步骤,具体包括:将所述事实句分解成树状的语法结构,以分析得到事实句的语法树;解析所述语法树,得到问题的主体部分;调取所述服务器预存储的问题生成模板;将所述问题的主体部分匹配所述问题生成模板,生成行业问题。进一步地,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有题库生成系统,所述题库生成系统可被至少一个处理器执行,以使所述至少一个处理器执行如上述的题库生成方法的步骤。相较于现有技术,本专利技术所提出的服务器、题库生成方法及计算机可读存储介质,首先,获取招聘网站的招聘职位描述信息;然后,将所述职位描述信息转换成具有完整信息的事实句;接着,将所述事实句按照问题生成模板生成行业问题;最后,将所述行业问题按照行业分类存储,以生成不同行业的题库。这样,既可以避免现有技术中需要人工根据招聘职位拟好面试、笔试或网上测试的题库的诬陷,也可以自动根据招聘职位的描述信息生成行业问题,并按行业分类存储,节省人力。附图说明图1是本专利技术服务器服务器一可选的硬件架构的示意图;图2是本专利技术题库生成系统第一实施例的程序模块示意图;图3是本专利技术题库生成系统第二实施例的程序模块示意图;图4是本专利技术题库生成系统第三实施例的程序模块示意图;图5为本专利技术题库生成方法第一实施例的流程示意图;图6为本专利技术题库生成方法第二实施例的流程示意图;图7为本专利技术题库生成方法第三实施例的流程示意图。附图标记:本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在本专利技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。参阅图1所示,是本专利技术服务器服务器2一可选的硬件架构的示意图。本实施例中,所述服务器服务器2可包括,但不仅限于,可通过系统总线相互通信连接存储器11、处理器12、网络接口13。需要指出的是,图1仅示出了具有组件11-13的服务器服务器2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述服务器服务器2的内部存储单元,例如该服务器服务器2的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述服务器服务器2的外部存储设备,例如该服务器服务器2上配备的插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器11还可以既包括所述服务器服务器2的内部存储单元也包括其外部存储设备。本实施例中,所述存储器11通常用于存储安装于所述服务器服务器2的操作系统和各类应用软件,例如所述题库生成系统200的程序代码等。此外,所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。所述处理器12在一些实施例中可以是中央处理器(CentralProcessingUnit,CPU)、控制器本文档来自技高网...
题库生成方法、服务器及计算机可读存储介质

【技术保护点】
一种题库生成方法,应用于服务器,其特征在于,所述方法包括:获取招聘网站的招聘职位描述信息;将所述职位描述信息转换成具有完整信息的事实句;将所述事实句按照问题生成模板生成行业问题;将所述行业问题按照行业分类存储,以生成不同行业的题库。

【技术特征摘要】
1.一种题库生成方法,应用于服务器,其特征在于,所述方法包括:获取招聘网站的招聘职位描述信息;将所述职位描述信息转换成具有完整信息的事实句;将所述事实句按照问题生成模板生成行业问题;将所述行业问题按照行业分类存储,以生成不同行业的题库。2.如权利要求1所述的题库生成方法,其特征在于,所述将所述职位描述信息转换成具有完整信息的事实句的步骤,具体包括如下步骤:将所述职位描述信息的各个词语单独归为一类;根据所述词语之间的亲疏程度,将最可能指代同一实体的词语结合在一起;以逐次聚合的方式将词语聚类,进而分离成几个具有完整信息的事实句。3.如权利要求1所述的题库生成方法,其特征在于,所述将事实句按照标准语法生成行业问题的步骤,具体包括:将所述事实句分解成树状的语法结构,以分析得到事实句的语法树;解析所述语法树,得到问题的主体部分;调取所述服务器预存储的问题生成模板;将所述问题的主体部分匹配所述问题生成模板,生成行业问题。4.如权利要求3所述的题库生成方法,其特征在于,所述调取所述服务器预存储的问题生成模板,匹配所述问题的主体部分,生成行业问题的步骤之后,还包括如下步骤:构建标注样本深度学习的文本分类模型;利用所述标注样本深度学习的文本分类模型检查所述行业问题是否通顺;如果所述行业问题语句不通顺,所述标注样本深度学习的文本分类模型调整所述行业问题。5.如权利要求1所述的题库生成方法,其特征在于,所述将所述行业问题按照行业分类存储,以生成不同行业的题库的步骤,具体包括如下步骤:构建termfrequency–inversedocumentfrequency(TFIDF)模型;利用所述...

【专利技术属性】
技术研发人员:徐国强
申请(专利权)人:上海壹账通金融科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1