【技术实现步骤摘要】
【技术保护点】
一种基于用户反馈的训练语料收集系统,其特征在于,该系统包括应用客户端和服务器端,所述客户端和服务器之间以HTTP协议传输数据;所述应用客户端内安装有应用程序模块,通过应用程序模块使用户输入信息并对信息分词识别;应用客户端将输入信息以XML文件格式传输给服务器;所述服务器中包括识别系统和数据库两部分,所述识别系统是已经训练好的条件随机场模型;所述识别系统负责解析XML文件,解析之后得到用户输入信息的字符串,将字符串顺序送入条件随机场模型中进行分词,再根据应用本身的特点对分词结果进行处理,得到用户需要的信息,服务器将该信息返回给用户;当用户接收到信息之后,会根据信息结果的不同产生不同的反应:如果返回结果正确,用户接下来会继续下一步操作;反之,如果返回结果错误,用户会放弃现有的操作或者重新进行前一步的操作,客户端根据用户操作行为判断此次分词结果的正确与否并将结果返回给服务器,服务器将根据此结果对用户输入的信息分词决定是否要放入数据库;所述数据库采用MySQL数据库,即用来存储已经识别好的带有标注的训练语料。
【技术特征摘要】
【专利技术属性】
技术研发人员:蒋昌俊,程久军,陈闳中,闫春钢,何良华,侯静玉,
申请(专利权)人:同济大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。