一种笔录数据案由分类方法、终端设备及存储介质技术

技术编号：27849332 阅读：63 留言：0更新日期：2021-03-30 13:09

本发明专利技术涉及一种笔录数据案由分类方法、终端设备及存储介质，该方法中包括：S1：采集所有案由类型的笔录数据组成训练集，并对训练集中每个笔录数据的类型进行标注；S2：设置特征词词典，根据特征词词典提取训练集中每个笔录数据的所有特征词，并组成特征词集合；S3：根据训练集计算其对应的概率模型；S4：针对待分类笔录数据，根据特征词词典提取待分类笔录数据的所有特征词并组成特征词集合后，根据特征词集合和训练集对应的概率模型计算待分类笔录数据对应的类别。本发明专利技术通过对历史笔录数据中类型的概率进行统计，实现对案由的自动分类。实现对案由的自动分类。实现对案由的自动分类。

全部详细技术资料下载

【技术实现步骤摘要】
一种笔录数据案由分类方法、终端设备及存储介质

[0001]本专利技术涉及案件笔录领域，尤其涉及一种笔录数据案由分类方法、终端设备及存储介质。

技术介绍

[0002]笔录是公安机关用于对证人、被害人、嫌疑人等进行记录问话信息的文档，而案由可以简要概述这份笔录的问话类型，案由会自动关联到笔录的案由属性，以便执法人员后续对笔录的自动归类。案由预测在执法人员对被询问人制作笔录时常常会出现忘记填写、无法分类或输入错误案由的情况。

技术实现思路

[0003]为了解决上述问题，本专利技术提出了一种笔录数据案由分类方法、终端设备及存储介质。
[0004]具体方案如下：
[0005]一种笔录数据案由分类方法，包括以下步骤：
[0006]S1：采集所有案由类型的笔录数据组成训练集，并对训练集中每个笔录数据的类型进行标注；
[0007]S2：设置特征词词典，根据特征词词典提取训练集中每个笔录数据的所有特征词，并组成特征词集合；
[0008]S3：根据训练集计算其对应的概率模型，概率模型中包括以下概率：P(y
j
)、P(X
i
|y
j
)、P(X
i
)，其中，y
j
表示第j个类型，P(.)表示概率，X
i
表示第i个特征词集合，X
i
＝{x1,x2,
…
,x
k
}，x1,x2,
…
,x
k
表示第...

【技术保护点】

【技术特征摘要】
1.一种笔录数据案由分类方法，其特征在于，包括以下步骤：S1：采集所有案由类型的笔录数据组成训练集，并对训练集中每个笔录数据的类型进行标注；S2：设置特征词词典，根据特征词词典提取训练集中每个笔录数据的所有特征词，并组成特征词集合；S3：根据训练集计算其对应的概率模型，概率模型中包括以下概率：P(y
j
)、P(X
i
|y
j
)、P(X
i
)，其中，y
j
表示第j个类型，P(.)表示概率，X
i
表示第i个特征词集合，X
i
＝{x1,x2,
…
,x
k
}，x1,x2,
…
,x
k
表示第1，2，
…
，k个特征词；P(X
i
|y
j
)表示已知y
j
的情况下X
i
的概率；j∈[1，m]，m表示训练集中所有笔录数据的类型的总数，i∈[1，n]，n表示训练集中所有笔录数据包含的特征词集合的总数；S4：针对待分类笔录数据，根据特征词词典提取待分类笔录数据的所有特征词并组成特征词集合后，根据特征词集合和训练集对应的概率模型计算待分类笔录数据对应的类别。2.根据权利要求1所述的笔录数据案由分类方法，其特征在于：步骤S1还包括对组成训练集的笔录数据进行过滤，剔除无效的笔...

【专利技术属性】
技术研发人员：张云生，蔡鹏辉，
申请(专利权)人：厦门市法度信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人