一种基于深度学习的问卷真实性认定方法

未命名 10-19 阅读:123 评论:0


1.本发明属于特征提取和聚合算法技术领域,涉及一种基于深度学习的问卷真实性认定方法。


背景技术:

2.在当前信息时代,互联网的普及和数字化调查的广泛应用使得问卷调查成为了收集和分析数据的重要手段。然而,随之而来的是问卷伪造和信息不真实等问题的出现。传统的问卷真实性认定方法主要依赖于人工判断和统计分析,存在着主观性和局限性的问题。人工判断往往受到调查员主观意识和个人偏见的影响,导致真实性判断结果不准确或存在误判的可能性。同时,针对大规模数据的处理和分析工作变得繁重和耗时,传统方法的效率难以满足需求。因此需要一种更加高效、智能的针对问卷真实性的判断方法,实现对问卷真实性的认定并分类,提高问卷结果可靠性。


技术实现要素:

3.针对以上问题,本发明提供了一种基于卷积神经网络的问卷真实性认定方法,能对问卷真实性进行判断,识别异常问卷,辅助用户进行筛选并获得可靠的调查结果。
4.一种基于深度学习的问卷真实性认定方法,其特征在于,根据用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量,对问卷的真实性分成4个等级并用one-hot编码,将编码结果作为问卷真实性标签。使用softmax、leaky relu和elu函数作为不同网络层的激活函数搭建神经网络模型,使用收集到的问卷填写数据与已经分好类的问卷标签训练模型。当需要判断问卷真实性时,根据问卷填写总时间、每道题用时和每道题修改答案次数作为问卷特征,将特征数据投入训练完成的神经网络对问卷真实性进行判定;其中包括后台获取问卷填写总时间、每道题用时和每道题修改答案次数,建立问卷真实性标签步骤101、搭建神经网络模型步骤102、使用获取的问卷特征和问卷标签训练神经网络模型步骤103、训练模型用于问卷真实性辅助判定步骤104,建立问卷类别标签步骤101从步骤201到步骤205:
5.步骤201:设问卷填写总时间数据集为x={x1,x2,

,xn}, n表示问卷编号,xn表示编号为n的问卷填写用时;
6.步骤 202:设问卷每道题用时数据集为y={y1n,y2n,
ꢀ…
,ymn},m表示问卷题目序号,n表示问卷编号,ymn表示编号为n的问卷的每道题目用时;
7.步骤203:设问卷每道题修改次数数据集为z={z1n,z2n,
ꢀ…
,zmn},m表示问卷题目序号,n表示问卷编号,zmn表示编号为n的问卷每道题目的修改次数;
8.步骤204:合并数据集x,y,z形成问卷特征矩阵s;
9.步骤205:将问卷分为四个真实性等级,并用one-hot编码,作为问卷真实标签y*;
10.搭建神经网络模型步骤102从步骤301到步骤305:
11.步骤301:输入层使用softmax函数作为激活函数进行搭建,24个输入维度,160个
神经元;
12.步骤302:设置5层神经网络层,并使用leaky relu作为激活函数,每层160个神经元;
13.步骤303:最后一层神经网络层使用elu作为激活函数进行搭建,共4个神经元;
14.步骤304:整个神经网络使用多分类交叉熵损失函数作为损失函数,并使用随机梯度下降作为优化函数;
15.步骤305:设置学习效率为0.001,批训练数量为100,迭代200次;
16.使用提取的问卷特征和问卷标签训练神经网络模型步骤103从步骤401到步骤416:
17.步骤401:定义循环变量为t,并赋初值t=1;
18.步骤402:当t《=200执行步骤403,否则执行步骤416;
19.步骤403:定义循环变量为k,并赋初值k=1;
20.步骤404:将问卷特征矩阵分批,每批包含100个问卷的特征矩阵;
21.步骤405:当k《=7执行步骤405,否则执行步骤407;
22.步骤406:矩阵sk经过以leaky relu函数作为激活函数的的神经网络;
23.步骤407:设第一层神经网络的结果矩阵ck;
24.步骤408:矩阵ck经过以elu为激活函数的5层神经网络;
25.步骤409:设经过神经网络的结果为dk;
26.步骤410:矩阵dk经过以softmax为激活函数的的神经网络;
27.步骤411:设经过最后一层神经网络的结果为y’;
28.步骤412:使用k-means聚类算法对y’进行聚合;
29.步骤413:设聚合后的结果为y^;
30.步骤414:计算问卷真实标签y*和y^之间的损失,更新神经网络连接函数的权值;
31.步骤415:k=k+5;
32.步骤416:模型训练完毕;
33.训练模型用于问卷真实性辅助认定步骤104从步骤501到步骤503:
34.步骤501:从用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量提取问卷特征值,设特征矩阵为sm;
35.步骤502:将问卷特征矩阵投入训练好的神经网络模型中;
36.步骤503:获得问卷的分类结果;
37.进一步的,所述步骤101中,前端需要记录下用户填写问卷时的数据,包括:用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量,并在用户提交问卷后将此数据同时上传到服务器。
38.进一步的,所述步骤102中,获取用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量作为问卷特征。使用one-hot编码将问卷真实性分为四个等级,将编码结果作为问卷真实性类别标签。使用leaky relu、elu和softmax函数作为隐藏层中不同神经网络层的激活函数搭建神经网络模型,用提取的问卷特征和问卷真实性类别数据训练模型。
39.进一步的,所述步骤103中,其特征在于,利用神经网络层的最后一层的输出结果,
使用k-means算法对输出结果进行聚合,作为最终的卷积输出。
附图说明
40.图1为问卷真实性认定方法概要图。
41.图2为问卷特征提取流程。
42.图3为搭建神经网络流程。
43.图4为问卷认定模型训练流程。
44.图5为问卷真实性辅助认定流程。
具体实施方式
45.下面结合附图对本发明的技术方案进行详细说明:
46.如附图2,从用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户
47.做出的连续相同答复的题目数量数据提取问卷特征步骤101从步骤201到步骤205:
48.步骤201:设问卷填写总时间数据集为x={x1,x2,

,xn}, n表示问卷编号,xn表示编号为n的问卷填写用时;
49.步骤 202:设问卷每道题用时数据集为y={y1n,y2n,
ꢀ…
,ymn},m表示问卷题目序号,n表示问卷编号,ymn表示编号为n的问卷的每道题目用时;
50.步骤203:设问卷每道题修改次数数据集为z={z1n,z2n,
ꢀ…
,zmn},m表示问卷题目序号,n表示问卷编号,zmn表示编号为n的问卷每道题目的修改次数;
51.步骤204:合并数据集x,y,z形成问卷特征矩阵s;
52.步骤205:将问卷分为四个真实性等级,并用one-hot编码,作为问卷真实标签y*;
53.如附图3,搭建神经网络模型步骤102从步骤301到步骤304:
54.步骤301:输入层使用leaky relu函数作为激活函数进行搭建,24个输入维度,160个神经元;
55.步骤302:设置5层神经网络层,并使用elu作为激活函数,每层160个神经元;
56.步骤303:最后一层神经网络层使用softmax作为激活函数进行搭建,共4个神经元;
57.步骤304:整个神经网络使用多分类交叉熵损失函数作为损失函数,并使用随机梯度下降作为优化函数;
58.步骤305:设置学习效率为0.001,批训练数量为100,迭代200次;
59.如附图4,使用提取的问卷特征和问卷标签训练神经网络模型步骤103从步骤401到步骤416:
60.步骤401:定义循环变量为t,并赋初值t=1;
61.步骤402:当t《=200执行步骤403,否则执行步骤416;
62.步骤403:定义循环变量为k,并赋初值k=1;
63.步骤404:将问卷特征矩阵分批,每批包含100个问卷的特征矩阵;
64.步骤405:当k《=7执行步骤405,否则执行步骤407;
65.步骤406:矩阵sk经过以leaky relu函数作为激活函数的的神经网络;
66.步骤407:设第一层神经网络的结果矩阵ck;
67.步骤408:矩阵ck经过以elu为激活函数的5层神经网络;
68.步骤409:设经过神经网络的结果为dk;
69.步骤410:矩阵dk经过以softmax为激活函数的的神经网络;
70.步骤411:设经过最后一层神经网络的结果为y’;
71.步骤412:使用k-means聚类算法对y’进行聚合;
72.步骤413:设聚合后的结果为y^;
73.步骤414:计算问卷真实标签y*和y^之间的损失,更新神经网络连接函数的权值;
74.步骤415:k=k+5;
75.步骤416:模型训练完毕;
76.如附图5,训练模型用于问卷真实性辅助认定步骤104从步骤501到步骤503;
77.步骤501:从用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量提取问卷特征值,设特征矩阵为sm;
78.步骤502:将问卷特征矩阵投入训练好的神经网络模型中;
79.步骤503:获得问卷的分类结果;
80.本发明创造性的提出了一种基于深度学习的问卷真实性认定方法,先从用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量数据提取问卷特征,将问卷分为4个真实性等级并用one-hot编码,将编码结果作为问卷真实性类别标签。再使用提取的特征和类别标签训练搭建的神经网络模型。最后提取待确定类别的问卷特征,将特征放入训练好的神经网络模型,得到问卷类别。

技术特征:
1.一种基于深度学习的问卷真实性认定方法,其特征在于,根据用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量,对问卷的真实性分成4个等级并用one-hot编码,将编码结果作为问卷真实性标签;使用softmax、leaky relu和elu函数作为不同网络层的激活函数搭建神经网络模型,使用收集到的问卷填写数据与已经分好类的问卷标签训练模型;当需要判断问卷真实性时,根据问卷填写时的各项信息作为问卷特征,将特征数据投入训练完成的神经网络对问卷真实性进行判定;其中包括后台获取数据,建立问卷标签步骤101、搭建神经网络模型步骤102、使用获取的问卷特征和问卷标签训练神经网络模型步骤103、训练模型用于问卷真实性辅助判定步骤104,建立问卷标签步骤101从步骤201到步骤205:步骤201:设问卷填写总时间数据集为x={x1,x2,

,xn}, n表示问卷编号,xn表示编号为n的问卷填写用时;步骤 202:设问卷每道题用时数据集为y={y1n,y2n,
ꢀ…
,ymn},m表示问卷题目序号,n表示问卷编号,ymn表示编号为n的问卷的每道题目用时;步骤203:设问卷每道题修改次数数据集为z={z1n,z2n,
ꢀ…
,zmn},m表示问卷题目序号,n表示问卷编号,zmn表示编号为n的问卷每道题目的修改次数;步骤204:合并数据集x,y,z形成问卷特征矩阵s;步骤205:将问卷分为四个真实性等级,并用one-hot编码,作为问卷真实标签y*;搭建神经网络模型步骤102从步骤301到步骤305:步骤301:输入层使用leaky relu函数作为激活函数进行搭建,24个输入维度,160个神经元;步骤302:设置5层神经网络层,并使用elu作为激活函数,每层160个神经元;步骤303:最后一层神经网络层使用softmax作为激活函数进行搭建,共4个神经元;步骤304:整个神经网络使用多分类交叉熵损失函数作为损失函数,并使用随机梯度下降作为优化函数;步骤305:设置学习效率为0.001,批训练数量为100,迭代200次;使用提取的问卷特征和问卷标签训练神经网络模型步骤103从步骤401到步骤416:步骤401:定义循环变量为t,并赋初值t=1;步骤402:当t<=200执行步骤403,否则执行步骤416;步骤403:定义循环变量为k,并赋初值k=1;步骤404:将问卷特征矩阵分批,每批包含100个问卷的特征矩阵;步骤405:当k<=7执行步骤405,否则执行步骤407;步骤406:矩阵sk经过以leaky relu函数作为激活函数的的神经网络;步骤407:设第一层神经网络的结果矩阵ck;步骤408:矩阵ck经过以elu为激活函数的5层神经网络;步骤409:设经过神经网络的结果为dk;步骤410:矩阵dk经过以softmax为激活函数的的神经网络;步骤411:设经过最后一层神经网络的结果为y’;步骤412:使用k-means聚类算法对y’进行聚合;步骤413:设聚合后的结果为y^;
步骤414:计算问卷真实标签y*和y^之间的损失,更新神经网络连接函数的权值;步骤415:k=k+5;步骤416:模型训练完毕;训练模型用于问卷真实性辅助认定步骤104从步骤501到步骤503:步骤501:从用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量提取问卷特征值,设特征矩阵为sm;步骤502:将问卷特征矩阵投入训练好的神经网络模型中;步骤503:获得问卷的分类结果。2.根据权利要求1所述一种基于深度学习的问卷真实性认定方法,其特征在于,前端需要记录下用户填写问卷时的数据,包括:用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量,并在用户提交问卷后将此数据同时上传到服务器。3.根据权利要求1所述一种基于深度学习的问卷真实性认定方法,其特征在于,获取用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量作为问卷特征;使用one-hot编码将问卷真实性分为四个等级,将编码结果作为问卷真实性类别标签;使用leaky relu、elu和softmax函数作为隐藏层中不同神经网络层的激活函数搭建神经网络模型,用提取的问卷特征和问卷真实性类别数据训练模型。4.根据权利要求1所述一种基于深度学习的问卷真实性认定方法,其特征在于,利用神经网络层的最后一层的输出结果,使用k-means算法对输出结果进行聚合,作为最终的卷积输出。

技术总结
本发明公开了一种基于深度学习的问卷真实性认定方法,本发明从用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量数据中提取问卷特征,将问卷分为4个贫困等级并用one-hot编码,将编码结果作为问卷类别标签。使用提取的特征和类别标签训练搭建好的神经网络模型。当需对问卷真实性做出判断时,提取用户填写问卷的总时间,每道题的用时,每道题修改答案的次数以及用户做出的连续相同答复的题目数量数据的特征,经过神经网络模型预测后得出问卷真实性类别。并将结果用于问卷真实性的辅助认定。助认定。助认定。


技术研发人员:卢贤睿 董明刚 崇庆 武天昊 夏令富 谭若琪
受保护的技术使用者:桂林理工大学
技术研发日:2023.06.09
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐