专利 一种基于图注意力网络和文本信息的认知诊断方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210826338.7 (22)申请日 2022.07.13 (71)申请人浙江工商大学地址 310018 浙江省杭州市下沙高教园区学正街18号 (72)发明人徐斌　蔡跃康　 (74)专利代理机构杭州求是专利事务所有限公司 33200 专利代理师刘静 (51)Int.Cl. G06F 16/33(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 50/20(2012.01) (54)发明名称一种基于图注意力网络和文本信息的认知诊断方法及装置 (57)摘要本发明公开了一种基于图注意力网络和文本信息的认知诊断方法及装置，将学生、习题和知识点映射成独热向量；根据习题和知识点的显式交互计算得到知识点与知识点的局部同构关系依赖图；根据图注意力网络的知识点特征和知识点的语义特征通过全连接层融合图特征和语义特征；根据心理学中的诊断函数和自注意力机制预测学生表现来评估知识点的掌握程度；根据交叉熵损失函数来评估模型收敛程度，根据反向传播算法对模型参数进行训练，直至整个模型网络收敛；通过计算得到模型的损失函数，通过损失函数最小化，获取权重矩阵的最优值，从而提升了评估学生认知水平的精度。权利要求书3页说明书8页附图3页 CN 115238036 A 2022.10.25 CN 115238036 A 1.一种基于图注意力网络和文本信息的认知诊断方法，其特征在于，包括如下步骤： (1)从试题数据集中读取学生答题数据，对学生答题数据进行清洗处理，包括： (1.1)清理原始试题数据集中重复提交的学生答题数据，确保每个学生对每一题只有一次回答情况； (1.2)清理原始试题数据集中响应次数少于设定阈值的学生答题数据； (2)特征提取；将清洗处理后的学生答题数据中有关学生、习题和知识点的特征从响应日志中提取出来； (3)通过图注意力网络和文本信息结合学生、习题、知识点三部分的特征构建认知诊断模型，并且利用学生、习题、知识点之间的特征交互行为评估出学生的认知水平；所述认知诊断模型主要包括以下四部分：数据清理、特征输入、特征融合和特征交互；所述数据清理，用于从试题数据集中读取学生答题数据，并对数据进行清洗处理；所述特征输入，用于从响应日志中获取学生、习题和知识点的特征向量，并且将特征向量进行嵌入表示；所述特征融合，将通过图注意力网络从知识点的特征向量中提取出的特征，以及从知识点文本信息中提取出的词向量特征，通过全连接层神经网络进行特征交互融合，得到新知识点特征向量；将新知识点特征向量通过全连接层神经网络分别与学生特征向量、习题特征向量进行特征交互融合，得到新学生特征向量和新习题特征向量；所述特征交互，首先利用诊断函数对新学生特征向量和新习题特征向量中的潜在特征进行初步诊断，然后再通过自注意力机制进一步对学生、习题和知识点之间进行复杂特征交互并且避免过拟合问题；最后通过预测每个学生的回答准确性来诊断学生当前的认知水平； (4)训练认知诊断模型，利用交叉熵损失函数来评估模型收敛程度，运用反向传播算法对模型参数进行训练，直至整个模型网络收敛； (5)将学生的答题数据输入训练好的认知诊断模型中，得到学生当前的认知水平。 2.根据权利要求1所述的基于图注意力网络和文本信息的认知诊断方法，其特征在于，所述步骤(2)中，将清洗处理后的学生答题数据中有关学生、习题和知识点的特征从响应日志中提取出来，并且定义n个学生集合表示为S＝{s1,s2,s3,…,sn}， m个习题集合表示为P ＝ {p1,p2,p3,…,pm}， t个知识点集合表示为C＝{c1,c2,c3,…,cn}。 3.根据权利要求2所述的基于图注意力网络和文本信息的认知诊断方法，其特征在于，所述步骤(3)中，所述特征融合具体为：将知识点无向图注入到图注意力网络中，并聚合知识点与知识点之间的依赖关系；在教育数据挖掘中，知识点之间存在多个相互依赖和协同交互的关系，通过图注意力网络Gc关联每一个知识点；对于Gc中的任何一个节点，第t层的特征向量ut经过注意力机制聚合后生成新的长度为d的节点特征u′t；在图注意力网络的聚合层中，采用注意力机制进行聚合；假设节点ci到邻节点cj的权重系数的公式如下：其中ReLU( ·)表示ReLU激活函数， Wt表示第t层特征变换的权重参数， σ 表示权重向量， T权　利　要　求　书 1/3 页 2 CN 115238036 A 2表示转置操作， | |表示拼接操作，分别表示节点ci和邻节点cj的特征向量；对每层的中心节点与相邻节点进行sofmax 归一化操作，具体公式如下：其中表示节点ci和邻节点cj的注意力得分，是新生成的节点特征， σ( ·)表示 sigmoid激活函数， Υ(i)为知识点总数；提取知识点文本信息中丰富且有用的隐式信息，利用word2vec根据上下文中语义相似度将单词转换为词向量，并且提取未带标签术语之间的深层次语义关系；对于知识点特征向量和利用余弦相似度将这两个特征向量融合在一起，融合后的特征向量公式如下：其中sim表示特征融合函数，分别为根据和得到的可训练向量；将文本特征和知识点特征进行特征融合，融合后的特征向量hc″即为新知识点特征向量，公式如下：其中Fcc表示全连接层神经网络，表示向量拼接操作， σ( ·)表示sigmo id激活函数；通过将学生特征和习题特征分别与上述知识点特征融合，得到新学生特征向量和新习题特征向量，公式如下：其中hs表示学生认识水平向量， hdiff表示习题难度向量， hs′表示新学生认识水平向量， hdiff′表示新习题难度向量； Fsc和Fdc分别表示全连接层神经网络。 4.根据权利要求3所述的基于图注意力网络和文本信息的认知诊断方法，其特征在于，所述步骤(3)中，通过诊断函数进行初步诊断，公式如下：其中h表示初步诊断结果，表示元素内积， hq表示知识点与习题的关系矩阵。 5.根据权利要求4所述的基于图注意力网络和文本信息的认知诊断方法，其特征在于，所述步骤(3)中，将初步诊断结果h传入注意力层，通过将自注意力的得分和初步诊断结果权　利　要　求　书 2/3 页 3 CN 115238036 A 3

专利 一种基于图注意力网络和文本信息的认知诊断方法及装置

专利一种基于图注意力网络和文本信息的认知诊断方法及装置