(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210826338.7
(22)申请日 2022.07.13
(71)申请人 浙江工商大 学
地址 310018 浙江省杭州市下沙高教园区
学正街18号
(72)发明人 徐斌 蔡跃康
(74)专利代理 机构 杭州求是专利事务所有限公
司 33200
专利代理师 刘静
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 40/30(2020.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06Q 50/20(2012.01)
(54)发明名称
一种基于图注意力网络和文本信息的认知
诊断方法及装置
(57)摘要
本发明公开了一种基于图注意力网络和文
本信息的认知诊断方法及装置, 将学生、 习题和
知识点映射成独热向量; 根据习题和知识点的显
式交互计算得到知识点与知识点的局部同构关
系依赖图; 根据图注意力网络的知识点特征和知
识点的语义特征通过全连接层融合图特征和语
义特征; 根据心理学中的诊断函数和自注意力机
制预测学生表现来评估知识点的掌握程度; 根据
交叉熵损失函数来评估模型收敛程度, 根据反向
传播算法对模 型参数进行训练, 直至整个模型网
络收敛; 通过计算得到模型的损失函数, 通过损
失函数最小化, 获取权重矩阵的最优值, 从而提
升了评估学生认知水平的精度。
权利要求书3页 说明书8页 附图3页
CN 115238036 A
2022.10.25
CN 115238036 A
1.一种基于图注意力网络和文本信息的认知诊断方法, 其特 征在于, 包括如下步骤:
(1)从试题数据集中读取 学生答题数据, 对学生 答题数据进行清洗处 理, 包括:
(1.1)清理原始试题数据集中重复提交的学生答题数据, 确保每个学生对每一题只有
一次回答情况;
(1.2)清理原 始试题数据集中响应次数少于设定阈值的学生 答题数据;
(2)特征提取; 将清洗处理后的学生答题数据中有关学生、 习题和知识点的特征从响应
日志中提取 出来;
(3)通过图注意力网络和文本信息结合学生、 习题、 知识点三部分的特征构建认知诊断
模型, 并且利用学生、 习题、 知识点之间的特 征交互行为评估出 学生的认知水平;
所述认知诊断模型主 要包括以下四部分: 数据清理、 特 征输入、 特 征融合和特 征交互;
所述数据清理, 用于从试题数据集中读取 学生答题数据, 并对数据进行清洗处 理;
所述特征输入, 用于从响应日志中获取学生、 习题和知识点的特征向量, 并且将特征向
量进行嵌入表示;
所述特征融合, 将通过图注意力网络从知识点的特征向量中提取出的特征, 以及从知
识点文本信息中提取出 的词向量特征, 通过全连接层神经网络进行特征交互融合, 得到新
知识点特征向量; 将新知识点特征向量通过全连接层神经网络分别与学生特征向量、 习题
特征向量进行 特征交互融合, 得到新学生特 征向量和新习题特 征向量;
所述特征交互, 首先利用诊断函数对新学生特征向量和新习题特征向量中的潜在特征
进行初步诊断, 然后再通过自注意力机制进一步对学生、 习题和知识点之间进行复杂特征
交互并且避免过拟合问题; 最后通过预测每个学生的回答准确性来诊断学生当前的认知水
平;
(4)训练认知诊断模型, 利用交叉熵损失函数来评估模型收敛程度, 运用反向传播算法
对模型参数进行训练, 直至整个模型网络收敛;
(5)将学生的答题数据输入训练好的认知诊断模型中, 得到学生当前的认知水平。
2.根据权利要求1所述的基于图注意力网络和文本信 息的认知诊断方法, 其特征在于,
所述步骤(2)中, 将清洗处理后的学生答题数据中有关学生、 习题和知识 点的特征从响应日
志中提取出来, 并且定义n个学生集合表示为S={s1,s2,s3,…,sn}, m个习题集合表示为P =
{p1,p2,p3,…,pm}, t个知识点 集合表示为C={c1,c2,c3,…,cn}。
3.根据权利要求2所述的基于图注意力网络和文本信 息的认知诊断方法, 其特征在于,
所述步骤(3)中, 所述特 征融合具体为:
将知识点无向图注入到图注意力网络中, 并聚合知识点与知识点之间的依赖关系;
在教育数据挖掘中, 知识点之间存在多个相互依赖和协同交互的关系, 通过图注意力
网络Gc关联每一个知识点; 对于Gc中的任何一个节点, 第t层的特征向量ut经过注意力机制
聚合后生成新的长度为d的节点特 征u′t;
在图注意力网络的聚合层中, 采用注意力机制进行聚合; 假设节点ci到邻节点cj的权重
系数
的公式如下:
其中ReLU( ·)表示ReLU激活函数, Wt表示第t层特征变 换的权重参数, σ 表示权重向量, T权 利 要 求 书 1/3 页
2
CN 115238036 A
2表示转置操作, | |表示拼接操作,
分别表示节点ci和邻节点cj的特征向量;
对每层的中心 节点与相邻节点进行sofmax 归一化操作, 具体公式如下:
其中
表示节点ci和邻节点cj的注意力得分,
是新生成的节点特征, σ( ·)表示
sigmoid激活函数, Υ(i)为知识点总数;
提取知识点文本信息中丰富且有用的隐式信息, 利用word2vec根据上下文中语义相似
度将单词转换为词向量, 并且提取未带标签术语之间的深层次语义关系; 对于知识点特征
向量
和
利用余弦相似度将这两个特征向量融合在一起, 融合后的特征向量
公式如下:
其中sim表示特 征融合函数,
分别为根据
和
得到的可训练向量;
将文本特征和知识点特征进行特征融合, 融合后 的特征向量hc″即为新知识点特征向
量, 公式如下:
其中Fcc表示全连接层神经网络,
表示向量 拼接操作, σ( ·)表示sigmo id激活函数;
通过将学生特征和习题特征分别与 上述知识点特征融合, 得到新学生特征向量和新习
题特征向量, 公式如下:
其中hs表示学生认识水平向量, hdiff表示习题难度向量, hs′表示新学生认识水平向量,
hdiff′表示新习题难度向量; Fsc和Fdc分别表示全连接层神经网络 。
4.根据权利要求3所述的基于图注意力网络和文本信 息的认知诊断方法, 其特征在于,
所述步骤(3)中, 通过诊断函数进行初步诊断, 公式如下:
其中h表示初步诊断结果,
表示元素内积, hq表示知识点与习题的关系矩阵。
5.根据权利要求4所述的基于图注意力网络和文本信 息的认知诊断方法, 其特征在于,
所述步骤(3)中, 将初步诊断结果h传入注意力层, 通过将自注意力的得分和初步诊断结果权 利 要 求 书 2/3 页
3
CN 115238036 A
3
专利 一种基于图注意力网络和文本信息的认知诊断方法及装置
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 14:07:37上传分享