国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210593432.2 (22)申请日 2022.05.27 (71)申请人 重庆邮电大 学 地址 400065 重庆市南岸区黄桷垭崇文路2 号 (72)发明人 袁正午 陈泽 邓阳 周亚涛  (74)专利代理 机构 北京同恒源知识产权代理有 限公司 1 1275 专利代理师 廖曦 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/31(2019.01) G06F 40/205(2020.01) G06F 40/284(2020.01) G06F 40/30(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于小样本文本分类原型网络欧氏距 离计算方法 (57)摘要 本发明涉及一种基于小样本文本分类原型 网络欧氏距离计算方法, 属于计算机技术领域。 该方法包括以下内容: 通过对数据进行划分为 support与query, 度量学习的学习范式通过 support来获得样本的估计类别, 然后通过query 来对估计类别进行比较, 从而来进行分类。 本发 明利用孪生网络结合高速网络提升对原型特征 进行提取计算, 不同孪生层对support以及query 的处理均不相同; 通过特征级注意力模块来将 support与query的进行特征级关注, 通过特征融 合将结果通过激活函数获得注 意力分数系数, 通 过注意力分数提升欧氏距离对于高维稀疏矩 阵 的特征进行判别, 提高分类准确度。 权利要求书2页 说明书5页 附图2页 CN 115033689 A 2022.09.09 CN 115033689 A 1.一种基于小样本文本分类原型网络欧氏距离计算方法, 其特征在于: 该方法包括以 下步骤: 步骤1)、 利用Glove进行词的向量化表示, 将预训练的词向量文件进行解析, 构建单词 与其向量表示的索引, 使得向量之间尽可能多地蕴含语义和语法的信息; 步骤2)、 构造基于原型网络的小样本学习网络模型, 总体的大致模型包括编码层, 原型 层以及度量层, 编码层是将实例中的离散词映射为连续的输入嵌入词, 用于捕获语义信息; 原型层通过孪生网络与高速网络结合, 通过孪生网络中support与query权重共享进行参数 学习, 同时结合高速网络提升网络学习效率, 通过获得的词向量Xs与Xq经过孪生网络S进 行 特征编码, 结合高速网络, 每一层通过gate进行相关控制, 对网络进行梯度优化获得原型; 度量模块通过特征级注 意力模块来将support与query的进行特征级关注, 通过特征融合将 结果通过激活函数获得注意力分数系数, 通过注 意力分数改进后的欧氏距离的计算来计算 损失或进行分类; 步骤3)、 将小样本数据集分为训练集、 验证集以及测试集, 再分别对数据集进行拆分, 分为support  set与query  set, 预训练阶段借助预训练模型Glove进行词嵌入, 将已经与处 理好的数据集根据嵌入矩阵进 行词嵌入嵌入矩阵W, wt =Wωt, 并通过将单词嵌入和位置嵌 入连接起来, 实现对每个单词的最终输入嵌入, {x1..., xn}={[ω1; p1], ..., [ωn; pn]}, {x1..., xn}={[ω1; p1], . .., [ωn; pn]}, X=fφ(x); 步骤4)、 使用孪生网络S与高速网络H结合进行原型特征提取计算, 将词向量Xs与Xq输 入孪生网络进行进行特征学习, 每一层的孪生网络使用batch ‑normalization进行归一化 处理, 获得最终原型P(X)=H(S(X) ); 步骤5)、 将获得后的Xs与Xq数据分别进行特征级注意力模块计算, 通过新加特征级注 意力模块, 能够让模型注意到整个输入中的support样本, query样本内的不同部分之间的 相关性, 以便后续获得的分数能够对高维度稀疏矩阵中的重要特征进行强调, 获得分数系 数, 便于后续分类; 步骤6)、 将步骤4)获得的原型P与query数据进行欧氏距离的计算, 在计算结果时, 乘上 步骤5)所求得的注意力分数系数; 原来的模型使用简单的欧几里德距离函数作为距离函 数, 由于support中实例较少, 从support中提取的特征存在数据稀 疏性问题, 通过增加分数 系数代替 最原始的欧氏距离函数, 最后通过softmax函数来进行分类。 2.根据权利要求1所述的一种基于小样本文本分类原型网络欧氏距离计算方法, 其特 征在于: 所述编 码层是将实例中的离散词映射为连续的输入嵌入词, 用于捕获语义信息; 给 定一个实例x={ω1, ω2, ..., ωT}, 有T个字; 使用嵌入矩阵W, 将 每个单词嵌入到一个向量 中, 将该实例中的每个单词映射到一个实值嵌入, 以表示该单词的语义和语法意义wt=W ωt; 由于靠近实体的词对关系确定 的影响更大, 采用位置嵌入的方法; 通过将单词 嵌入和 位置嵌入连接起来, {x1..., xn}={[ω1; p1], ..., [ωn; pn ]}, 再通过卷积以及池化实现对 每个单词的最终输入嵌入, X=fφ(x)。 3.根据权利要求1所述的一种基于小样本文本分类原型网络欧氏距离计算方法, 其特 征在于: 所述原型层处理词向量进行原型表示, 使用孪生网络S与高速网络H结合进行原型 特征提取计算, 步骤如下: 孪生网络包含了两层卷积层以及一层 全连接层, 并且每一层受高权 利 要 求 书 1/2 页 2 CN 115033689 A 2速网络启发通过gate进行连接; 将词向量Xs与Xq输入孪生网络G进 行特征学习, 模 型隐层维 度为512维, 使用conv1d卷积核长度为3, 步长为1, padding为1, 每一层使用batch ‑ normalization进行归一化处理; 对于孪生网络中的Xq部分, 考虑到Xq对模型后期查询样 本 与原型之间的比较, 所以不对 Xq做过多处理, 所以没有将Xq加入高速网络, 所以与Xs只进 行 孪生网络的参数学习的到Q1=S(Xq); 而对于孪生网络中Xs部分的输出, 每一层Xs的输出都 是结合高速网络输出h(x)=g(x, wg)*t(x, wt)+x*(1 ‑t(x, wt)), 其中, x为suppot样本集输 入, g(*)为当前层卷积后的结果, t为学习系数, 将h(x)作为下一层孪生网络以及高速网络 的输入, 其中t(*)为0~1的系数参数, 通过sigmoid函数学习得到, t(x)=σ(Wtx+b), 获得最 终原型 4.根据权利要求1所述的一种基于小样本文本分类原型网络欧氏距离计算方法, 其特 征在于: 将所述Xs和Xq池化, 数据分别进行计算, 得到到整个输入中的support样本, query 样本内的不同部分之间的相关性, 以便后续 获得的分数能够对高维度稀疏矩阵中的重要 特 征进行强调, 便于后续分类; 具体为: 将Xs与Xq分别进行计算, 将经 过自身特征强化的S和Q2进行特征融合, 再经过激 活函数后获得分数系数αi=σ(Si·Q2), 其 中, 表示以拼接方式进行特征融合, σ 表示经过归一化以及simoid激活函数, 分数系数更加 提高对support与query中对分类有益特征的关注度, 提升分类的准确度, 在进行距离计算 的时, 将欧氏距离乘上获得的注意力 分数系统后, 对高维度稀疏矩阵中的重要特征有强调 作用, d(i, q)=(Si‑Q1)2*αi, 表示查询向量与第i个类别的样本空间距离, 所求出的距离也更 加准去, 从而获得的分类结果 也更加准确。权 利 要 求 书 2/2 页 3 CN 115033689 A 3

.PDF文档 专利 一种基于小样本文本分类原型网络欧氏距离计算方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于小样本文本分类原型网络欧氏距离计算方法 第 1 页 专利 一种基于小样本文本分类原型网络欧氏距离计算方法 第 2 页 专利 一种基于小样本文本分类原型网络欧氏距离计算方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:07:50上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。