国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210733483.0 (22)申请日 2022.06.27 (71)申请人 中国电信股份有限公司 地址 100033 北京市西城区金融街31号 (72)发明人 张辉 李俊 杨建昆  (74)专利代理 机构 北京同达信恒知识产权代理 有限公司 1 1291 专利代理师 孙小明 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称 一种批量投诉的识别方法及装置 (57)摘要 本申请公开了一种批量投诉的识别方法及 装置, 用以通过计算机自动发现和识别批量投 诉, 不再依赖人工, 提升批量投诉识别的效率和 准确率。 该方法包括: 将接收到的各个投诉文本 转化为文本向量; 根据任意两个文本向量之间的 距离, 确定各文本向量预设距离范围内的文本向 量的数量; 距离用于表征任意两个文本向量对应 的投诉文本的语义相近程度; 在数量达到设定阈 值时, 确定预设距离范围内文本向量对应的投诉 文本为批量投诉; 根据预设距离范围内文本向量 对应的投诉 文本, 输出批量投诉警报信息 。 权利要求书2页 说明书10页 附图3页 CN 115062149 A 2022.09.16 CN 115062149 A 1.一种批量投诉的识别方法, 其特 征在于, 包括: 将接收到的各个投诉文本转 化为文本向量; 根据任意两个文本向量之间的距离, 确定各文本向量预设距离范围内的文本向量的数 量; 所述距离用于表征 所述任意两个文本向量对应的投诉文本的语义相近程度; 在所述数量达到设定 阈值时, 确定所述预设距离范围内文本向量对应的投诉文本为批 量投诉; 根据所述预设距离范围内文本向量对应的投诉文本, 输出批量投诉警报信息 。 2.根据权利要求1所述的方法, 其特征在于, 所述将接收到的各个投诉文本转化为文本 向量, 包括: 将任一投诉文本进行拆词处 理, 得到所述任一投诉文本对应的多个词语; 将所述多个词语中每一个词语转 化为词向量; 通过多个词向量组成所述任一投诉文本对应的文本向量。 3.根据权利要求2所述的方法, 其特征在于, 所述将多个词语中每一个词语转化为词向 量, 包括: 获取预先构建的多组词语与词向量之间的对应关系; 所述对应关系是基于预训练的词 向量转化模型生成的; 根据多组对应关系, 确定所述多个词语中每一个词语对应的词向量。 4.根据权利要求2或3所述的方法, 其特征在于, 所述将任一投诉文本进行拆词处理, 得 到所述任一投诉文本对应的多个词语, 包括: 将所述任一投诉文本与预 先配置的词语库进行匹配, 确定匹配成功的词语; 将剔除所述匹配成功的词语后的所述任一投诉文本进行拆词处理, 将拆词得到的词语 与所述匹配成功的词语组成述任一投诉文本对应的多个词语。 5.根据权利要求1 ‑3任一项所述的方法, 其特征在于, 所述根据任意两个文本向量之间 的距离, 确定各文本向量预设距离范围内的文本向量的数量, 包括: 分别计算第一文本向量与所述各文本向量中除所述第一文本向量外的其他文本向量 之间的距离; 将与所述第一文本向量距离小于预设值的文本向量的数量, 作为所述第 一文本向量预 设距离范围内的文本向量的数量; 其中, 所述第一文本为所述各文本向量中的任意 一个文本向量。 6.根据权利要求1 ‑3任一项所述的方法, 其特 征在于, 所述方法还 包括: 向投诉处理人员的设备发送所述批量投诉警报信 息、 所述预设距离范围内文本向量的 数量和所述预设距离范围内文本向量对应的投诉文本 。 7.一种批量投诉的识别装置, 其特 征在于, 包括: 通信单元, 用于接收多个投诉文本; 处理单元, 被配置为执 行: 将各个投诉文本转 化为文本向量; 根据任意两个文本向量之间的距离, 确定各文本向量预设距离范围内的文本向量的数 量; 所述距离用于表征 所述任意两个文本向量对应的投诉文本的语义相近程度; 在所述数量达到设定 阈值时, 确定所述预设距离范围内文本向量对应的投诉文本为批权 利 要 求 书 1/2 页 2 CN 115062149 A 2量投诉; 根据所述预设距离范围内文本向量对应的投诉文本, 输出批量投诉警报信息 。 8.根据权利要求7 所述的装置, 其特 征在于, 所述处 理单元, 具体用于: 将任一投诉文本进行拆词处 理, 得到所述任一投诉文本对应的多个词语; 将所述多个词语中每一个词语转 化为词向量; 通过多个词向量组成所述任一投诉文本对应的文本向量。 9.根据权利要求8所述的装置, 其特 征在于, 所述处 理单元, 具体用于: 获取预先构建的多组词语与词向量之间的对应关系; 所述对应关系是基于预训练的词 向量转化模型生成的; 根据多组对应关系, 确定所述多个词语中每一个词语对应的词向量。 10.根据权利要求8或9所述的装置, 其特 征在于, 所述处 理单元, 具体用于: 将所述任一投诉文本与预 先配置的词语库进行匹配, 确定匹配成功的词语; 将剔除所述匹配成功的词语后的所述任一投诉文本进行拆词处理, 将拆词得到的词语 与所述匹配成功的词语组成述任一投诉文本对应的多个词语。 11.根据权利要求7 ‑9任一项所述的装置, 其特 征在于, 所述处 理单元, 具体用于: 分别计算第一文本向量与所述各文本向量中除所述第一文本向量外的其他文本向量 之间的距离; 将与所述第一文本向量距离小于预设值的文本向量的数量, 作为所述第 一文本向量预 设距离范围内的文本向量的数量; 其中, 所述第一文本为所述各文本向量中的任意 一个文本向量。 12.根据权利要求7 ‑9任一项所述的装置, 其特 征在于, 所述 通信单元, 还用于: 向投诉处理人员的设备发送所述批量投诉警报信 息、 所述预设距离范围内文本向量的 数量和所述预设距离范围内文本向量对应的投诉文本 。 13.一种电子设备, 其特 征在于, 包括: 存 储器以及控制器; 存储器, 用于存 储程序指令; 控制器, 用于调用所述存储器 中存储的程序指令, 按照获得的程序 执行权利要求1 ‑6中 任一项所述的方法。 14.一种计算机存储介质, 存储有计算机可执行指令, 其特征在于, 所述计算机可执行 指令用于执 行如权利要求1 ‑6中任一权利要求所述的方法。权 利 要 求 书 2/2 页 3 CN 115062149 A 3

.PDF文档 专利 一种批量投诉的识别方法及装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种批量投诉的识别方法及装置 第 1 页 专利 一种批量投诉的识别方法及装置 第 2 页 专利 一种批量投诉的识别方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 14:09:01上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。