国家标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211061420.1 (22)申请日 2022.08.31 (71)申请人 用友网络科技股份有限公司 地址 100094 北京市海淀区北清路68号 (72)发明人 贺旭 于洪江 何鑫 张宇 刘志强 (74)专利代理 机构 北京友联知识产权代理事务 所(普通合伙) 11343 专利代理师 马静 (51)Int.Cl. G06K 9/62(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06F 16/215(2019.01) G06F 16/25(2019.01)G06F 16/28(2019.01) (54)发明名称 目标数据 的分类方法、 装置、 可读存储介质 及电子设备 (57)摘要 本发明提供了一种目标数据的分类方法、 装 置、 可读存储介质及电子设备, 目标数据的分类 方法包括: 获取目标数据集合, 目标数据集合内 包括同一数据格式的多个目标数据, 目标数据的 数据格式包括结构化数据格式、 图片数据格式以 及文本数据格式中的任一种; 根据数据格式确定 目标数据的第一处理方式; 根据第一处理方式对 目标数据进行第一处理, 得到第一处理数据; 根 据目标数据的数据类别, 将多个第一处理数据分 类为多个数据集。 权利要求书2页 说明书16页 附图10页 CN 115438730 A 2022.12.06 CN 115438730 A 1.一种目标 数据的分类方法, 其特 征在于, 所述分类方法包括: 获取目标数据集合, 所述目标数据集合内包括同一数据格式的多个目标数据, 所述目 标数据的所述数据格式包括结构化数据格式、 图片数据格式以及文本数据格式中的任一 种; 根据所述数据格式确定所述目标 数据的第一处 理方式; 根据所述第一处 理方式对所述目标 数据进行第一处 理, 得到第一处 理数据; 根据所述目标 数据的数据类别, 将多个所述第一处 理数据分类为多个数据集。 2.根据权利要求1所述的目标数据的分类方法, 其特征在于, 所述根据 所述目标数据的 所述数据类别, 将多个所述第一处 理数据分类为所述多个数据集, 具体包括: 确定所述多个数据集的数据比例, 所述数据比例用于指示每个数据集应分配的所述第 一处理数据的数量的比例; 根据所述数据类别, 将多个所述第 一处理数据按照所述数据比例分类为所述多个数据 集。 3.根据权利要求1所述的目标数据的分类方法, 其特征在于, 所述根据 所述数据格 式确 定所述目标 数据的所述第一处 理方式, 具体包括: 在所述数据格 式为所述结构化数据格式的情况下, 确定所述第 一处理方式为对多个所 述目标数据进行 数据排列, 将数据排列后的多个所述目标 数据进行 数据清洗处 理; 在所述数据格 式为所述图片数据格 式, 和/或所述文本数据格式的情况下, 确定所述第 一处理方式为对所述目标 数据进行 数据切分处 理。 4.根据权利要求1所述的目标数据的分类方法, 其特征在于, 所述根据 所述目标数据的 所述数据类别, 将多个所述第一处 理数据分类为所述多个数据集前, 所述分类方法还 包括: 根据所述目标 数据的类别标注确定所述数据类别; 所述类别标注的标注方式包括自定义标注和数据表格标注。 5.根据权利要求1至4中任一项所述的目标数据的分类方法, 其特征在于, 所述根据所 述第一处 理方式对所述目标 数据进行 所述第一处 理前, 所述分类方法还 包括: 将所述目标 数据集合根据数据字节拆分为多个子集 合; 所述数据字节用于指示所述目标 数据集合占用的内存大小。 6.根据权利要求5所述的目标数据的分类方法, 其特征在于, 所述根据 所述第一处理方 式对所述目标 数据进行 所述第一处 理, 得到所述第一处 理数据, 所述分类方法具体包括: 依次加载 所述多个子集 合中任一子集 合; 根据所述第一处 理方式对加载后的所述子集 合中的所述目标 数据进行 所述第一处 理。 7.根据权利要求1至4中任一项所述的目标数据的分类方法, 其特征在于, 所述根据所 述数据格式确定所述目标 数据的所述第一处 理方式前, 所述分类方法还 包括: 识别所述目标数据集合中的所述目标数据, 根据 所述目标数据的数据内容确定所述目 标数据集合的数据格式。 8.一种目标 数据的分类装置, 其特 征在于, 所述分类装置包括: 获取模块, 用于获取目标数据集合, 所述目标数据集合内包括同一数据格式的多个目 标数据, 所述 目标数据的所述数据格式包括结构化数据格式、 图片数据格式 以及文本数据 格式中的任一种;权 利 要 求 书 1/2 页 2 CN 115438730 A 2处理模块, 用于根据所述数据格式确定所述目标 数据的第一处 理方式; 处理模块还用于, 根据所述第一处理方式对所述目标数据进行第一处理, 得到第一处 理数据; 分类模块, 用于根据所述目标数据的数据类别, 将多个所述第一处理数据分类为多个 数据集。 9.一种可读存储介质, 其上存储有程序或指令, 其特征在于, 所述程序或指令被处理器 执行时实现如权利要求1至7中任一项所述的目标 数据的分类方法的步骤。 10.一种电子设备, 其特 征在于, 包括: 如权利要求8所述的目标 数据的分类装置; 和/或 如权利要求9所述的可读存 储介质。权 利 要 求 书 2/2 页 3 CN 115438730 A 3
专利 目标数据的分类方法、装置、可读存储介质及电子设备
文档预览
中文文档
29 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 16:43:41
上传分享
举报
下载
原文档
(1.2 MB)
分享
友情链接
GB-T 11436-2012 软磁铁氧体材料成品、半成品化学分析方法.pdf
数据安全培训规范.pdf
GB 14443-2007 涂装作业安全规程 涂层烘干室安全技术规定.pdf
SL-T 813-2021 规划水资源论证技术导则.pdf
GB-T 26141.2-2010 无损检测 射线照相底片数字化系统的质量鉴定 第2部分:最低要求.pdf
T-CAAMTB 134—2023 质量分级及“领跑者”评价要求 电动汽车用驱动电机系统.pdf
GB-T 30064-2013 金属材料 钢构件断裂评估中裂纹尖端张开位移(CTOD)断裂韧度的拘束损失修正方法.pdf
GB-T 406-2018 棉本色布.pdf
信通院 数据资产管理实践白皮书5.0 2021.pdf
GB-T 37931-2019 信息安全技术 Web应用安全检测系统安全技术要求和测试评价方法.pdf
GB-T 37124-2018 进入天然气长输管道的气体质量要求.pdf
CSA 医疗健康网络安全手册.pdf
GB-T 21062.2-2007 政务信息资源交换体系 第2部分:技术要求.pdf
JR-T 0036-2016 再保险数据交换规范.pdf
GM-T 0054-2018 信息系统密码应用基本要求.pdf
CSA AI安全白皮书.pdf
民航 MH-T 1076.1-2023 民航旅客行李全流程跟踪系统 第1部分:机场端建设规范.pdf
GB-T 41266-2022 网络关键设备安全检测方法 交换机设备.pdf
国泰君安 计算机行业:态势感知,预见未来 2019.pdf
GB-T 41670-2022 安全与韧性 社区韧性 突发事件弱势群体救援指南 ISO 22395-2018.pdf
1
/
3
29
评价文档
赞助2.5元 点击下载(1.2 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。