(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210846672.9
(22)申请日 2022.07.05
(71)申请人 河南农业大 学
地址 450046 河南省郑州市郑东 新区平安
大道218号
(72)发明人 陈锋 孙丛苇 任妍 张宁 赵磊
董中东 阳霞
(74)专利代理 机构 郑州大通专利商标代理有限
公司 41111
专利代理师 张立强
(51)Int.Cl.
C12Q 1/6895(2018.01)
C12Q 1/6806(2018.01)
C12Q 1/6837(2018.01)
C12N 15/11(2006.01)
(54)发明名称
小麦超高密度SNP芯片制备方法及应用
(57)摘要
本发明属于植物功能基因组学、 群体遗传学
及分子育种领域, 具体涉及基于小麦泛基因组的
超高密度SNP芯片制备方法及应用。 本发明基于
小麦泛基因组信息, 使用大规模小麦自然群体的
重测序数据及外显子捕获测序数据进行变异分
析获得超大规模的全基因组变异信息; 过滤筛选
获得高质量的、 具有群体及个体代表性的SNP及
INDEL位点, 结合基因组注释及变异注释进行多
态性位点区段的确定, 最终在泛基因组水平合成
超高密度液相探针。 由于本发明方法只针对于基
因目标区域进行测序, 在同样的基因测序深度情
况下, 减少了90%以上的测序成本 。
权利要求书1页 说明书6页 附图3页
CN 115216557 A
2022.10.21
CN 115216557 A
1.一种用于小麦的超高密度SNP芯片制备方法, 其特征在于, 基于小麦泛基因组信息,
使用小麦 自然群体的重测序数据及外显子捕获测序数据进行变异分析获得小麦全基因组
变异信息; 过滤筛选获得高质量的、 具有群体及个体代表 性的SNP及INDEL位点, 结合基因组
注释及变异注释进行多态性位点区段的确定, 最终在泛基因组水平合成超高密度液相探
针。
2.根据权利要求1所述的一种用于小麦的超高密度SNP芯片制备方法, 其特征在于, 包
括以下步骤:
步骤一: 基于中国春参考基因组, 使用小麦自然群体重测序数据及外显子捕获测序数
据进行参 考基因组的比对分析及变异位 点筛选和过滤;
步骤二: 将步骤一中未能比对到中国春参考基因组的reads及比对到中国春参考基因
组的低质量reads提取出来, 使用多个其他小麦参考基因组, 再次进 行比对分析及变异位点
筛选和过滤;
步骤三: 构建泛基因 组SNP注释数据库, 对变异位 点进行功能注释;
步骤四: 对基因上 下游2K范围内的SNP/I ndel进行位 点筛选;
步骤五: 针对步骤四中筛 选的SNP/I ndel位点所覆盖的区域设计探针序列并合成。
3.根据权利要求2所述的一种用于小麦的超高密度SNP芯片制备方法, 其特征在于, 在
步骤一之前, 先对小麦自然群 体的重测序数据及外 显子捕获测序数据文件进行分割。
4.根据权利要求3所述的一种用于小麦的超高密度SNP芯片制备方法, 其特征在于, 对
小麦自然群体的重测序数据及外显子捕获测序数据文件进行分割时, 分割点不在基因附
近, 是在重复序列集中的着丝粒附近或者基因 组大量“N”出现的区域。
5.根据权利要求2所述的一种用于小麦的超高密度SNP芯片制备方法, 其特征在于, 步
骤一具体包括: 采用BWA软件将小麦自然群体的重测序数据及外显子捕获测序数据比对到
中国春参考基因组, 并去除重复序列、 重新进行Indel区域的比对和基线校正, 然后变异位
点筛选和过滤。
6.根据权利要求5所述的一种用于小麦的超高密度SNP芯片制备方法, 其特征在于, 所
述中国春参 考基因组包括中国春1.1版本参 考基因和中国春2.1版本参 考基因组。
7.根据权利要求2所述的一种用于小麦的超高密度SNP芯片制备方法, 其特征在于, 步
骤二中所述多个其他小麦参考基因组和中国春参考基因组组成泛基因组, 所述多个其他小
麦参考基因组包括ArinaLrFor_v3、 Cadenza_v1、 CDC_Landmark_v1、 CDC_Stanley_v1、
Claire_v1、 Jagger_v1、 Julius_v1、 LongReach_Lancer_v1、 Mace_v1、 Norin61_v1、 SY_
Mattis_v1、 PI190962_v1和fielder基因 组。
8.根据权利要求2所述的一种用于小麦的超高密度SNP芯片制备方法, 其特征在于, 步
骤四中位点筛选的优先级别为: CDS区域内的SNP/Indel>CDS上下游1K内的SNP/Indel>CDS
上下游2K内的SNP/I ndel。
9.采用权利要求1~8任一项所述制备方法得到的小麦超高密度SNP芯片, 所述小麦超
高密度SNP芯片为小麦80 0K芯片。
10.权利要求9所述的小麦超高密度SNP芯片在小麦基因型分析和/或基因定位中的应
用。权 利 要 求 书 1/1 页
2
CN 115216557 A
2小麦超高密度SNP芯片制备方 法及应用
技术领域
[0001]本发明属于植物功能基因组学、 群体遗传学及分子育种领域, 具体涉及基于小麦
泛基因组的超高密度SNP芯片制备 方法及应用。
背景技术
[0002]高密度的单核苷酸多态性 (SNP) 标记已广泛应用于分子标记辅助选择、 回交育种
及其背景选择、 多基因聚合育种、 全基因组关联分析、 QTL定位、 全基因组选择、 物种进化分
析、 种质资源鉴定等方面。
[0003]目前, 全基因组范围内的变异基因型获取主要通过重测 序和定制基因芯片。 然而,
小麦基因组庞大 (16GB) , 通过全基因组或简化基因组测序方法获取变异信息成本太高, 位
点缺失严重, 测序数据量相对较大, 对数据储存、 分析计算的软硬件要求高。 变异位点的检
测质量严重依赖于参考基因组的质量。 其次, 现有小麦转录组测序BSR ‑seq基于基因表达数
据, 受样本组织、 样 本时期、 环境等因素影响, 有较大的数据偏好, 基因表达数据本身不是遗
传信息, 具有一定的假阳性。
[0004]SNP芯片则在样品和检测位点的制备方面更加灵活, 与测序相比有更高的检出率
和稳定性。 目前, 小麦 分子育种领域已经开 发出了多款芯片以表征 受试材料的变异信息, 包
括小麦Illumina Wheat 90K iSelect SNP genotyping array (90K)、 Axiom ® Wheat
660K SNP array (660K)、 Wheat 55K SNP array (55K)、 Axiom ® HD Wheat genotyping
(820K) array (820K)、 Wheat 50K Triticum TraitBreed array(50 K)等芯片, 基于以上芯
片在小麦分子 育种领域已取 得重要研究进 展, 但也存在 如下缺点:
首先, 以上芯片的制 备需要使用专门的配套检测设备, 并采用特定 的分析软件分
析基因型结果, 使用限制条件多, 不方便; 其次, 目前芯片的探针多位于变异信息较多的染
色体重复区域等非基因编码区域, 而对于基因分布较多的染色体区域, 标记分布较少; 再
次, 目前的芯片对功能基因覆盖度不高, 多位于基因非编码区间。
发明内容
[0005]本发明的目的在于提供一种用于小麦 的超高密度SNP芯片制备方法, 用于解决现
有芯片的设计探针在基因编 码区覆盖度较低的问题, 以及小麦基因组庞大导致使用全基因
测序手段获得基因信息成本高昂的问题。 由于只针对于基因目标区域进行测序, 在同样的
基因测序深度情况 下, 减少了90%以上的测序成本 。
[0006]本发明的第一方面:
提供一种用于小麦的超高密度SNP芯片制备 方法:
基于泛基因组信息, 使用大规模自然群体的重测 序数据及外显子捕获测 序数据进
行变异分析, 获得大规模的全基因组变异信息; 过滤筛选获得高质量的、 具有群体及个体代
表性的SNP及INDEL位点, 结合基因组注释及变异注释进行多态性位点区段的确 定, 最终在
泛基因组水平合成超高密度液相探针。 具体实现如下:说 明 书 1/6 页
3
CN 115216557 A
3
专利 小麦超高密度SNP芯片制备方法及应用
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 16:51:59上传分享