国家标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211315711.9 (22)申请日 2022.10.26 (71)申请人 佛山市第一人民医院 (中山大 学附 属佛山医院) 地址 528000 广东省佛山市禅城区岭南大 道北81号 (72)发明人 邓裕华 林凯容 罗微 周丹  张贝莹  (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 专利代理师 朱继超 (51)Int.Cl. C12Q 1/6869(2018.01) C12Q 1/6886(2018.01) C12N 15/11(2006.01) (54)发明名称 一种第三代测序分子标签、 测序方法及应用 (57)摘要 本发明公开了一种第三代测序分子标签、 测 序方法及应用。 所述第三代测序分子标签使 得第 三代测序技术完成测序之后可以根据标签序列 和比对位置回溯到原始DNA, 通过比对来源于同 一DNA的多条序列的共同序列(consensus)来甄 别突变是真实的还是引入的随机错误, 并且可以 根据UMI序列实现对测序基因的表达量的进行绝 对定量。 所述第三代测序分子标签和测序方法可 以应用于检测肿瘤细胞基因的可变剪切体和/或 抗原位点。 权利要求书1页 说明书5页 附图3页 CN 115521978 A 2022.12.27 CN 115521978 A 1.一种第三代测序分子标签, 其特征在于, 包括UMI序列, 所述UMI序列中由 “N”碱基和 至少两组不相邻的短重复序列组成, 所述 “N”碱基随机选自 “A”碱基、“G”碱基、“T”碱基和 “C”碱基中的任一种, 所述短重复序列是由至少三个相同碱基组成。 2.根据权利要求1所述的第三代测序分子标签, 其特征在于, 所述UMI序列的长度为 28bp。 3.根据权利要求2所述的第 三代测序分子标签, 其特征在于, 所述UMI序列中具有4组短 重复序列。 4.根据权利要求3所述的第 三代测序分子标签, 其特征在于, 各组所述短重复序列的碱 基全部相同、 部分相同或互不相同。 5.根据权利要求3或4所述的第三代测序分子标签, 其特 征在于, 所述UMI序列为: 5’ ‑XXXNNNNXXXNNNNNNNNXXXNNNNXXX‑3’, 其中“N”表示“N”碱基,“X”表示短重复序列选用的碱基。 6.一种第三代测序方法, 其特 征在于, 包括 步骤: 设计和合成分子标签: 设计如权利要求1所述第 三代测序分子标签, 合成带有多聚腺苷 酸的第三代测序分子标签; 获取待测样本总RNA; 将待测样本总RNA逆转录为cDNA; 构建测序文库并进行第三代测序。 7.根据权利要求6所述测序方法, 其特 征在于, 所述待测样本为肿瘤组织。 8.根据权利要求7 所述测序方法, 其特 征在于, 所述获取待测样本总RNA包括以下步骤: 1)肿瘤组织制成冻干粉; 2)加入裂解液, 使肿瘤组织充分被 裂解; 3)加入氯仿, 振荡后静置; 4)离心后吸取 上清液; 5)向上清液加入异丙醇, 混匀后室温静置; 6)再次离心后保留沉淀; 7)于沉淀中加入乙醇, 洗涤沉淀后离心, 弃 上清; 8)风干后加入无RNA酶水重悬。 9.根据权利要求6所述测序方法, 其特征在于, 所述第三代测序是通过ONT平台进行纳 米孔测序。 10.权利要求1所述第三代测序分子标签在检测肿瘤细胞基因的可变剪切体和/或抗原 位点中的应用。权 利 要 求 书 1/1 页 2 CN 115521978 A 2一种第三代测序分子标签 、 测序方法及应用 技术领域 [0001]本发明属于生物技 术领域, 具体涉及一种第三代测序分子标签、 测序方法及应用。 背景技术 [0002]第二代测序技术的测序读长大部分只有75~150bp, 而人类基因的平均长度约为 2500bp, 因此在使用第二代测序技术检测人类基因时仅能得到部分信息, 不能很好地鉴定 人类基因的可变剪切体, 亦不能鉴定潜在的新基因; 另外, 由于同一基因存在不同的转录 本, 利用第二代测序技术获得的数据不能完整地搜索与癌细胞致病、 转移及 免疫逃避相关 的所有基因。 鉴于此, 第三代测序技术(如Pacbio平 台和ONT平台)顺势而生, 其测序的读长 可大于100000bp, 且单个碱基(如A, T, C, G)的精准识别度可达99.999%, 在基因组测序、 甲 基化研究和突变鉴定(SNP)检测这三个方面可大幅度提高数据的质量和 完整度, 弥补第二 代测序的缺陷。 [0003]但是现有的第三代测序技术在测序全长基因转录组数据 时无法对测序基因的表 达量进行绝对定量, 需要就相同的样品进 行二代转录组测序才能实现基因表达量的相对定 量。 这无形中增加了科研成本, 仍然不能提高基因表达量的精确计算 程度。 发明内容 [0004]本发明旨在至少解决上述现有技术中存在的技术问题之一。 为此, 本发明提供了 一种第三代测序分子标签、 测序方法及应用。 [0005]在本发明第一方面提出了一种第三代测 序分子标签, 所述分子标签包括UMI序列, 所述UMI序列中由 “N”碱基和至少两组不相邻的短重复序列组成, 所述 “N”碱基随机选自 “A” 碱基、“G”碱基、“T”碱基和“C”碱基中的任一种, 所述短重复序列是由三个相同碱基组成。 [0006]由于第三代测序技术较二代测序技术容易产生插入(Insection)或缺失 (Deletion)的基因突变, 导致随机碱基组成的UMI序列也容易出现插入和缺失突变, 使 得识 别UMI序列的软件(UMI ‑tools)不易正确识别测序结果中的UMI序列, 导致UMI(Unique   Molecular Identifier, 单分子标签技 术)无法在第三代测序技 术中推广。 [0007]本发明在第三代测序技术的构建文库步骤中可以将所述分子标签插入文库, 使得 每个待测的基因具备独有的UMI序列, 并且限定UMI序列中存在至少两组不相 邻的短重复序 列, 从而使得识别 软件能够更容易地识别正确的UMI序列。 所述短重复序列是选自 “AAA”碱 基组合、“GGG”碱基组合、 “TTT”碱基组合 或“CCC”碱基组合。 通过该技术改进, 使得第三代测 序技术完成测序之后可以根据标签序列和比对位置回溯到原始DNA, 通过比对来源于同一 DNA的多条序列的共同序列(consensus)来甄别突变是真实的还 是引入的随机错误, 并且 可 以根据UMI序列实现对测序基因的表达量的进行绝对定量。 [0008]在本发明的一些实施方式 中, 所述UMI序列的长度为28bp。 [0009]在本发明的一些实施方式 中, 所述UMI序列中具有4组短重复序列。 [0010]在本发明的一些实施方式中, 各组所述短重复序列的碱基全部相同、 部分相同或说 明 书 1/5 页 3 CN 115521978 A 3

.PDF文档 专利 一种第三代测序分子标签、测序方法及应用

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种第三代测序分子标签、测序方法及应用 第 1 页 专利 一种第三代测序分子标签、测序方法及应用 第 2 页 专利 一种第三代测序分子标签、测序方法及应用 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 16:49:09上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。