Nature genetics:长读基因组测序在罕见病诊断中的应用前景和挑战

2025-07-07 小桔灯网 小桔灯网 发表于上海

本文旨在探讨LR-WGS在罕见病诊断中的应用前景、挑战及潜在优势,强调了取代当前临床遗传方法的关键步骤。

基因诊断是由技术进步推动的,这些技术进步在研究、临床和工业之间有着密切的联系。2001年人类基因组的发表开启了临床遗传学的时代,15年间,微阵列、外显子组测序和短读全基因组测序(WGS)等方法得以实施,使更多罕见疾病的诊断成为可能。WGS的诊断率从20%到50%以上不等,但仍有相当比例的罕见疾病患者没有明确的答案。低诊断率突出了短读技术的局限性,例如平衡和复杂结构变异(SVs),这通常被WGS遗漏。最近的研究表明,长读全基因组测序(LR-WGS)可以可靠地检测到使用其他技术难以识别的临床相关变异,并可能将诊断率提高5 - 20%。

近日,杂志Nature genetics上发表了一篇题为“Toward clinical long-read genome sequencing for rare diseases”的文章。本文旨在探讨LR-WGS在罕见病诊断中的应用前景、挑战及潜在优势,强调了取代当前临床遗传方法的关键步骤。

图片

图片来源:Nature genetics

一、罕见病遗传变异的复杂性

罕见病的遗传变异复杂多样,涉及从单个碱基对到整个染色体的各种遗传改变,包括单核苷酸变异(SNVs)、小插入/缺失(indels)、结构变异(SVs)等。其中,SVs如易位、倒位、拷贝数变异(CNVs)和染色体大片段重排等,常常是导致罕见病的重要原因,这些可能通过基因剂量、破坏、融合或调控变化导致疾病(如下图)。此外,非编码区的变异,如短串联重复序列(STR)扩增,也与多种神经肌肉、神经发育和神经退行性疾病相关。由于短读长测序技术在检测这些复杂变异时存在局限性,LR-WGS的引入显得尤为重要。近来,越来越多的证据强调了非编码区域的重要性。

图片

SV如何导致疾病的示意图。图片来源:Nature genetics

二、最先进的临床诊断测序技术

外显子组测序和WGS代表了罕见病基因检测的最新进展,两者的诊断率均为20 - 50%。虽然这两种技术都能有效检测编码SNV和大CNV,但WGS还能检测非编码变异和更大范围的SV。通过专门的软件,WGS还可以对STR扩增进行基因分型。尽管取得了进展,但相当一部分患者在外显子组测序或WGS后仍未得到诊断。这一差距不仅包括未发现的单基因疾病基因,还包括跨多个基因的致病变异组合。为了提高诊断率,正在考虑多组学方法的潜力。改善罕见病诊断的一个明确而关键的步骤是LR-WGS的实施,它提供了表观遗传学和遗传信息,并有可能取代目前的遗传方法。

三、LR-WGS在临床诊断中的优势

LR-WGS的价值在于其可以提供更彻底的变异表征,特别是某些变异类型,如STR扩增、可移动元件、倒置和易位,通常聚集在难以测序的区域,很难用WGS检测。当前长读技术相对于短读技术具有优势的四个领域:定相、SV检测、STR扩增检测和甲基化分析(如下表)。

单倍型定相(Haplotype phasing)

LR-WGS的一个关键优势是其单倍型定相能力,这在无法获得亲代样本或变异从头发生的情况下尤为重要。此外,定相的变异可以帮助区分基因及其假基因,便于拷贝数改变和SNV的检测。一个例子是染色体5q13上的SMN位点,其中包括SMN1(与脊髓性肌萎缩相关)及其假基因SMN2。准确评估SMN2的拷贝数很重要,因为这影响疾病的严重程度,并影响对SMN靶向治疗的治疗反应。

SV检测

LR-WGS特别有效的另一个领域是SV识别。较长的读长可以更准确地识别变异结构,比如易位和倒位这种平衡SV的能力。LR-WGS能检测到每个人类基因组约20,000个SVs,而WGS可检测到6,000个SVs。这些SV大多是小的缺失、可移动元件indel和重复序列的收缩或扩增。

STR扩增检测

LR-WGS具有跨越重复区域的能力,如可变数目串联重复序列和STR,可以详细表征致病STRs。具体来说,它允许单倍型解析扩增的大小,识别中断的重复序列和探索相关的甲基化模式。

甲基化分析

LR-WGS数据还包括DNA甲基化的直接检测,这具有临床应用价值。例如,LR-WGS可以检测Beckwith-Wiedemann综合征(MIM 130650),Prader-Willi综合症(MIM 176270)和天使综合症(MIM 105830)个体的差异甲基化区域。

图片

遗传方法的检测能力。图片来源:Nature genetics

四、LR-WGS在临床诊断中的局限性

尽管LR-WGS在罕见病诊断中展现出巨大潜力,但其临床应用仍面临诸多挑战。首先,LR-WGS的数据分析复杂,需要专门的生物信息学工具和标准化流程。其次,LR-WGS的成本较高,且通量较低,这限制了其在大规模临床应用中的普及。此外,数据的解读和变异的临床意义评估也是亟待解决的问题。

DNA提取

为了获得最佳的读取长度,通常推荐使用高分子量DNA。从常规DNA中分离出高分子量的DNA的过程,在自动化解决方案引入之前,该过程比标准的自动化DNA提取更昂贵和耗时。

精度

LR-WGS的精度多年来稳步提高。目前,ONT碱基识别的准确率为95% - 99%,PacBio为99% (如下表)。这些数据与WGS相当,但略低于较新的短读测序仪(99.99%) 。

图片

LR-WGS平台与技术综述。图片来源:Nature genetics

数据分析与解读

LR-WGS数据的分析很复杂,与WGS相比,仍然缺乏用于临床级分析的生物信息学流程。虽然LR-WGS在检测变异类型(如SVs和STR扩增)方面表现非常出色,但目前很少有有效解读这些变异的解决方案。缺乏针对LR-WGS的全面的等位基因频率数据库限制了SNV和SVs的注释和过滤,这使得可靠地区分测序伪像和真实变异变得具有挑战性。

成本效益和通量

从每个碱基成本和每个基因组成本来看,LR-WGS比WGS更昂贵。LR-WGS的高成本部分是由于其复杂的文库制备和测序过程,比WGS需要更多的手工劳动。此外,低通量再加上试剂高价格,进一步增加了成本。其次,WGS和外显子组测序是成熟的临床测试,具有完善的工作流程,包括基因panel和既定的报销程序。虽然许多工作流程可以直接适用于LR-WGS,但WGS目前仍然是更具成本效益的选择。随着测序效率和生物信息学的不断进步,LR-WGS的成本效益有望提高。

五、在常规临床诊断中走向LR-WGS的道路

许多临床遗传中心目前正致力于DNA提取、文库制备和标准化生物信息学的自动化过程。LR-WGS生物信息学领域正在迅速发展,一些组件已经标准化,而检测各种变体类型的新工具仍在继续开发。为了推动LR-WGS在临床诊断中的广泛应用,需要建立标准化的实验室协议和质量控制标准,同时开发创新的数据分析和解释工具。随着技术的不断进步和成本的逐渐降低,LR-WGS有望在未来成为罕见病诊断的首选方法。通过大规模的协作研究,建立全面的变异频率数据库,并分享临床数据,将进一步加速LR-WGS在罕见病诊断中的应用进程。

总的来说,作者预计未来会朝着更容易获得、成本效益更高的个人基因组发展。虽然LR-WGS能够可靠地检测复杂的重排和非编码变异,但缺乏确定的疾病关联给临床解释带来了挑战。此外,将LR-WGS与甲基化分析和表观特征等多组学技术相结合,有可能改善变异解释并提高罕见病个体的诊断率。随着技术的不断成熟和成本的进一步降低,LR-WGS有望成为未来基因组学诊断的主流技术,为罕见病患者带来福音。

六、总结与展望

LR-WGS领域仍处于起步阶段,预计在不久的将来,实验室技术和生物信息学方法将继续快速发展。随着技术的成熟,作者认为越来越多的诊断测试会过渡到LR-WGS,为将来完整的单倍型个人基因组用单一测试取代全面的细胞遗传学和分子遗传学研究铺平道路。这不仅可以提高诊断率,还可以实现真正全面的基因组检测,从而评估整个基因组的所有变异。

评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2272359, encodeId=cfb522e2359e8, content=<a href='/topic/show?id=5736654581e' target=_blank style='color:#2F92EE;'>#测序#</a> <a href='/topic/show?id=5a8be955621' target=_blank style='color:#2F92EE;'>#罕见病#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=14, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=65458, encryptionId=5736654581e, topicName=测序), TopicDto(id=79556, encryptionId=5a8be955621, topicName=罕见病)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Mon Jul 07 11:07:49 CST 2025, time=2025-07-07, status=1, ipAttribution=上海)]
    2025-07-07 梅斯管理员 来自上海

相关资讯

上海交大余祥课题组《自然·通讯》:基于纳米孔RNA单分子测序和可迁移深度学习鉴定多种类型的RNA化学修饰

作者结合纳米孔RNA直接测序技术和深度学习方法开发了可同时检测多种类型RNA修饰的迁移学习模型TandemMod。

Sci Transl Med:机器学习+扩增子片段组测序实现灵敏的癌症早期检测

研究发现,A-PLUS的部分功效可以归因于一个单一的特征——实体癌患者cfDNA中Alu元件的整体减少。

Genome Biol:中国医科大学李薛鑫团队开发多组学单细胞图谱:构建人体细胞多样性的多组学百科全书

随着技术进步和数据不断积累,单细胞图谱将持续更新和扩展。这一资源的不断丰富将推动精准医疗和个性化治疗策略的发展,为疾病研究和新药开发提供关键科学基础。

Nat Genet:基于三个大型生物库的测序数据进行泛祖先人类疾病罕见编码变异分析

研究团队利用三个大型生物库测序数据创建了人类疾病罕见编码变异关联数据集,并评估了不同祖先组成在罕见变异关联分析中的作用。

革新NGS体验:从样品到分析仅需一天,MiSeq i100系列重新定义桌面式测序仪的便捷性

MiSeq™ i100系列测序仪,这一桌面式测序产品所引领的测序速度及操作便捷性的飞跃,将进一步驱动新一代测序(NGS)走进更多实验室。

Cell:告别“猜谜式”诊断!临床意义未明变异(VUS)研究新范式,系统性破解遗传病变异解读难题

研究人员开发出一种强大的新技术,它如同一位技艺高超的“密码破译专家”,能够系统性地、大规模地解读这些基因“错字”的真实含义,为精准医疗的未来描绘了一幅激动人心的蓝图。

3年对7000个人类基因组进行测序!PacBio与Ambry Genetics宣布合作罕见病测序项目

使用长读长测序技术在3年内对多达7000个人类全基因组进行测序和分析,并寻求对罕见疾病病因的新见解。该新项目是同类项目中最大的罕见疾病基因组测序项目之一。

NBT:叶凯团队开发基于“序列-图像”转换的差异比较算法SVision-pro,实现高精确性SV检测及分型

叶凯教授团队开发了SVision-pro,这是一种基于神经网络的实例分割框架,能够直观地表示基因组到基因组水平的测序差异,并在无需任何推断模型的条件下比较地发现基因组之间的SV。

Nature:基因组学新纪元:超快速测序技术加速个性化医疗

超快速基因组测序技术的应用,使得医生能够快速获取患者的基因信息,从而制定出更加个性化、精准的治疗方案。

Nat Commun:王建新/罗峰/肖传乐建立基于第三代测序数据的二倍体组装算法

基于第三代测序数据,提出了二倍体的单倍型组装新算法,并开发了相应的软件PECAT。