美国加州大学圣克鲁分校Benedict Paten、谷歌公司Andrew Carroll等研究人员合作开发出新方法PEPPER-Margin-DeepVariant,实现纳米孔长读的高准确性。相关论文于2021年11月1日在线发表在《自然—方法学》杂志上。
研究人员报道了一个单倍型感知的变体检测管线——PEPPER-Margin-DeepVariant,它能用纳米孔数据产生最先进的变体检测结果。结果表明,这个基于纳米孔的方法在全基因组范围内优于基于短读的单核苷酸变体识别方法,并在基于短读的基因分型失败的分段复制和低应用性区域产生了高质量的单核苷酸变体。研究人员表明,这个管线可以用纳米孔读数提供整个基因组的高度连续的结果,在六个样本中连续跨越85%至92%的注释基因。研究人员还将PEPPER-Margin-DeepVariant扩展到PacBio HiFi数据,提供了一个高效的解决方案,性能优于当前的WhatsHap-DeepVariant标准。最后,研究人员展示了使用纳米孔和PacBio HiFi读数的从头组装修改方法,用于产生具有高精确度的二倍体组装(Q35+纳米孔修改和Q40+PacBio HiFi修改)。
据介绍,长读测序有可能改变变异体检测,因为它能到达目前难以测绘的区域,并常规地将相邻的变异体联系在一起,以实现基于读的相位。第三代纳米孔序列数据已经证明了长读长度,但目前对其基于孔隙的新信号的解释方法具有独特的错误特征,使得准确的分析具有挑战性。