NGS接头集中营,如何选择看这里!
接头是一段序列已知的短核苷酸序列,与目标核酸片段两端连接,测序时与测序芯片上的已知序列进行杂交,从而将文库结合到芯片上,进而启动测序。随着测序技术的发展,接头种类越来越多,比如单端/双端接头、UMI接头、转座酶接头、完整/不完整接头等等,适配于多种应用场景。下面一起系统地梳理下这些接头,看看该如何选择!
接头结构介绍
●P5和P7端:illumina平台中,与测序芯片上的P5和P7端结合,将待测文库固定到测序芯片上,以便于通过桥式PCR进行成簇反应;
●Rd1 SP和Rd2 SP:测序引物结合的区域,指示序列开始读取的位置;
●Index:用于区分不同样本的一段已知的合成序列
图1. Illumina平台单端index 文库示意图
图2. MGI平台单端index文库示意图
Index/Barcode的作用
Index也称Barcode,随着测序通量的提升,可实现多个样本同时测序,因此就在接头中引入了index或Barcode的序列以区分不同的样本。 Index长度一般为6nt-18nt的已知合成序列,根据index的数目分为单端index和双端index,双端index分别位于待测片段的两端。在选择index组合的时候需要考虑到碱基平衡和荧光平衡。
碱基平衡,指的是Index的复杂度和平衡度,是多个Index之间的平衡,而非单个Index内部的碱基平衡,需要从碱基种类和碱基分布两个方面考虑,组合的原则是:同一组index中的A/T/C/G四种碱基都需要包含,且这4种碱基的比例接近,各占25%左右。
荧光信号平衡,是指在不能保证碱基平衡的情况下,选择保证荧光信号的平衡。在Illumina平台中的4通道测序仪中,dG/dT使用绿色荧光标记,dC/dA使用红色荧光标记。测序时每个循环里绿色和红色两种荧光信号都必须存在以保证测序顺利进行。因此在选择Index时需要考虑绿色信号和红色信号的平衡。
● 双端index之UDI&UDB:减少index hopping和misassignment的好帮手
Unique Dual Index&Unique Dual Barcode,双端唯一index,两端index一一对应,成组设计,两端可交叉验证;
● 双端index之CDI:Combined Dual Index,一对多的接头,即可以根据一定的要求对两端的index进行组合,最终形成的是双端index文库;
Illumina为了进一步提升通量与扩增效率,降低测序成本,为Novaseq等高通量型测序仪引入了阵列式流动槽(PFCT)和排他性扩增(ExAmp)成簇技术,但无意间却放大了Index hopping的样本标签错配现象。
图3. Illumina不同仪器型号采取Non-patterned Flow Cell或Patterned Flow Cell模式图
为了弥补HiSeq3000/4000、HiSeq X Series及NovaSeq等测序平台凸显的标签跳跃问题,Illumina提出在文库的两端都带上独特标签(UDI)的策略,可以进行双侧校验,剔除标签错配的接头。采用双端唯一index分析数据时,可以将index错误分配率降低到0.01%,与之前常规的index排列组组合方法对比,Index hopping降低了两个数量级。
在PCR-free的文库构建中,可选择单端index接头,其标签错配主要是由于测序错误错误引起,整体而言,标签错配率较低(平均为 0.0004%,最高至 0.001%);但在靶向捕获文库构建中,由于多个步骤都会导致标签错配,因此串扰问题则被放大,通常会采用UDI/UDB的接头。
UMI接头:低频突变检测、绝对定量的利器
Unique molecular identifier,单一分子标签,是一段序列已知的随机合成序列,可以设计为完全随机的核苷酸链、部分简并核苷酸链或者固定核苷酸链,长度通常为10nt(单端UMI)或5-8nt(双端UMI)。其作用是冻结DN**段扩增前的状态,每个DNA分子对应一个UMI,因此生信分析时可以区分不同来源的DNA模板,分辨哪些是PCR扩增及测序过程中的随机错误造成的假阳性突变,哪些是患者真正携带的突变,从而过滤掉背景噪音,实现低频和极低频突变的准确检测,对不同DNA分子进行绝对定量等。广泛应用于低频突变检测,尤其是在肿瘤的研究领域中。
图4. illumina平台UMI接头结构示意图
完整接头&不完整接头&Tn5接头
除Tn5接头外,接头通常以TA连接的方式与目的片段连接。按照有无完整的P5端和P7端(Illumina平台)分为完整接头和不完整接头:
●完整接头:PCR-free文库构建的必备产品
完整接头包含测序时所需要的全部序列,如在Illumina平台中有P5端、P7端、RdS1及RdS2,同时根据建库测序要求包括Index序列、UMI序列等,可不进行PCR反应引入其它接头成分而直接上机测序,可用于构建PCR-Free的文库,PCR-free文库可以减少PCR扩增偏好性、错误率以及序列重复,提高一些高GC或者高AT区域的覆盖度,在群体基因组研究中应广泛。
图5. 完整接头示意图
●不完整的接头
不完整接头需要在接头连接反应后,通过PCR的方式加上其它部分序列,以形成一个完整的接头,也就是说不完整接头最终一定要通过PCR扩增形式形成完整接头才能上机测序,PCR的过程一方面是是对完整文库的一个富集作用,保证有效文库的浓度,同时还可以引入双端index和UMI序列;
●Tn5接头:片段化与接头连接同步进行,省时省样本
Tn5接头是通过Tn5的限制性内切酶活性,在识别并切割双链DNA时,将接头的部分序列连接到DN**段两端,最后经过PCR的方式引入其余部分序列以及index、UMI等序列,最后形成完成的文库。可用于CUT&Tag文库构建。
图6. Tn5接头文库构建示意图
接头产品推荐
DNA文库构建配套接头产品
平台 |
产品名称 |
接头类型 |
货号 |
规格 |
产品详情 |
浓度 |
Illumina |
不完整接头UDI |
12404/12405/12406/12407-ES01 |
12×2 T/96×2 T/192×2 T/384×2 T |
分别包含12/96/192/384种 index接头,预混液形式 |
接15μM; 引物12.5μM |
|
不完整接头CDI |
12412/12413-ES02 |
96×2 T |
分为2个set,共包含384种接头 |
接15μM; 引物25μM |
||
Tn5不完整接头-双端index(8bp) |
12610ES96 |
96T |
共96种 index |
- |
||
Hieff NGS® Dual UMI UDI Adapter Kit for Illumina®,Set1-Set2 |
不完整接头-UMI 双端index |
13370/13371-ES04/16 |
48×4 T/16T |
共96种index |
- |
|
完整接头-单端Index(8bp) |
13519/13520-ES04/ES16 |
48×4 T/48×16T |
分为两个Set,每个Set48种,共96种 |
15μM |
||
MGI |
Hieff NGS® Dual UMI UDB Adapter Kit for MGI®,Set1/Set2 |
不完整接头-双端index-UMI -UDB |
13367/13368-ES02/7ES04 |
48 x 2 T/48 x 4 T |
分为2个Set,共96种 |
接头10μM; 引物12.5μM |
Hieff NGS® Unique Dual Index Primer Kit for MGI®
地 址: 上海市浦东新区天雄路166弄一号楼三层南单元 联系人: 李自转 电 话: 400-6111-883、021-34615995-8075 传 真: 021-34615995-188 Email:lizizhuan@yeasen.com
RNA建库系列产品选购指南
(2024-11-22T00:00 浏览数:3139)
DNA建库系列产品选购指南
(2024-11-22T00:00 浏览数:2052)
全自动核酸提取仪,让HCD残留和支原体污染等检测更轻松&准确
(2024-11-22T00:00 浏览数:2768)
复制型逆转录病毒(RCR)的法规监管要求和检测方法介绍
(2024-11-22T00:00 浏览数:1520)
解决方案 | 病原tNGS产品助力病原检测更快捷
(2024-11-22T00:00 浏览数:2992)
翌圣Hieff Clone®系列分子克隆试剂盒(累计影响因子1300+)
(2024-11-21T00:00 浏览数:4430)
YeaRed/YeaGreen无毒核酸染料,您的安全科研助手
(2024-11-21T00:00 浏览数:2933)
线粒体探针应用 - 罗丹明123(Rh 123)
(2024-11-21T00:00 浏览数:1867)
阿尔玛蓝(Alamar Blue)在细胞增殖中的应用
(2024-11-21T00:00 浏览数:3602)
磺酰罗丹明 B(SRB)在细胞增殖中的应用
(2024-11-21T00:00 浏览数:3966) |