sgRNA设计要点及原理

CRISPR-Cas9是一项可对基因组特定靶基因进行编辑的DNA操控技术,该系统由sgRNA和Cas9蛋白组成,Cas9蛋白在sgRNA的引导下对靶位点处的DNA双链进行剪切,并产生一个平末端的双链DNA缺口,进而启动DNA损伤修复机制,通过非同源末端链接(Non-homologous end joining,NHEJ)或同源重组(Homologous recombination,HR)的方式将断裂上下游两端的序列连接起来。

目前,CRISPR-Cas9基因编辑技术在疾病基础研究、靶点验证、药物分子的高通量筛选、以及遗传性疾病的治疗等领域得到了越来越广泛的应用。sgRNA在CRISPR-Cas9基因编辑系统中具有准确识别靶基因序列的作用,其效果可影响编辑的效率、是否发生脱靶等,甚至对最终基因编辑的效果产生决定性作用。因此,设计合理有效的sgRNA是我们实现基因编辑的重要基础。

sgRNA设计的一般流程如下:

图1. sgRNA的设计流程

靶基因信息的分析

查询靶基因信息常用的数据库有NCBI、Ensembl等,在查询过程中要注意物种的选择和确定靶基因在数据库中的登录号,避免查找错误。查询到目的基因信息后,需进一步关注其所在基因座上下游基因情况、转录本数量、外显子数量及长度、翻译起始位点与终止位点等信息。然后再综合考量上述信息进行下一步的sgRNA设计。

此处以查询人类Rag1基因为例。在NCBI Gene数据库中输入需要查找的人类Rag1基因,查找的结果显示多个与Rag1相关的基因,这些基因包括了不同物种的Rag1同源基因。因而查找时需要注意该基因在NCBI的登录号与种属描述等(图2a)。点击查询目的基因人类Rag1基因,显示出该基因的基本信息。

可在“Download Datasets”下载该基因的相关序列。在“See related”可查看该基因在Ensembl数据库中的相关信息,主要是为了查看该基因的转录本相关信息(图2b)。链接到Ensembl数据库后能查找到该基因的转录本数量等相关信息,此处显示人类Rag1基因有三个转录本,并且可以打开任意一个转录本查看相关信息(图2c)。查询RAG1-201转录本信息,可打开左侧“Exons”查看该转录本的外显子等相关信息(图2d),即可显示该转录本的基本结构(图2e)。

图2. 靶基因信息的分析

靶区域的选择原则

以基因敲除(KO)为例,基因敲除可采用2种不同策略——移码突变和片段敲除,虽然不同的策略对于靶区域选择的参考标准有差异,但也需遵循以下原则:

1. 不影响其他基因,尤其是编码蛋白的基因。挑选靶区域时避免选择与其他基因重叠的区域(图3a)。

2. 尽可能影响所有的转录本,敲除位点最好在编码区的前50%,但避免敲除ATG所在的位置(图3b)。

3. 能影响蛋白的功能结构域。

对于片段敲除,需考虑更多因素:如片段敲除所敲除的外显子编码序列之和为非3的倍数(图3c),这样可使靶区域后面的序列发生移码,无法翻译出功能蛋白,从而使敲除更彻底。片段敲除所选定的敲除区域不超过10Kb,超过10Kb后编辑效率会降低。片段敲除的gRNA设计在内含子上,这样能敲除整个外显子区,避免翻译出残留蛋白。并且gRNA的设计位点需靠近所敲除的外显子,这样可避免产生不可控的剪切信号而导致形成新的转录本。敲除区域前后序列尽量简单,方便后续的PCR鉴定。

图3. 靶区域选择示意图

(a)基因A与基因B共有一个外显子(标蓝的外显子),因此选择靶区域时应遵循不影响其他基因的原则,不以共有的外显子作为靶区域。(b)存在多个转录本时,为了能敲除所有的转录本,应选择在多个转录本均存在,且在编码区的前50%的外显子(此处选择标红的外显子)作为靶区域。(c)片段敲除时,因基因片段过大不能全部敲除而选择敲除部分外显子,敲除片段的编码序列之和应为非3的倍数,使后面的蛋白发生移码突变。

gRNA的设计

目前有较多提供gRNA设计的在线工具,常用的如张锋实验的CRISPOR(http://crispor.tefor.net/),只需输入目标序列,选定好种属基因组与相应的PAM,则可以得出多个gRNA,以及每个gRNA对应的特异性、切割效率和潜在脱靶位点,一般选择特异性、切割效率得分高的gRNA作后续实验(图4)。

如果需要手动设计gRNA,则需要考虑其特异性与切割效率。在靶点设计时要综合考虑所有候选靶点的序列、位置、正负链、GC含量、潜在的脱靶位点等信息。

图4. CRISPOR在线网页设计sgRNA流程

脱靶分析

根据选择的sgRNA,通过生物信息学方法,对sgRNA进行脱靶分析。推荐使用CCTop(https://cctop.cos.uni-heidelberg.de:8043/)在线网页进行预测。将sgRNA序列输入,选定相应种属基因组进行分析(图5)。并且对获得的遗传材料进行检测。挑选前10个潜在脱靶位点,通过PCR测序验证是否脱靶。如果实验要求较为严格的,则需要通过全基因组测序鉴定脱靶情况。

图5. sgRNA在CCTop在线网页的脱靶分析

sgRNA的设计,你学废了吗?不过这仅仅是基因编辑方案设计中的一环,基因编辑方案还需要考虑目的基因转录本分析、转染方法、细胞克隆形成能力等多种因素,即使一位非常熟练的方案设计专家出一份方案都需要几个小时或更长,且疏漏也在所难免。

(0)

相关推荐