一种新型冠状病毒RBD核苷酸序列、优化方法与应用与流程
本发明涉及基因工程技术领域,更具体的说是涉及一种新型冠状病毒rbd核苷酸序列、优化方法与应用。
背景技术:
冠状病毒是一类具有囊膜、基因组为线性单股正链的rna病毒,是自然界广泛存在的一大类病毒。冠状病毒仅感染脊椎动物,与人和动物的多种疾病有关,可引起人和动物呼吸系统、消化系统和神经系统疾病。
新型冠状病毒sars-cov-2成为继hcov-229e、hcov-oc43、hcov-nl63、hcov-hku1、sars-cov、mers-cov后感染人类的第7种冠状病毒。作为新突发传染病,针对新型冠状病毒肺炎,临床上尚无特异性治疗的药物,疫苗作为预防病毒性疾病最根本方法,是寄予希望的最有效途径。
新型冠状病毒的突刺蛋白(s)的受体结合域(rbd),是病毒进入宿主细胞的关键部位,rbd蛋白可以和细胞的ace2受体相互作用,打开细胞表面通道,使病毒颗粒得以进入细胞内,完成病毒入侵过程。据分析,大多数中和抗体都和rbd序列相关。
作为疫苗抗原的蛋白,其免疫原性和多肽高级结构有密切联系。基于cho、293t等细胞的真核表达体系对于基因工程重组蛋白来说,是保证和野生型蛋白的多肽高级结构一致性最直接和有效方法;此外,真核表达系统一般来说比其它系统如大肠杆菌、昆虫细胞等表达系统表达量低,故其可用性主要取决于该重组蛋白在真核表达系统中的表达量。目前可以在实际生产中应用的提高真核表达水平方法有:1)针对转录阶段的表达载体的设计和改进,如采用高效的表达元件如启动子、增强子等;2)对翻译阶段的改进,重组蛋白本身的基因编码序列优化,包括密码子偏性优化;3)对宿主细胞优化,包括高效表达位点定位和靶向重组;4)细胞大规模培养工艺优化。
综上,如何提供一种高效表达的新型冠状病毒rbd核苷酸序列并对其进行表达应用是本领域技术人员亟需解决的问题。
技术实现要素:
有鉴于此,本发明提供了一种新型冠状病毒rbd核苷酸序列、优化方法与应用。通过改进翻译阶段来达到提高表达量目的。
为了实现上述目的,本发明采用如下技术方案:
一种新型冠状病毒rbd核苷酸序列优化方法,包括如下步骤:
(1)在野生型新型冠状病毒rbd核苷酸序列的基础上做如下优化,得到初步优化新型冠状病毒rbd核苷酸序列:
(11)在5’端编码序列全长1/9~1/2部分采用低gc含量的同类氨基酸密码子替换原密码子,使上游240bp序列中gc含量低于40%;
(12)在3’端编码序列全长1/9~1/2部分采用高gc含量的同类氨基酸密码子替换原密码子,使下游240bp序列中gc含量高于50%;
(13)分析宿主细胞密码子偏性并应用于编码序列的密码子优化;
(14)在野生型新型冠状病毒rbd核苷酸序列前插入核苷酸序列:gttagattccca;
所述野生型新型冠状病毒rbd核苷酸序列如下:
5’-caggctagcccaccatgaatattacaaacttgtgcccttttggtgaagtttttaacgccaccagatttgcatctgtttatgcttggaacaggaagagaatcagcaactgtgttgctgattattctgtcctatataattccgcatcattttccacttttaagtgttatggagtgtctcctactaaattaaatgatctctgctttactaatgtctatgcagattcatttgtaattagaggtgatgaagtcagacaaatcgctccagggcaaactggaaagattgctgattataattataaattaccagatgattttacaggctgcgttatagcttggaattctaacaatcttgattctaaggttggtggtaattataattacctgtatagattgtttaggaagtctaatctcaaaccttttgagagagatatttcaactgaaatctatcaggccggtagcacaccttgtaatggtgttgaaggttttaattgttactttcctttacaatcatatggtttccaacccactaatggtgttggttaccaaccatacagagtagtagtactttcttttgaacttctacatgcaccagcaactgtttaagcggccgcaaa-3’;seqidno.1;
其中,下划线部分为酶切位点,斜体为kozak序列;
(2)将宿主细胞特异性高表达分泌蛋白信号肽序列进行优化;
(3)将人igg1-fc核苷酸序列进行优化;
(4)将步骤(2)优化后的宿主细胞特异性高表达分泌蛋白信号肽核苷酸序列、步骤(1)得到的初步优化新型冠状病毒rbd核苷酸序列、连接子核苷酸序列和步骤(3)优化后的人igg1-fc核苷酸序列依次连接即可
所取得的有益效果:(1)在编码序列的5’端相当于编码序列全长1/9~1/2部分采用低gc含量的密码子,以降低mrna链的二级结构解链能量,有利于提高其翻译效率;(2)在编码序列的3’端相当于编码序列全长1/9~1/2部分采用高gc含量的密码子,提高mrna链的稳定性,帮助延长mrna链的半衰期;(3)通过分析宿主细胞高表达蛋白的序列特征,获得其密码子偏性,应用于序列的密码子优化。
进一步的,步骤(11)所述低gc含量的同类氨基酸密码子包括:gcu、gca、auu、aua、uua、uug、cuu、cua、gua、guu、uuu、ugg、uau、aau、ugu、caa、aug、agu、uca、ucu、aca、acu、cga、cgu、aga、cau、aaa、gau、gaa、gga,ggu、cca和ccu。
具体如表1所示:
表1低gc含量的同类氨基酸密码子选择
进一步的,步骤(12)所述高gc含量的同类氨基酸密码子包括:gcc、gcg、auc、cuc、cug、gug、guc、uuc、ugg、uac、aac、ugc、cag、aug、agc、ucg、ucc、acg、acc、cgg、cgc、cgu、agg、cac、aag、gac、gag、ggg、ggc、ccg、ccc、uag和uga。
具体如表2所示:
表2高gc含量的同类氨基酸密码子选择
进一步的,步骤(1)、步骤(2)所述宿主细胞为中国仓鼠cho细胞。
所取得的有益效果:中国仓鼠cho细胞具有易于进行大规模高密度培养、有效的蛋白糖基化修饰、已知的基因序列及不传播人类病毒的优势。
进一步的,步骤(2)所述宿主细胞特异性高表达分泌蛋白信号肽序列为中国仓鼠alb序列中的信号肽,其氨基酸序列如下:
mkwvtfllllfvsdsafs;seqidno.2;
步骤(2)优化后宿主细胞特异性高表达分泌蛋白信号肽核苷酸序列如下:
atgaaatgggttactttcttattattattgtttgtatctgattctgctttttca;seqidno.3。
所取得的有益效果:alb由肝脏合成,是血清中重要的运输蛋白,是正常血清总蛋白中的主要蛋白质成分,在成年动物肝脏组织内特异性高表达,表现出较强的肝脏特异性。alb具有多种重要的生理作用,包括维持血管和组织之间的血液胶体渗透压,具有结合和运输内源性与外源性物质,结合并参与多种小分子物质的运输、代谢产物解毒和再加工,抑制血小板聚集和抗凝血,还可能具有抗氧化及清除自由基等生理功能,在生命过程中具有重要的意义。采用宿主细胞特异性高表达分泌蛋白信号肽序列并进行优化,提高分泌效率。
优选的,所述连接子核苷酸序列如下:
gtgggttcttctggtggtggtggttctggttctggtggtggtggttctggtggtggt;seqidno.4。
优选的,步骤(3)优化后的人igg1-fc核苷酸序列如下:
gctgttttagctagatatagaggtagaccagatccagaagaaccaaaatcttgtgataaaacccatacctgtccaccatgtccagctccagaattattaggtggtccatctgtttttttatttccaccaaaaccaaaagataccttaatgatttctagaaccccagaagttacctgtgttgttgttgatgtttctcatgaagatccagaagttaaatttaactggtatgttgatggtgttgaagttcataacgctaaaaccaaaccaagagaagaacaatataactctacctatagagttgtttctgttttaaccgttttacatcaagattggttaaacggtaaagaatataaatgtaaagtttctaacaaagctttaccagctcctatcgagaagaccatcagcaaggctaagggccagcctcgcgagcctcaggtgtacaccctgcctcctagccgcgatgaactgaccaagaaccaggtgagcctgacctgcctggtgaagggcttctaccctagcgatatcgctgtggagtgggagagcaacggccagcctgagaacaactacaagaccacccctcctgtgctggacagcgacggcagcttcttcctgtacagcaagctgaccgtggacaagagccgctggcagcagggcaacgtgttcagctgcagcgtgatgcacgaggctctgcacaaccactacacccagaagagcctgagcctgagccctggcaagtag;seqidno.5。
一种优化后新型冠状病毒rbd核苷酸序列,其核苷酸序列如下:
5’-caggctagcccaccatgaaatgggttactttcttattattattgtttgtatctgattctgctttttcagttagattcccaaacatcacaaacttatgtccattcggtgaagttttcaacgccaccagattcgcttctgtttacgcttggaacagaaagagaatctctaactgtgttgccgactactctgtcttatacaactccgcctctttctccacattcaagtgttacggtgtttctccaacaaaattaaacgacttatgtttcaccaacgtctacgccgactccttcgttatcagaggtgacgaagtcagacaaatcgctccaggtcaaaccggtaagattgctgactacaactacaaattgccagacgacttcacaggttgtgttattgcttggaactctaacaacttggactctaaggttggtggtaactacaactacttgtacagattgttcagaaagtctaacttgaaaccattcgaaagagacatttcaaccgaaatctatcaagccggttctacaccttgtaacggtgttgaaggtttcaactgttacttccctttgcaatcatatggtttccaaccaaccaatggtgttggttaccaaccatacagagttgttgttttgtctttcgaattgttgcacgcaccagcaaccgttgtgggttcttctggtggtggtggttctggttctggtggtggtggttctggtggtggtgctgttttagctagatatagaggtagaccagatccagaagaaccaaaatcttgtgataaaacccatacctgtccaccatgtccagctccagaattattaggtggtccatctgtttttttatttccaccaaaaccaaaagataccttaatgatttctagaaccccagaagttacctgtgttgttgttgatgtttctcatgaagatccagaagttaaatttaactggtatgttgatggtgttgaagttcataacgctaaaaccaaaccaagagaagaacaatataactctacctatagagttgtttctgttttaaccgttttacatcaagattggttaaacggtaaagaatataaatgtaaagtttctaacaaagctttaccagctcctatcgagaagaccatcagcaaggctaagggccagcctcgcgagcctcaggtgtacaccctgcctcctagccgcgatgaactgaccaagaaccaggtgagcctgacctgcctggtgaagggcttctaccctagcgatatcgctgtggagtgggagagcaacggccagcctgagaacaactacaagaccacccctcctgtgctggacagcgacggcagcttcttcctgtacagcaagctgaccgtggacaagagccgctggcagcagggcaacgtgttcagctgcagcgtgatgcacgaggctctgcacaaccactacacccagaagagcctgagcctgagccctggcaagtaggcggccgcaaa-3’;seqidno.6;
其中,下划线部分为酶切位点,斜体为kozak序列。
一种包含权利要求1~8任意一种优化后新型冠状病毒rbd核苷酸序列的重组载体。
如权利要求1~8任一所述的一种优化后新型冠状病毒rbd核苷酸序列在制备新型冠状病毒疫苗中的应用。
经由上述的技术方案可知,与现有技术相比,本发明取得的有益效果为:(1)在编码序列的5’端相当于编码序列全长1/9~1/2部分采用低gc含量的密码子,以降低mrna链的二级结构解链能量,有利于提高其翻译效率;(2)在编码序列的3’端相当于编码序列全长1/9~1/2部分采用高gc含量的密码子,提高mrna链的稳定性,帮助延长mrna链的半衰期;(3)通过分析宿主细胞高表达蛋白的序列特征,获得其密码子偏性,应用于序列的密码子优化;(4)采用宿主细胞特异性高表达分泌蛋白信号肽序列并进行优化,提高分泌效率;(5)优化后序列产生的克隆表达效率比野生新型冠状病毒rbd序列提高了约12倍,比单纯的中国仓鼠密码子偏性优化序列克隆表达效率提高了2倍。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所需药剂为常规实验药剂,采购自市售渠道;未提及的实验方法为常规实验方法,在此不再一一赘述。
本发明所涉及的序列合成均由上海生工生物工程技术服务有限公司完成。
实施例1
(1)序列合成:具体步骤为:
①在野生型新型冠状病毒rbd核苷酸序列的基础上做如下优化,得到初步优化新型冠状病毒rbd核苷酸序列:
(11)在5’端编码序列全长1/9~1/2部分采用低gc含量的同类氨基酸密码子替换原密码子,使上游240bp序列中gc含量为38%;
(12)在3’端编码序列全长1/9~1/2部分采用高gc含量的同类氨基酸密码子替换原密码子,使下游240bp序列中gc含量为69%;
(13)按照中国仓鼠遗传密码子偏性对编码序列中编码氨基酸序列的每一个密码子进行优化(替换成高表达密码子);
(14)在野生型新型冠状病毒rbd核苷酸序列前插入核苷酸序列:gttagattccca;
得到的初步优化新型冠状病毒rbd核苷酸序列如下:
gttagattcccaaacatcacaaacttatgtccattcggtgaagttttcaacgccaccagattcgcttctgtttacgcttggaacagaaagagaatctctaactgtgttgccgactactctgtcttatacaactccgcctctttctccacattcaagtgttacggtgtttctccaacaaaattaaacgacttatgtttcaccaacgtctacgccgactccttcgttatcagaggtgacgaagtcagacaaatcgctccaggtcaaaccggtaagattgctgactacaactacaaattgccagacgacttcacaggttgtgttattgcttggaactctaacaacttggactctaaggttggtggtaactacaactacttgtacagattgttcagaaagtctaacttgaaaccattcgaaagagacatttcaaccgaaatctatcaagccggttctacaccttgtaacggtgttgaaggtttcaactgttacttccctttgcaatcatatggtttccaaccaaccaatggtgttggttaccaaccatacagagttgttgttttgtctttcgaattgttgcacgcaccagcaaccgtt;seqidno.7。
②将宿主细胞特异性高表达分泌蛋白信号肽序列进行优化,优化后的核苷酸序列如下:
atgaaatgggttactttcttattattattgtttgtatctgattctgctttttca;seqidno.3。
优化前的核苷酸序列如下:
atgaagtgggtaaccttcctcctcctcctcttcgtttccgactctgctttttcc;seqidno.8。
③将人igg1-fc核苷酸序列进行优化,优化后的核苷酸序列如下:
gctgttttagctagatatagaggtagaccagatccagaagaaccaaaatcttgtgataaaacccatacctgtccaccatgtccagctccagaattattaggtggtccatctgtttttttatttccaccaaaaccaaaagataccttaatgatttctagaaccccagaagttacctgtgttgttgttgatgtttctcatgaagatccagaagttaaatttaactggtatgttgatggtgttgaagttcataacgctaaaaccaaaccaagagaagaacaatataactctacctatagagttgtttctgttttaaccgttttacatcaagattggttaaacggtaaagaatataaatgtaaagtttctaacaaagctttaccagctcctatcgagaagaccatcagcaaggctaagggccagcctcgcgagcctcaggtgtacaccctgcctcctagccgcgatgaactgaccaagaaccaggtgagcctgacctgcctggtgaagggcttctaccctagcgatatcgctgtggagtgggagagcaacggccagcctgagaacaactacaagaccacccctcctgtgctggacagcgacggcagcttcttcctgtacagcaagctgaccgtggacaagagccgctggcagcagggcaacgtgttcagctgcagcgtgatgcacgaggctctgcacaaccactacacccagaagagcctgagcctgagccctggcaagtag;seqidno.5。
优化前人igg1-fc核苷酸序列如下:
gctatcgcggccgcccggatccggaagaaccgaaaagctgcgataaaacccatacctgcccgccgtgcccggcgccggaactgctgggcggcccgagcgtgtttctgtttccgccgaaaccgaaagataccctgatgattagccgcaccccggaagtgacctgcgtggtggtggatgtgagccatgaagatccggaagtgaaatttaactggtatgtggatggcgtggaagtgcataacgcgaaaaccaaaccgcgcgaagaacagtataacagcacctatcgcgtggtgagcgtgctgaccgtgctgcatcaggattggctgaacggcaaagaatataaatgcaaagtgagcaacaaagcgctgccggcgccgattgaaaaaaccattagcaaagcgaaaggccagccgcgcgaaccgcaggtgtataccctgccgccgagccgcgatgaactgaccaaaaaccaggtgagcctgacctgcctggtgaaaggcttttatccgagcgatattgcggtggaatgggaaagcaacggccagccggaaaacaactataaaaccaccccgccggtgctggatagcgatggcagcttttttctgtatagcaaactgaccgtggataaaagccgctggcagcagggcaacgtgtttagctgcagcgtgatgcatgaagcgctgcataaccattatacccagaaaagcctgagcctgagcccgggcaaatag;seqidno.9。
④将步骤(2)优化后的宿主细胞特异性高表达分泌蛋白信号肽核苷酸序列、步骤(1)得到的初步优化新型冠状病毒rbd核苷酸序列、连接子核苷酸序列和步骤(3)优化后的人igg1-fc核苷酸序列依次连接即可。
合成序列的核苷酸序列如下:
5’-caggctagcccaccatgaaatgggttactttcttattattattgtttgtatctgattctgctttttcagttagattcccaaacatcacaaacttatgtccattcggtgaagttttcaacgccaccagattcgcttctgtttacgcttggaacagaaagagaatctctaactgtgttgccgactactctgtcttatacaactccgcctctttctccacattcaagtgttacggtgtttctccaacaaaattaaacgacttatgtttcaccaacgtctacgccgactccttcgttatcagaggtgacgaagtcagacaaatcgctccaggtcaaaccggtaagattgctgactacaactacaaattgccagacgacttcacaggttgtgttattgcttggaactctaacaacttggactctaaggttggtggtaactacaactacttgtacagattgttcagaaagtctaacttgaaaccattcgaaagagacatttcaaccgaaatctatcaagccggttctacaccttgtaacggtgttgaaggtttcaactgttacttccctttgcaatcatatggtttccaaccaaccaatggtgttggttaccaaccatacagagttgttgttttgtctttcgaattgttgcacgcaccagcaaccgttgtgggttcttctggtggtggtggttctggttctggtggtggtggttctggtggtggtgctgttttagctagatatagaggtagaccagatccagaagaaccaaaatcttgtgataaaacccatacctgtccaccatgtccagctccagaattattaggtggtccatctgtttttttatttccaccaaaaccaaaagataccttaatgatttctagaaccccagaagttacctgtgttgttgttgatgtttctcatgaagatccagaagttaaatttaactggtatgttgatggtgttgaagttcataacgctaaaaccaaaccaagagaagaacaatataactctacctatagagttgtttctgttttaaccgttttacatcaagattggttaaacggtaaagaatataaatgtaaagtttctaacaaagctttaccagctcctatcgagaagaccatcagcaaggctaagggccagcctcgcgagcctcaggtgtacaccctgcctcctagccgcgatgaactgaccaagaaccaggtgagcctgacctgcctggtgaagggcttctaccctagcgatatcgctgtggagtgggagagcaacggccagcctgagaacaactacaagaccacccctcctgtgctggacagcgacggcagcttcttcctgtacagcaagctgaccgtggacaagagccgctggcagcagggcaacgtgttcagctgcagcgtgatgcacgaggctctgcacaaccactacacccagaagagcctgagcctgagccctggcaagtaggcggccgcaaa-3’;seqidno.6,命名为puc18-rbd;
(2)重组载体的构建:将puc18-rbd进行nhel/notl双酶切,之后连接到经过同样酶切的pcdna3.1+真核表达载体中,得到重组载体;
(3)转染中国仓鼠cho细胞:
(31)将重组载体转化大肠杆菌,按常规方法进行质粒扩增,之后用mini-prep试剂盒提取质粒;
(32)按照lipofectin试剂盒手册配制dna-脂质体混合物,加入dmem培养基培养的中国仓鼠cho细胞中,37℃温育2hrs;
(33)换液成含10%bsf的dmem培养基,继续培养48hrs;
(4)neo抗性克隆筛选:把转染后的细胞从培养瓶中分离,按1×105细胞/孔加到96孔板中,以含500微克/mlneo的dmem培养基(加10%bsf)继续培养转染后的细胞,经7d后,选取形成克隆的细胞,扩增培养到6孔板;
(5)表达rbd克隆分析:neo抗性克隆经培养后,以1.5×105/ml细胞密度接种到t25培养瓶,在含5%co2培养箱中37℃培养72小时,取上清进行rbd蛋白含量分析。
实施例2
(1)采用rt-pcr方法扩增新型病毒基因组序列;其中,
上游引物为5’-caggctagcccaccatgaatattacaaacttgtgccct-3’;seqidno.10;
下游引物为5’-tttgcggccgcttaaacagttgctggtgcatgtagaag-3’;seqidno.11;
反应体系按照takaraprimescript™onesteprt-pcrkit#r055a50微升体系进行;
反应步骤为50℃30min,94℃2min,98℃10sec,68℃30sec30个循环,72℃2min。
所扩增新型冠状病毒的核苷酸序列如seqidno.1。
步骤(2)~(5)如实施例1。
实施例3
(1)序列合成:按照中国仓鼠遗传密码子偏性对野生型新型冠状病毒rbd编码序列中编码氨基酸序列的每一个密码子进行优化(替换成高表达密码子),即可获得中国仓鼠偏性密码子优化序列;
合成序列的核苷酸序列如下:
5’-caggctagcccaccatgaatattacaaacctgtgcccttttggtgaagtgtttaacgccacccggtttgcatctgtgtatgcttggaacaggaagcggatcagcaactgtgtggctgattattctgtgctgtataattccgcatctttttccacttttaagtgttatggagtgtctcctactaaactgaatgatctgtgctttactaatgtgtatgcagattcttttgtgattcggggtgatgaagtgcggcagatcgctccagggcagactggaaagattgctgattataattataaactgccagatgattttacaggctgcgtgattgcttggaattctaacaatctggattctaaggtgggtggtaattataattacctgtatcggctgtttaggaagtctaatctgaaaccttttgagcgggatattagcactgaaatctatcaggccggtagcacaccttgtaatggtgtggaaggttttaattgttactttcctctgcagagctatggtttccagcccactaatggtgtgggttaccagccataccgggtggtggtgctgtcttttgaactgctgcatgcaccagcaactgtgtaagcggccgcaaa-3’;seqidno.12;
其中下划线部分为酶切位点,斜体为kozak序列。
步骤(2)~(5)如实施例1。
实验1
对实施例1~3的表达rbd克隆进行分析,其分泌rbd蛋白的情况如表3所示。
表3三种rbd序列真核表达构建的克隆分泌rbd浓度比较(微克/ml)
注:a为实施例1经优化的rbd序列构建的真核表达载体,b为实施例3按照中国仓鼠基因密码子偏性优化的序列表达载体;c为实施例2野生型新型冠状病毒rbd序列构建的表达载体。
实验2人体免疫效果实验
把实施例1制备的表达rbd克隆表达的rbd蛋白按1:5加铝佐剂后,采用40微克/剂皮下注射免疫志愿者,免疫流程为0天,14天,28天,于免疫前、第14天、第35天采血检测血清中中和抗体滴度,结果如表4所示。结果表明,第35天血清中和抗体水平提高到1:32~1:128,均达到或超过中和抗体阳性(1:8),表明能达到对新型冠状病毒有效免疫。
表4人免疫后中和抗体水平(cpe效价)
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
序列表
<110>天津中逸安健生物科技有限公司
<120>一种新型冠状病毒rbd核苷酸序列、优化方法与应用
<160>12
<170>siposequencelisting1.0
<210>1
<211>613
<212>dna
<213>人工序列(artificialsequence)
<400>1
caggctagcccaccatgaatattacaaacttgtgcccttttggtgaagtttttaacgcca60
ccagatttgcatctgtttatgcttggaacaggaagagaatcagcaactgtgttgctgatt120
attctgtcctatataattccgcatcattttccacttttaagtgttatggagtgtctccta180
ctaaattaaatgatctctgctttactaatgtctatgcagattcatttgtaattagaggtg240
atgaagtcagacaaatcgctccagggcaaactggaaagattgctgattataattataaat300
taccagatgattttacaggctgcgttatagcttggaattctaacaatcttgattctaagg360
ttggtggtaattataattacctgtatagattgtttaggaagtctaatctcaaaccttttg420
agagagatatttcaactgaaatctatcaggccggtagcacaccttgtaatggtgttgaag480
gttttaattgttactttcctttacaatcatatggtttccaacccactaatggtgttggtt540
accaaccatacagagtagtagtactttcttttgaacttctacatgcaccagcaactgttt600
aagcggccgcaaa613
<210>2
<211>18
<212>prt
<213>人工序列(artificialsequence)
<400>2
metlystrpvalthrpheleuleuleuleuphevalseraspserala
151015
pheser
<210>3
<211>54
<212>dna
<213>人工序列(artificialsequence)
<400>3
atgaaatgggttactttcttattattattgtttgtatctgattctgctttttca54
<210>4
<211>57
<212>dna
<213>人工序列(artificialsequence)
<400>4
gtgggttcttctggtggtggtggttctggttctggtggtggtggttctggtggtggt57
<210>5
<211>738
<212>dna
<213>人工序列(artificialsequence)
<400>5
gctgttttagctagatatagaggtagaccagatccagaagaaccaaaatcttgtgataaa60
acccatacctgtccaccatgtccagctccagaattattaggtggtccatctgttttttta120
tttccaccaaaaccaaaagataccttaatgatttctagaaccccagaagttacctgtgtt180
gttgttgatgtttctcatgaagatccagaagttaaatttaactggtatgttgatggtgtt240
gaagttcataacgctaaaaccaaaccaagagaagaacaatataactctacctatagagtt300
gtttctgttttaaccgttttacatcaagattggttaaacggtaaagaatataaatgtaaa360
gtttctaacaaagctttaccagctcctatcgagaagaccatcagcaaggctaagggccag420
cctcgcgagcctcaggtgtacaccctgcctcctagccgcgatgaactgaccaagaaccag480
gtgagcctgacctgcctggtgaagggcttctaccctagcgatatcgctgtggagtgggag540
agcaacggccagcctgagaacaactacaagaccacccctcctgtgctggacagcgacggc600
agcttcttcctgtacagcaagctgaccgtggacaagagccgctggcagcagggcaacgtg660
ttcagctgcagcgtgatgcacgaggctctgcacaaccactacacccagaagagcctgagc720
ctgagccctggcaagtag738
<210>6
<211>1468
<212>dna
<213>人工序列(artificialsequence)
<400>6
caggctagcccaccatgaaatgggttactttcttattattattgtttgtatctgattctg60
ctttttcagttagattcccaaacatcacaaacttatgtccattcggtgaagttttcaacg120
ccaccagattcgcttctgtttacgcttggaacagaaagagaatctctaactgtgttgccg180
actactctgtcttatacaactccgcctctttctccacattcaagtgttacggtgtttctc240
caacaaaattaaacgacttatgtttcaccaacgtctacgccgactccttcgttatcagag300
gtgacgaagtcagacaaatcgctccaggtcaaaccggtaagattgctgactacaactaca360
aattgccagacgacttcacaggttgtgttattgcttggaactctaacaacttggactcta420
aggttggtggtaactacaactacttgtacagattgttcagaaagtctaacttgaaaccat480
tcgaaagagacatttcaaccgaaatctatcaagccggttctacaccttgtaacggtgttg540
aaggtttcaactgttacttccctttgcaatcatatggtttccaaccaaccaatggtgttg600
gttaccaaccatacagagttgttgttttgtctttcgaattgttgcacgcaccagcaaccg660
ttgtgggttcttctggtggtggtggttctggttctggtggtggtggttctggtggtggtg720
ctgttttagctagatatagaggtagaccagatccagaagaaccaaaatcttgtgataaaa780
cccatacctgtccaccatgtccagctccagaattattaggtggtccatctgtttttttat840
ttccaccaaaaccaaaagataccttaatgatttctagaaccccagaagttacctgtgttg900
ttgttgatgtttctcatgaagatccagaagttaaatttaactggtatgttgatggtgttg960
aagttcataacgctaaaaccaaaccaagagaagaacaatataactctacctatagagttg1020
tttctgttttaaccgttttacatcaagattggttaaacggtaaagaatataaatgtaaag1080
tttctaacaaagctttaccagctcctatcgagaagaccatcagcaaggctaagggccagc1140
ctcgcgagcctcaggtgtacaccctgcctcctagccgcgatgaactgaccaagaaccagg1200
tgagcctgacctgcctggtgaagggcttctaccctagcgatatcgctgtggagtgggaga1260
gcaacggccagcctgagaacaactacaagaccacccctcctgtgctggacagcgacggca1320
gcttcttcctgtacagcaagctgaccgtggacaagagccgctggcagcagggcaacgtgt1380
tcagctgcagcgtgatgcacgaggctctgcacaaccactacacccagaagagcctgagcc1440
tgagccctggcaagtaggcggccgcaaa1468
<210>7
<211>594
<212>dna
<213>人工序列(artificialsequence)
<400>7
gttagattcccaaacatcacaaacttatgtccattcggtgaagttttcaacgccaccaga60
ttcgcttctgtttacgcttggaacagaaagagaatctctaactgtgttgccgactactct120
gtcttatacaactccgcctctttctccacattcaagtgttacggtgtttctccaacaaaa180
ttaaacgacttatgtttcaccaacgtctacgccgactccttcgttatcagaggtgacgaa240
gtcagacaaatcgctccaggtcaaaccggtaagattgctgactacaactacaaattgcca300
gacgacttcacaggttgtgttattgcttggaactctaacaacttggactctaaggttggt360
ggtaactacaactacttgtacagattgttcagaaagtctaacttgaaaccattcgaaaga420
gacatttcaaccgaaatctatcaagccggttctacaccttgtaacggtgttgaaggtttc480
aactgttacttccctttgcaatcatatggtttccaaccaaccaatggtgttggttaccaa540
ccatacagagttgttgttttgtctttcgaattgttgcacgcaccagcaaccgtt594
<210>8
<211>54
<212>dna
<213>人工序列(artificialsequence)
<400>8
atgaagtgggtaaccttcctcctcctcctcttcgtttccgactctgctttttcc54
<210>9
<211>725
<212>dna
<213>人工序列(artificialsequence)
<400>9
gctatcgcggccgcccggatccggaagaaccgaaaagctgcgataaaacccatacctgcc60
cgccgtgcccggcgccggaactgctgggcggcccgagcgtgtttctgtttccgccgaaac120
cgaaagataccctgatgattagccgcaccccggaagtgacctgcgtggtggtggatgtga180
gccatgaagatccggaagtgaaatttaactggtatgtggatggcgtggaagtgcataacg240
cgaaaaccaaaccgcgcgaagaacagtataacagcacctatcgcgtggtgagcgtgctga300
ccgtgctgcatcaggattggctgaacggcaaagaatataaatgcaaagtgagcaacaaag360
cgctgccggcgccgattgaaaaaaccattagcaaagcgaaaggccagccgcgcgaaccgc420
aggtgtataccctgccgccgagccgcgatgaactgaccaaaaaccaggtgagcctgacct480
gcctggtgaaaggcttttatccgagcgatattgcggtggaatgggaaagcaacggccagc540
cggaaaacaactataaaaccaccccgccggtgctggatagcgatggcagcttttttctgt600
atagcaaactgaccgtggataaaagccgctggcagcagggcaacgtgtttagctgcagcg660
tgatgcatgaagcgctgcataaccattatacccagaaaagcctgagcctgagcccgggca720
aatag725
<210>10
<211>38
<212>dna
<213>人工序列(artificialsequence)
<400>10
caggctagcccaccatgaatattacaaacttgtgccct38
<210>11
<211>38
<212>dna
<213>人工序列(artificialsequence)
<400>11
tttgcggccgcttaaacagttgctggtgcatgtagaag38
<210>12
<211>613
<212>dna
<213>人工序列(artificialsequence)
<400>12
caggctagcccaccatgaatattacaaacctgtgcccttttggtgaagtgtttaacgcca60
cccggtttgcatctgtgtatgcttggaacaggaagcggatcagcaactgtgtggctgatt120
attctgtgctgtataattccgcatctttttccacttttaagtgttatggagtgtctccta180
ctaaactgaatgatctgtgctttactaatgtgtatgcagattcttttgtgattcggggtg240
atgaagtgcggcagatcgctccagggcagactggaaagattgctgattataattataaac300
tgccagatgattttacaggctgcgtgattgcttggaattctaacaatctggattctaagg360
tgggtggtaattataattacctgtatcggctgtttaggaagtctaatctgaaaccttttg420
agcgggatattagcactgaaatctatcaggccggtagcacaccttgtaatggtgtggaag480
gttttaattgttactttcctctgcagagctatggtttccagcccactaatggtgtgggtt540
accagccataccgggtggtggtgctgtcttttgaactgctgcatgcaccagcaactgtgt600
aagcggccgcaaa613