时间:2024-05-18
彭 景,许 杰,程 威,尹重超,陈恒玲
(中南民族大学 生物医学工程学院,湖北 武汉 430074)
CRISPR/Cas系统是一种获得性免疫系统,最初被发现来源于细菌。它能识别并结合特定的DNA片段,cas9蛋白可以在其转录产物crRNA的介导下对靶基因进行剪切,实现对外源DNA的防御[1~3]。CRISPR/Cas的功能过程可以概括如下:得到CRISPR的间隔区序列、CRISPR基因座的表达、相关复合体对靶DNA进行剪切。精确有效的基因组编辑是基因功能鉴定的关键。到目前为止,CRISPR相关系统已成功地应用于动物和植物[4~7]。
在上述理论基础上,一种新颖高效的基因编辑技术应运而生,它是由Wiedenheft等设计出的,具体内容包括:设计出的sgRNA可以识别并结合Cas9蛋白,并介导cas9蛋白对靶基因进行剪辑(图1),其中sgRNA是根据crRNA与tracrRNA的复合体设计出来的[2~4]。由细菌中复杂的CRISPR/Cas9系统精简为sgRNA与Cas9作用结构模式,使得只需要简单地将其导入到细胞便可实现对靶基因进行定点编辑,很大程度上提高了基因编辑效率。因为该技术具备高效性、低成本性和简易性等优点,所以生物研究界对CRISPR/Cas9系统十分关注,并应用到了更广阔的研究领域[1,3]。
图1 sgRNA指导的CRISPR/Cas9基因剪切系统(图片来源于《一种新型的构建CRISPR/Cas9 KnockOut载体的方法》)
Cas9可以被引导到一个与sgRNA互补的20 mer基因组位点,介导DNA双链断裂。5’-NGG原引物邻近基序(PAM)必须位于目标序列的邻近位置[8,9]。为了选择合理的目标位置和最小化偏离目标的影响,已经建立了一些优化sgRNA选择的计算工具。在获得sgRNA序列的基础上,普遍采用的Zhang Lab寡核苷酸序列设计的方法(图2)来设计oligo的生成(概括起来就是:在设计oligo时,首先要保证模板序列的开头为G,以确保稳定性。oligo1是在上述序列基础上在其5’端加上CACC形成的,而oligo2则是在碱基配对所得的反转序列的5’端加上AAAC形成的)[4,5]。然而,从sgRNA生成oligo非常需要有效的计算工具。在当前的分析中,创建了一个基于Python的Crispr/cas9 oligos生成器的本地应用程序工具,允许用户批量地在输入sgRNA序列中设计oligos。Crispr/cas9 oligos生成器可以免费下载。该软件是专门设计用于引物序列变换的工具,能有效解决人工自反转问题,很大程度地提高设计精度,节省时间。
图2 oligo序列设计示意图(图片来源于 zhanglabcloningprotocol引用张锋的文章)
由于python语言的简洁、易懂、易开发等特点,十分适合用来编写本课题的生成器[10,11]。Python内有常用于科学研究的科学数据包anaconda和数据库tkinter,这为本次程序编写提供了研究背景[13],其中tkinter是tk的python接口,而tk原本是Tcl的graphical user interface(GUI),就是图形界面用户接口,可以类比于许多编程语言涉及到的“控制台”的命令行化分的编辑模式[12,13]。因此,该软件是基于python环境下,以PyCharm为编辑代码工具,主要利用anaconda和tkinter开发完成的[15]。设计流程主要包括:软件前期的设想与准备、搭建操作平台、导入所需要的数据库和函数、编写功能函数、设计用户界面、软件的测试与改良。主要功能是检验靶序列是否正确,完成靶序列的转换和存储,最终获得oligo1和oligo2两个序列。
2.2.1 软件界面
软件界面如图3所示。
图3 软件界面
图3中有5个功能框:引物名称、靶序列、+G、oligo1、oligo2,包含3个功能键:start、clear、save。其中引物名称、靶序列是必填项,+G、oligo1、oligo2是按start后自动生成的,
这个软件可以进行批量生产,最后可将所得到的数据保存成Excel格式。
2.2.2 软件功能
软件正常操作及结果如图4所示。
图4 软件功能实例
图4中所示为对3个引物:A18、G14、D3进行引物处理。start键的功能是检查序列是否符合规范,它能检查到每一位碱基是否符合规定,并且能精确到每一位,并对靶序列进行操作。只有当检查到序列满足要求时,才能进行下步操作,编辑出符合规定的+G、oligo1、oligo2序列,并显示在功能框中。clear键的功能是清除方框中的数据,并可以接着进行下一序列的设计。save键的功能是将运行后的结果选择存储位置,并将该数据以Excel格式进行保存。引物名称框需要用户输入靶序列的名称。靶序列框需要用户输入将要处理的靶序列。+G框内是可以判断靶序列的头端是否包含“G”,若包含“G”则不处理,若不包含,则需要在序列开头+G。oligo1框内功能是把+G后的靶序列前端加上“5-CACC”,在最后端加上“-3”。oligo2框内功能是在序列前端加上“5-AAAC”,然后连接对oligo1从3端按照碱基互补配对原则进行匹配的序列,最后在最后端加上“-3”。
2.2.3 序列结果保存
结果保存如图5所示。
图5 序列结果保存
上述操作的结果会按照规定的格式存储在表格中,用户可以自行选择存储路径,这样的结果简洁规范,不需要进行人工地核对,节省了时间提高了精确度。其结果文件方便发给引物公司,进行后续工作,加快了研究工作进度。
因为编辑的序列只有20碱基,且只能包含“A、T、G、C”四个字母。当使用者在功能框输入序列信息,并点击相应功能按钮时,软件会对输入的序列进行检测。程序将首先检验输入序列的长度,序列长度若大于20或者小于20,将会弹出提示框,若长度刚好为20,程序将检验序列的字母,确保输入的序列只含有“A、T、G、C”,若输入正确,程序将会为输入序列进行相关操作并保存相应信息。若输入的为“A、T、G、C”以外的字母,程序将会出现提示对话框并要求用户重新输入正确的序列。下面提供了检测序列的函数(图6)。
图6 检测序列函数代码
(1)靶序列出错,碱基没有按照要求填写,输入的序列不是满足只有“A、T、C、G”这四个字母含有其他的字母。如图7所示。
图7 检测序列错误
(2)靶序列至少有一行长度不符合长度不符合要求(即不满足20个碱基数)。如图8所示。
图8 检测长度错误
(3)在没有输入靶序列时,还进行操作出错。如图9所示。
图9 未输入靶序列错误
本课题组所研发的基于Python的Crispr/Cas9 oligos批量生成器顺利完成了测试,可以自动地以特定方式对靶序列进行添加和编辑,以生成符合要求的oligos序列。与手动编写相比,该软件不仅节约了科研人员的时间与精力,提高了工作效率,而且大大降低了错误率。如果可以继续推广这个软件,将加快相关科研工作的展开,更有利于Crispr/Cas技术的发展与应用。
尽管Crispr/Cas9 oligos批量生成器尚存在一些不足:比如读取序列文件功能还未实现、序列查错可以更加人性化以及可以添加更丰富的引物设计方案等。而且相信随着我们不断地完善,这款软件一定会变得更加人性化,功能也会更加强大,更快地成为科研工作者的友好工具。
基于Python的Crispr/Cas9 oligos批量生成器源代码可在GitHub和谷歌云盘上免费获得,上传网址分别为:https://github.com/scuec-channel/oligo-generator.git和https://drive.google.com/open?id=1nNRzZ9u0rTLbmiv2L-xG4eUHRK9ZLcQ8(The source code for the python-based Crispr/cas9 oligos batch generator is freely available on GitHub and Google cloud disk,Upload url:https://github.com/scuec-channel/oligo-generator.git and https://drive.google.com/open?id=1nNRzZ9u0rTLbmiv2L-xG4eUHRK9ZLcQ8)。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!