编码氨基酸为什么叫编码氨基酸
四种DNA字母要编码20种氨基酸。绝不可能是一对一编码,也不可能是二对一编码,因为两个字母最多只能组成16种组合(4×4)。因此,最低要求是三个字母,也就是DNA序列里面最少要有三个字母对应到一个氨基酸,被称为三联密码,后来被克里克和西德尼·布伦纳证实。
但是这样看起来似乎很浪费,因为用四种字母组成三联密码,总共可以有64种组合(4×4×4),这样应该可以编码64个不同的氨基酸,那为什么只有20种氨基酸呢?一定有一个神奇的答案来解释为什么4种字母,3个一组,拼成64个单词,然后编码20种氨基酸。
1952年,沃森就曾写信告诉克里克:“DNA合成信使RNA(mRNA), mRNA合成蛋白质。”克里克开始研究这一小段mRNA的字母序列,如何翻译成蛋白质里面的氨基酸序列。他认为mRNA可能需要一系列“适配器”来帮助完成翻译,每一个适配器都负责携带一个氨基酸。当然每一个适配器一定也是RNA,而且都带有一段“反密码子”序列,这样才能和mRNA序列上的密码子配对。
适配器分子也由RNA分子组成。它们现在叫作“转运RNA”或tRNA。现在整个工程变得有点像乐高积木,一块块积木接上来又掉下去,一切顺利的话,它们就会这样一个接一个地搭成精彩万分的聚合物。
随着实验技术进步而且越来越精密,在20世纪60年代中期许多实验室陆续解开了序列密码。然而经过一连串不懈的译码工作后,大自然却好像随兴地给了个潦草结尾,让人既困惑又扫兴。遗传密码子的安排一点也不具创意,只不过“简并”了(意思就是说,冗余)。有三种氨基酸可对应六组密码子,其他的则各对应一到两组密码子。每组密码子都有意义,还有三组的意思是“在此停止”,剩下的每一组都对应一个氨基酸。这看起来既没规则也不美,根本就是“美是科学真理的指南”这句话的最佳反证。甚至,我们也找不出任何结构上的原因来解释密码排列,不同的氨基酸与其对应的密码之间似乎并没有任何物理或化学的关联。
克里克称这套让人失望的密码系统为“冻结的偶然”,而大部分人也只能点头同意。他说这个结果是冻结的,因为任何解冻(试图去改变密码对应的氨基酸)都会造成严重的后果。一个点突变也许只会改变几个氨基酸,而改变密码系统本身却会从上到下造成天大灾难。就好似前者只是一本书里无心的笔误,并不会改变整本书的意义,然而后者却将全部的字母转换成毫无意义的乱码。克里克说,密码一旦被刻印在石板上,任何想改动它的企图都会被处以死刑。这个观点至今仍有许多生物学家认同。
抗病毒的细胞
人类有两万多个基因,储存着生命从生长到凋亡的全部信息。从发现DNA结构,到解读、编写DNA,科学家们不遗余力地探索DNA的秘密,赋予生命规律以科学意义。
中科院深圳先进技术研究院(以下简称深圳先进院)与美国哈佛大学的科研人员合作,在8月2日发表于《自然—通讯》的论文中,利用多重复合碱基编辑技术,提供了在人类基因组中将蕴藏遗传信息的碱基序列TAG转换为TAA的技术框架,并一次转染成功实现了多达33个基因位点的同步编辑,将来结合蛋白质工程化可赋予细胞抗病毒的能力。
该研究为哺乳动物基因组多重复合编辑,以及基因组重编码制备抗多种天然病毒的人类细胞系提供了方向与路径。
编写生命体的“摩斯密码”
战争时期,人们通过摩斯密码传递信息。而在生命体中,蕴藏着一串“遗传密码”。
在DNA的双螺旋结构中,A、T、C、G是其结构上的碱基,通过不同的碱基配对,最终可以排成64个密码子,被称为生命的“遗传密码”,包括了能够编码20种天然氨基酸的61个密码子,以及作为终止信号的3个密码子。而该研究正是利用基因组重编码技术针对“遗传密码”进行编码,旨在赋予生命体或细胞以抗病毒能力。
2016年,论文共同通讯作者、哈佛大学医学院教授George Church等人提出了基因组编写计划(GP-write),旨在从被动读取基因组转向主动编写基因组,利用生物工程技术解决人类面临的许多全球问题,如病毒感染、濒危物种增多、气候变暖等。2018年,GP-write发起者们提出了基因组重编码来构建抗病毒人类细胞系计划。
在此基础上,研究团队提出了制备抗病毒人类细胞系的一个潜在方案,即在全基因组范围内将终止密码子TAG转化为TAA,并将内源性真核释放因子替换为具有选择性通读的工程化突变体,使人类细胞系具有抗病毒能力。
研究初期,为了快速且精准地定位DNA密码子的具体位置,研究团队自主研发了GRIT软件。
“GRIT软件就像一个‘搜索引擎’,它能够在全基因组范围内进行搜索,定位所需要的密码子,同时能够提供改造密码子所需的向导RNA(gRNA)。我们利用GRIT软件识别了人类基因组中所有的TAG密码子,并合成了将TAG转换为TAA的gRNA,用于碱基编辑。”论文共同第一作者、深圳先进院合成所博士陈宇庭说。
随后,他们借助多个gRNA同步递送及胞嘧啶碱基编辑器(CBE)稳定表达进行非靶向链C到T修改,成功实现将TAG转换为TAA,并通过全基因组测序、RNA测序、核型分析3种方式对单克隆细胞的转换结果进行评估,结果显示一次转染成功实现了33个基因位点的同步编辑,且没有观察到细胞基因表达异常及明显的染色体异常等。
基因编码迈出“抗病毒”第一步
人类基因组重编码是一个系统而复杂的基因组工程。在该研究中,从识别基因组位置到多位点基因编辑,再将每个可实现的技术环节形成系统的、可操作的工作框架是难点之一。
研究团队历时4年,经过数次模拟、实践与验证后,成功构建了在人类全基因组范围内将TAG终止密码子转换为TAA的工作框架,同时也在技术上实现了通过一次转染在单个克隆中多达33个基因位点的编辑。
该研究迈出了基因组重编码制备抗多种天然病毒人类细胞系的第一步,初步证明了TAG转换为TAA在人类基因组中的可行性,同时创造了一次递送在人类基因组中数十个非重复位点同步碱基编辑的纪录,为哺乳动物基因组的大规模工程化改造提供了一个工作框架。
如今,读取DNA密码的技术日渐精进,但主动、高效、多位点的编写或编辑DNA密码来制备抗病毒的细胞系仍是一个巨大的挑战。
“我们虽在多位点基因编辑技术上有了阶段性的突破,但在抗病毒细胞系的制备方面仍有许多工作要做。例如,需要针对更多位点进行基因编辑,并优化各个技术环节,进行蛋白质工程化改造等。”陈宇庭表示,研究团队将利用基因组重编码技术在提升细胞系抗病毒能力方面开展进一步研究。
“希望该研究能够吸引更多人关注基因组大规模编辑或编写及重编码制备抗病毒细胞系这一领域,共同进行下一步研究。”陈宇庭说。(刁雯蕙 苏芊)
来源: 中国科学报
抗病毒人类细胞系制备迈出第一步,抗病毒的细胞
生物学家劳伦斯·赫斯特和斯蒂芬·弗里兰在20世纪90年代末把天然基因密码和计算机随机产生的几百万组密码拿去比对,结果轰动一时。他们想知道,如果发生点突变这种把一个字母换掉的变异,哪一套密码系统能保留最多正确的氨基酸,或将它代换成另一个性质相似的氨基酸。
结果他们发现,天然的基因密码最经得起突变的考验。点突变常常不会影响氨基酸序列,而如果突变真的改变了氨基酸,也会由另一个物理特性相似的氨基酸来取代。据此,赫斯特与弗里兰宣称,天然的遗传密码比成千上万套随机产生的密码要优良得多。它不但不是大自然密码学家愚蠢而盲目的作品,而是万里挑一的密码系统。
天然的三联基因密码的第一个字母都有特定的对应方式。举例来说,所有以丙酮酸为前体合成的氨基酸,它们密码的第一个字母都是T。所有由α-酮戊二酸所合成的氨基酸,其三联密码第一个字母都是C;所有由草酰乙酸合成的氨基酸,第一个字母都是A;最后,几种简单前体通过单一步骤所合成的氨基酸,第一个字母都是G。
三联密码的第二个字母和氨基酸是否容易溶于水有关,或者说和氨基酸的疏水性有关。亲水性氨基酸会溶于水,疏水性氨基酸不会溶于水,但会溶在脂肪或油里,比如溶在含有脂质的细胞膜里。所有的氨基酸,可以从“非常疏水”到“非常亲水”排列成一张图谱,而正是这张图谱决定了氨基酸与第二个密码字母之间的关系。疏水性最强的六个氨基酸里有五个,第二个字母都是T,所有亲水性最强的氨基酸第二个字母都是A。介于中间的有些是G有些是C。
三联密码的第三个字母不含任何信息,不管接上哪一个字母都没关系,这组密码子都会翻译出一样的氨基酸。以甘氨酸为例,它的密码子是GGG,但是最后一个G可以代换成T、A或C。
第三个字母的随机性暗示了一些有趣的事情。二联密码可以编码16种氨基酸。如果我们从20个氨基酸里拿掉5个结构最复杂的(剩下15个氨基酸,再加上一个终止密码子)这样前两个字母与这15个氨基酸特性之间的关联就更明显了。因此,最原始的密码可能只是二联密码,后来才靠“密码子捕捉”的方式成为三联密码,也就是各氨基酸彼此竞争第三个字母。
第一个字母和氨基酸前体之间的关系直截了当,第二个字母和氨基酸的疏水性相关,第三个字母可以随机选择。这套密码系统除了可以忍受突变,还可以降低灾难发生时造成的损失,同时可以加快进化的脚步。因为如果突变不是灾难性的,那应该会带来更多的好处。