蛋白质氨基酸序列方向
四种DNA字母要编码20种氨基酸。绝不可能是一对一编码,也不可能是二对一编码,因为两个字母最多只能组成16种组合(4×4)。因此,最低要求是三个字母,也就是DNA序列里面最少要有三个字母对应到一个氨基酸,被称为三联密码,后来被克里克和西德尼·布伦纳证实。
但是这样看起来似乎很浪费,因为用四种字母组成三联密码,总共可以有64种组合(4×4×4),这样应该可以编码64个不同的氨基酸,那为什么只有20种氨基酸呢?一定有一个神奇的答案来解释为什么4种字母,3个一组,拼成64个单词,然后编码20种氨基酸。
1952年,沃森就曾写信告诉克里克:“DNA合成信使RNA(mRNA), mRNA合成蛋白质。”克里克开始研究这一小段mRNA的字母序列,如何翻译成蛋白质里面的氨基酸序列。他认为mRNA可能需要一系列“适配器”来帮助完成翻译,每一个适配器都负责携带一个氨基酸。当然每一个适配器一定也是RNA,而且都带有一段“反密码子”序列,这样才能和mRNA序列上的密码子配对。
适配器分子也由RNA分子组成。它们现在叫作“转运RNA”或tRNA。现在整个工程变得有点像乐高积木,一块块积木接上来又掉下去,一切顺利的话,它们就会这样一个接一个地搭成精彩万分的聚合物。
随着实验技术进步而且越来越精密,在20世纪60年代中期许多实验室陆续解开了序列密码。然而经过一连串不懈的译码工作后,大自然却好像随兴地给了个潦草结尾,让人既困惑又扫兴。遗传密码子的安排一点也不具创意,只不过“简并”了(意思就是说,冗余)。有三种氨基酸可对应六组密码子,其他的则各对应一到两组密码子。每组密码子都有意义,还有三组的意思是“在此停止”,剩下的每一组都对应一个氨基酸。这看起来既没规则也不美,根本就是“美是科学真理的指南”这句话的最佳反证。甚至,我们也找不出任何结构上的原因来解释密码排列,不同的氨基酸与其对应的密码之间似乎并没有任何物理或化学的关联。
克里克称这套让人失望的密码系统为“冻结的偶然”,而大部分人也只能点头同意。他说这个结果是冻结的,因为任何解冻(试图去改变密码对应的氨基酸)都会造成严重的后果。一个点突变也许只会改变几个氨基酸,而改变密码系统本身却会从上到下造成天大灾难。就好似前者只是一本书里无心的笔误,并不会改变整本书的意义,然而后者却将全部的字母转换成毫无意义的乱码。克里克说,密码一旦被刻印在石板上,任何想改动它的企图都会被处以死刑。这个观点至今仍有许多生物学家认同。
如何设计实验研究蛋白的功能
新华社合肥2月10日电(记者周畅)蛋白质是生命的基础,国际上早有关注如何通过氨基酸的人工排列组合设计蛋白质。中国科学技术大学刘海燕教授、陈泉副教授团队采用数据驱动策略,开辟出一条全新的蛋白质从头设计路线,在蛋白质设计这一前沿科技领域实现了关键核心技术的原始创新,为工业酶、生物材料、生物医药蛋白等功能蛋白的设计奠定了坚实基础。
蛋白质的结构与功能由氨基酸序列所决定。目前,能够形成稳定三维结构的蛋白质,几乎全部是天然蛋白质,其氨基酸序列是长期自然进化形成。在天然蛋白结构功能不能满足工业或医疗应用需求时,想要得到特定的功能蛋白,就需要进行蛋白质设计。近年来,国际上蛋白质从头设计的代表性工作主要采用天然结构片段作为构建模块来拼接产生人工结构。然而,这种方法存在设计结果单一、对主链结构细节过于敏感等不足,限制了设计主链结构的多样性和可变性。
中国科学技术大学相关团队长期深耕计算结构生物学方向的基础研究和应用基础研究。刘海燕教授、陈泉副教授团队十余年来致力于发展数据驱动的蛋白质设计方法。该团队首先建立了给定主链结构设计氨基酸序列的模型,进而发展了能在氨基酸序列待定时从头设计全新主链结构的模型。理论计算和实验证明,用新方法设计蛋白质,能够突破只能用天然片段来拼接产生新主链结构的限制,显著扩展从头设计蛋白的结构多样性,设计出不同于已知天然蛋白的新颖结构。
该团队发布了9种从头设计的蛋白质分子的高分辨晶体结构,其中5种蛋白质具有不同于已知天然蛋白的新颖结构,相关成果北京时间2月10日发表于国际权威学术期刊《自然》。审稿人认为,这项工作中提出的方法具有足够的新颖性和实用性;从头设计蛋白质具有挑战性,该工作中6种不同蛋白质的高分辨率设计是一项重要成就,证明这种方法运行良好。(完)
我国科学家建立蛋白质设计新方法,如何设计实验研究蛋白的功能
谷歌的Deepmind声称已经能从蛋白质的氨基酸序列准确预测蛋白质结构,这可是生物学上的无比重大的突破,施一公要失业了,可以全职去当西湖大学校长了。