氨基酸序列怎么画
蛋白质结构域预测网站smart
科技日报北京7月31日电(记者刘霞)据英国《新科学家》杂志网站近日报道,总部位于英国的人工智能公司“深度思维”宣布,将公布超2亿个蛋白质的结构。该公司在短短18个月内,凭借“阿尔法折叠”算法,预测了迄今被编目的几乎所有蛋白质的结构,破解了生物学领域最重大的挑战之一,将助力应对抗生素耐药性、加速药物开发并彻底改变基础科学。
几十年来,根据氨基酸序列确定蛋白质形状一直是生物学领域的一大难题。2020年底,“深度思维”宣布,该公司的“阿尔法折叠”算法能准确预测折叠蛋白质的结构;2021年中,该人工智能已经能绘制人体内98.5%的蛋白质。近日,该公司宣布将公布超2亿个蛋白质的结构,几乎所有这些蛋白质都被编入全球公认的蛋白质研究库UniProt。
“深度思维”也在与欧洲分子生物学实验室下属欧洲生物信息学研究所合作,创建一个可搜索数据库“阿尔法折叠蛋白结构数据库”,研究人员可轻松、自由地访问相关信息,使搜寻蛋白质结构变得几乎和网络搜索工具一样简单。
很多科学家正在利用“阿尔法折叠”推进多个领域的研究,如牛津大学的马特·希金斯等人正在研究一种他们认为是中断疟疾寄生虫生命周期的关键蛋白质,希望研制出有效的疟疾疫苗;也有科学家用其设计新酶来分解塑料垃圾,并进一步了解使细菌对抗生素产生耐药性的蛋白质。
伦敦帝国理工学院的基思·威廉姆森表示,“阿尔法折叠”改变了生物学研究,但仍存在一些问题,如它无法提取任意氨基酸序列,并精确模拟它们的折叠方式,也无法揭示蛋白质之间复杂的相互作用,另外,其在准确性方面还有待改进。
“深度思维”公司表示,目前正致力于提高该工具的准确性,以进一步了解蛋白质如何生成以及细胞如何工作。
来源: 科技日报
AI预测超过2亿个蛋白质结构,蛋白质结构域预测网站smart
生物学家劳伦斯·赫斯特和斯蒂芬·弗里兰在20世纪90年代末把天然基因密码和计算机随机产生的几百万组密码拿去比对,结果轰动一时。他们想知道,如果发生点突变这种把一个字母换掉的变异,哪一套密码系统能保留最多正确的氨基酸,或将它代换成另一个性质相似的氨基酸。
结果他们发现,天然的基因密码最经得起突变的考验。点突变常常不会影响氨基酸序列,而如果突变真的改变了氨基酸,也会由另一个物理特性相似的氨基酸来取代。据此,赫斯特与弗里兰宣称,天然的遗传密码比成千上万套随机产生的密码要优良得多。它不但不是大自然密码学家愚蠢而盲目的作品,而是万里挑一的密码系统。
天然的三联基因密码的第一个字母都有特定的对应方式。举例来说,所有以丙酮酸为前体合成的氨基酸,它们密码的第一个字母都是T。所有由α-酮戊二酸所合成的氨基酸,其三联密码第一个字母都是C;所有由草酰乙酸合成的氨基酸,第一个字母都是A;最后,几种简单前体通过单一步骤所合成的氨基酸,第一个字母都是G。
三联密码的第二个字母和氨基酸是否容易溶于水有关,或者说和氨基酸的疏水性有关。亲水性氨基酸会溶于水,疏水性氨基酸不会溶于水,但会溶在脂肪或油里,比如溶在含有脂质的细胞膜里。所有的氨基酸,可以从“非常疏水”到“非常亲水”排列成一张图谱,而正是这张图谱决定了氨基酸与第二个密码字母之间的关系。疏水性最强的六个氨基酸里有五个,第二个字母都是T,所有亲水性最强的氨基酸第二个字母都是A。介于中间的有些是G有些是C。
三联密码的第三个字母不含任何信息,不管接上哪一个字母都没关系,这组密码子都会翻译出一样的氨基酸。以甘氨酸为例,它的密码子是GGG,但是最后一个G可以代换成T、A或C。
第三个字母的随机性暗示了一些有趣的事情。二联密码可以编码16种氨基酸。如果我们从20个氨基酸里拿掉5个结构最复杂的(剩下15个氨基酸,再加上一个终止密码子)这样前两个字母与这15个氨基酸特性之间的关联就更明显了。因此,最原始的密码可能只是二联密码,后来才靠“密码子捕捉”的方式成为三联密码,也就是各氨基酸彼此竞争第三个字母。
第一个字母和氨基酸前体之间的关系直截了当,第二个字母和氨基酸的疏水性相关,第三个字母可以随机选择。这套密码系统除了可以忍受突变,还可以降低灾难发生时造成的损失,同时可以加快进化的脚步。因为如果突变不是灾难性的,那应该会带来更多的好处。