折叠要几个氨基酸
【Alphafold2与比特币挖矿】计算蛋白质折叠结构,100个氨基酸序列可能产生的三维结构为10的94次方,正解只有一个。 而区块链挖矿机制浪费大量算力在无任何意义的hash值匹配。是不是未来可以考虑结合起来,把挖矿机制换成日常有价值需要的算力上(技术上要解决不可逆性)。比如挖矿算蛋白质折叠、超算实验,城市大脑、环境预测、天气预报。这事可能靠算法大神搞不定,得更多机构联合打通。
2021生命科学最新研究成果
据德国新闻电视频道网站12月16日报道,研究者对人体已经有了相当准确的了解:血管长什么样、癌症是如何形成的、哪些细胞对视力很重要。然而,微观层面的情况仍旧不是很清楚,因为迄今为止,对于人体的基本组成部分蛋白质,我们只了解很少一部分,包括它们具有什么形态以及有何功能。但人工智能正在迅速改变这一切。
报道称,原因是,新的计算机程序能够高度精确地计算蛋白质的三维结构,无需使用耗时而昂贵的测量方法。德国马克斯·普朗克生物化学研究所的安德烈亚斯·布拉赫尔解释道,如果人类了解蛋白质的形态以及功能,就能更好地理解人体内的生物过程和疾病。
布拉赫尔说,这些知识也有助于开发新的药物。研究者希望借助这种新技术来研发针对特定蛋白质的有效物质。
报道还称,另一些专业人士则使用新软件分析新冠病毒奥密克戎变异毒株。他们正在研究遗传物质突变对所谓的刺突蛋白的形态的影响。蛋白质形态变化可能导致人类抗体无法很好地结合以及免疫保护能力下降。
美国《科学》周刊认为这项新技术意义重大,因此将其评选为2021年度科学突破。《科学》周刊主编霍尔登·索普写道:“无论是从科学成就还是对未来研究的影响而言,蛋白质折叠问题上的突破都是有史以来最重大的突破之一。”
报道指出,蛋白质非常小,即便在显微镜下也看不清楚。因此,迄今为止研究者只能使用复杂且昂贵的低温电子显微镜和X射线晶体学等方法来研究蛋白质的结构。《科学》周刊介绍说,使用传统方法来破解一个蛋白质结构就需要耗费好几年时间以及数十万美元。
布拉赫尔表示:“正因如此,我们到现在都不知道人类许多蛋白质究竟长什么样。”迄今为止人类蛋白质中仅有三分之一的结构经实验确定后被储存在一个数据库中,其中许多还只研究了一部分。
“阿尔法折叠”程序和“罗塞塔折叠”程序这两个新程序大大降低了研究成本。约翰·江珀是“阿尔法折叠”程序的开发者,目前在谷歌旗下的“深层思维”公司工作。一支由他领导的团队已经公布了人类蛋白质几乎所有的结构。英国《自然》周刊将他评选为2021年全球十大科学人物之一。江珀基于人工智能开发的程序可以借助储存已知蛋白质结构的数据库进行自我训练。
报道介绍,蛋白质由可以折叠成特定结构并完成特定任务的长链构成。因此,一些蛋白质(酶)可以分解糖分子,另一些则是人体肌肉的结构元素。这些链条由线性排列的氨基酸构成,氨基酸的排列顺序由遗传物质决定。人类共有大约2万个蛋白质编码基因。在蛋白质折叠时,氨基酸之间的吸引力也发挥了作用。
报道表示,如果研究人员发现一个特定基因,就可以在纸上或电脑上推导出一个蛋白质的氨基酸链——数十年来都是如此。但迄今为止,研究者都无法轻易确定蛋白质折叠的精确形态和结构。“然而,要想理解蛋白质的作用方式,这又是很关键的一步。”布拉赫尔解释道。他自己也在使用“阿尔法折叠”程序。
这两个对研究者免费开放的新程序恰好填补了这个空白。布拉赫尔解释说,它们只需要某个蛋白质由遗传物质决定的氨基酸序列,就可以构建出相应的三维模型。他说:“在这之前,我们要花好几年才能搞清楚一个蛋白质的结构,但现在只需要把氨基酸序列输入电脑就行。”
来源:参考消息网
2021年科技热点大追踪:蛋白质研究突破,2021生命科学最新研究成果
AI战胜围棋高手后,再次进军生命科学领域,对蛋白质结构折叠做出精准的预测,这是生命科学的一个重大突破,同时这也让很多人不禁产生疑虑,我们人类将来会不会被AI牵着鼻子走?
2020年11月30日,谷歌旗下的人工智能公司DeepMind的智能程序AIphaFold2,在2020年度的蛋白质结构预测大赛中,战胜100多个团队,获得了冠军,并且第一次把蛋白质结构预测功能做到了接近实用的水平。
我们知道,生物的所有性状和功能主要是由蛋白质决定的,我们的皮肤是黑是白,个子是瘦是胖,头发是黄色还是黑色……都是由蛋白质决定的。而这些性状又取决于蛋白质是怎么样的结构。
可是,蛋白质是如何折叠成各种各样不同的三维结构,从而造就了生物不同的性状和功能的呢?这个问题是目前生物学家们最想知道的,如果找到了它的规律,我们就可以理解很多疾病生产的原因从而采取正确的治疗手段,甚至可以通过对蛋白质结构的控制从而制造出我们想要的蛋白质。
生物的基因通过编码信息构成了氨基酸,氨基酸再转化生成了蛋白质。DNA链条上是由4个碱基A、T、G、C组成的一个个序列片段,而3个相邻的碱基分子对,对应的是一个特定的氨基酸,组成蛋白质的氨基酸分子一共有20种。
在细胞内部,一条300个碱基长度的DNA链条,也就是由100个氨基酸首尾相连组成的链条,就能指导生产一个蛋白质分子。
可是这个链条是如何知道折叠成某个特定的三维结构的呢?也就是在形成这个三维结构的过程中,它怎么知道每个氨基酸应该出现在什么位置,需要哪几个氨基酸靠在一起呢?
如今通过基因测序的技术,我们已经掌握了起码有1.8亿条基因序列,也就是说我们已经知道氨基酸顺序的蛋白质分子已经有1.8亿个,但是它们的三维结构是如何形成的,我们至今还不知道。
那么,通过这些基因序列,我们能不能从这些氨基酸的顺序推测出蛋白质的三维结构呢?所以世界各地,各个研究的团队都想最先找到答案。于是就有了开头所说的大赛。
这个蛋白质结构预测大赛从1994年就开始,如今已经是第14届。这次大赛中,AlphaFold2高居第一,而且得分远远超过排名第二名。
但是AlphaFold2是如何预测出这些结果的,到底它是根据什么规则、什么原理得到了这样的表现?科学们并不知道,因为AlphaFold2对蛋白质结构的预测,已经脱离了任何先验知识。就像战胜围棋高手的AlphaGo,它的后期版本AlphaGo Zero,甚至可以做到,只需要知道围棋的基本规则,就可以在完全无依赖人类之前所有围棋经验的条件下,学习总结出自己的很多绝技,现在人类根本就不是它的对手了。
人工智能已经不再需要人类的经验,就可以完成一些我们无法完成的任务。将来我们很多问题的答案,AI可以让我们唾手可得,可是推导过程,我们却是一无所知。这样的结果,对我们人类的认识,会带来怎么的冲击?人工智能占据我们生活的时代,我们还能岁月静好吗?
#学问分享官# #科学燃计划#