亚氨基酸内盐
【#ARK Invest#?科技洞察:DeepMind的AlphaFold开创了计算生物学的新时代】
蛋白质是地球上所有生命所必需的。它们由成百上千个相连的亚单位组成,称为氨基酸。每一种氨基酸的大小、形状和电荷都是独一无二的,当蛋白质链固定到一个舒适的位置时,它会使蛋白质在三维空间中扭曲和扭曲。由此产生的结构决定了蛋白质的功能。例如,在红血球中发现的一种蛋白质,血红蛋白有一个与氧气(O2)结合的凹槽,将氧气输送到全身。
传统上,科学家使用像x射线晶体学这样的成像技术来确定蛋白质结构。1972年,化学家克里斯蒂安·安芬森提出蛋白质的氨基酸序列决定了它的三维结构。从那时起,为了避免实验的高成本,研究人员试图用强力计算来“模拟”蛋白质结构,但这种计算并未削减蛋白质结构。
1994年,John Moult和Krzysztof Fidelis教授创立了蛋白质结构预测技术的关键评估(Critical Assessment of technologies for Protein Structure Prediction,CASP),这是一项两年一次的蛋白质折叠方法评估。直到2018年,Alphabet(GOOGL)的人工智能(AI)研究子公司DeepMind用一种称为AlphaFold的基于神经网络(NN)的算法让财团大吃一惊,直到2018年。
而DeepMind用AlphaFold震惊了世界,AlphaFold是一种能够预测蛋白质结构的算法,与当代实验方法相当。CASP财团认为准确度得分高于90 GDT1是可行的解决方案。AlphaFold的平均得分为92.4 GDT。
在ARK看来,AlphaFold是一个极大的突破,原因有二。
首先,神经网络训练集不包括专有数据,只有一个免费的公共数据库中已知的约170000个蛋白质结构。
其次,根据ARK的估计,DeepMind只花了20000美元就训练出了AlphaFold,展示了新的NN架构与计算生物学领域的深层专业知识相结合的强大功能。
虽然AlphaFold似乎有望在药物发现、蛋白质工程和基础生物学方面取得重大突破,但其预测蛋白质的准确性可能存在局限性,与模型训练集中的蛋白质不同。期待DeepMind在其即将发表的关于AlphaFold的论文中对这一潜在弱点进行讨论。
#科技快讯# #人工智能# #谷歌#
《中国大百科全书(第2版)》读书笔记01197-氨基酸
氨基酸 amino acid
甘氨酸分子模型
一类既含氨基又含酸性基团的有机化合物。已发现的氨基酸、亚氨基酸有700余种,其中绝大多数是L-型的α-氨基酸。构成蛋白质的常见的氨基酸有20种,严格地说19种氨基酸和1种亚氨基酸是构成蛋白质所必需的。
丝氨酸分子模型
α氨基酸的结构如图所示。在同一个碳原子上同时接有氨基、羧基、氢原子和一个侧链基团(R)。最简单的氨基酸是甘氨酸(Gly),它的侧链基团都是氢原子。其他含有脂肪族侧链基团的有丙氨酸(Ala)、缬氨酸(Val)、亮氨酸(Leu)、异亮氨酸(Ile);侧链含有脂肪族羟基的有丝氨酸(Ser)和苏氨酸(Thr);侧链含有芳香族基团的有苯丙氨酸(Phe)、酪氨酸(Tyr)和色氨酸(Trp);组氨酸(His)的侧链为咪唑基团。除了上述的中性氨基酸外,还有在中性环境带有正电荷的赖氨酸(Lys)和精氨酸(Arg)两种碱性氨基酸;谷氨酸(Glu)和天冬氨酸(Asp)是两种酸性氨基酸。后两种酸性氨基酸的侧链羧基为酰胺所代替时各成为谷氨酰胺(Gln)和天冬酰胺(Asn)。此外还有两个含硫的氨基酸,半胱氨酸(Cys)和甲硫氨酸(Met)。除Gly外,α-氨基酸都有两种异构体,分别称L型和D型。存在于蛋白质中的氨基酸都是L型。脯氨酸(Pro)是一个环亚氨基酸,它的结构见图中的(2)。此外,在蛋白质中还有很罕见的硒代半胱氨酸和吡咯赖氨酸。
异亮氨酸分子模型
蛋白质中的这些氨基酸均是由三联体核苷酸编码的。在蛋白质分子成熟过程中,有不少氨基酸的侧链经过酶的作用转变成它们的衍生物。这是蛋白质翻译后加工的一个重要内容。
脯氨酸分子模型
有些氨基酸,动物自身不能合成而必须从食物中获得,缺乏这些氨基酸会导致营养不良。这类氨基酸被称为必需氨基酸。对人体来说,必需氨基酸包括:Val、Leu、Ile、Thr、Phe、Trp、Lys和Met。而Arg和His仅是婴儿必需的,需适量补充。
色氨酸分子模型
α-氨基酸具有多种多样的性质。最主要的有两种。一是它们的氨基和羧基都能电离,可成为兼性离子。二是它们同时具有亲水-疏水性质。此外,它们形成α-螺旋和β折叠链的倾向也各不相同;它们的侧链R的大小也有很大差别;分子中的一些带负电性的原子还能形成氢键。这些性质对于蛋白质的结构和功能均产生很大的影响。
苯丙氨酸分子模型
除了参与蛋白质形成的常见的20种氨基酸外,在机体中还有其他多种多样的氨基酸。如高等动物代谢中间产物鸟氨酸和瓜氨酸,起激素作用的甲状腺素(即碘代酪氨酸),以及作为神经递质的γ氨基丁酸等。植物中也有许多种游离氨基酸,其功能多数尚不详。
赖氨酸分子模型
氨基酸不仅是机体中构成蛋白质的必不可少的组分,还是合成肽的原料和重要的试剂。还可用作调味剂、食物添加剂和药物。谷氨酸钠盐,即味精,世界年产量在30万吨左右。Gly可作甜味剂。许多种氨基酸的混合液是重要的急救药,用于补液。个别氨基酸也可药用。
缬氨酸分子模型
生产氨基酸的主要方法是发酵法,几乎找到了生产所有蛋白质中所含氨基酸的发酵菌。如L-Glu、L-Lys、L-Arg等都可以用发酵法生产。利用酶的专一性,可将其底物转变成相应的氨基酸糖。例如天冬氨酸酶可以将富马酸转变成L-Asp。微生物发酵法价格低廉,但是酶法的产物容易提纯。
天冬氨酸分子模型
摘自:《中国大百科全书(第2版)》第1册,中国大百科全书出版社,2009年
《中国大百科全书(第2版)》读书笔记01197-氨基酸
【
#奥密克戎BA.2.12.1变异株进入广东#!】《中国疾病预防控制中心周报(英文)》5月16日报告了我国首例确诊感染新冠病毒“奥密克戎”亚型毒株“BA.2.12.1”的境外输入病例的具体情况。
2022年4月23日,一架从肯尼亚内罗毕起飞的国际航班KQ880抵达广东省广州市白云国际机场。所有旅客均被转移至隔离酒店进行14天常规医学观察和常规核酸检测。
其中一名患者,27岁,中国男性,于2022年4月27日报告新型冠状病毒核酸阳性。该患者有完整的新冠病毒疫苗接种史,并且在过去14天内没有接触过其他新冠肺炎病例。确诊后,他被转至广州市第八人民医院接受治疗。
2022年4月30日,使用Illumina MiniSeq平台对患者的鼻拭子样本进行测序,基因分型结果显示患者感染了奥密克戎亚型毒株BA.2.12.1。在刺突基因上共检测到33个氨基酸突变位点。其中L452Q和S704L为BA.2.12.1亚谱系的关键位点。该序列已提交给国家基因组数据中心。
2022年5月4日,世界卫生组织提醒密切监测亚型BA.2.12.1。与其他奥密克戎亚型毒株相比,BA.2.12.1亚型具有更强的免疫逃逸能力,一些研究表明BA.2.12.1的传播率比BA.2快23%至27%。亚变异传播非常迅速,导致美国许多地区重新流行,至少有17个国家报告了病例。(人民日报健康客户端)