疏水氨基酸
生物学家劳伦斯·赫斯特和斯蒂芬·弗里兰在20世纪90年代末把天然基因密码和计算机随机产生的几百万组密码拿去比对,结果轰动一时。他们想知道,如果发生点突变这种把一个字母换掉的变异,哪一套密码系统能保留最多正确的氨基酸,或将它代换成另一个性质相似的氨基酸。
结果他们发现,天然的基因密码最经得起突变的考验。点突变常常不会影响氨基酸序列,而如果突变真的改变了氨基酸,也会由另一个物理特性相似的氨基酸来取代。据此,赫斯特与弗里兰宣称,天然的遗传密码比成千上万套随机产生的密码要优良得多。它不但不是大自然密码学家愚蠢而盲目的作品,而是万里挑一的密码系统。
天然的三联基因密码的第一个字母都有特定的对应方式。举例来说,所有以丙酮酸为前体合成的氨基酸,它们密码的第一个字母都是T。所有由α-酮戊二酸所合成的氨基酸,其三联密码第一个字母都是C;所有由草酰乙酸合成的氨基酸,第一个字母都是A;最后,几种简单前体通过单一步骤所合成的氨基酸,第一个字母都是G。
三联密码的第二个字母和氨基酸是否容易溶于水有关,或者说和氨基酸的疏水性有关。亲水性氨基酸会溶于水,疏水性氨基酸不会溶于水,但会溶在脂肪或油里,比如溶在含有脂质的细胞膜里。所有的氨基酸,可以从“非常疏水”到“非常亲水”排列成一张图谱,而正是这张图谱决定了氨基酸与第二个密码字母之间的关系。疏水性最强的六个氨基酸里有五个,第二个字母都是T,所有亲水性最强的氨基酸第二个字母都是A。介于中间的有些是G有些是C。
三联密码的第三个字母不含任何信息,不管接上哪一个字母都没关系,这组密码子都会翻译出一样的氨基酸。以甘氨酸为例,它的密码子是GGG,但是最后一个G可以代换成T、A或C。
第三个字母的随机性暗示了一些有趣的事情。二联密码可以编码16种氨基酸。如果我们从20个氨基酸里拿掉5个结构最复杂的(剩下15个氨基酸,再加上一个终止密码子)这样前两个字母与这15个氨基酸特性之间的关联就更明显了。因此,最原始的密码可能只是二联密码,后来才靠“密码子捕捉”的方式成为三联密码,也就是各氨基酸彼此竞争第三个字母。
第一个字母和氨基酸前体之间的关系直截了当,第二个字母和氨基酸的疏水性相关,第三个字母可以随机选择。这套密码系统除了可以忍受突变,还可以降低灾难发生时造成的损失,同时可以加快进化的脚步。因为如果突变不是灾难性的,那应该会带来更多的好处。
通过L452R突变判断新冠疫情
俗话说打蛇打七寸,每个生物体都有它的关键点,L452就是新冠病毒的关键点。
氨基酸L即亮氨酸,非极性氨基酸,也叫疏水氨基酸,不溶于水,这样的氨基酸不太容易结合细胞。随着新冠病毒在人群中的传播,通过自然选择,452位点的亮氨酸突变成了R或者Q,R即精氨酸为极性(亲水)碱性氨基酸,在人体组织液中带正电荷;Q即谷氨酰胺为极性(亲水)中性氨基酸,在人体组织液中不带电荷或带弱负电荷。
我们的细胞膜一般情况下(健康人组织液接近中性)带负电荷,而有基础病的人群,体内组织液为酸性,细胞膜不带电荷或带弱正电荷。(这个健康人和基础病人细胞膜带电荷的区别是冠状病毒不同亚型优势感染不同人群的关键)
2021年4月在印度新冠病毒德尔塔因为携带了L452R突变血洗了印度中青年。印度人爱吃洋葱和咖喱,这是免疫系统维护最好的食物,印度人的免疫系统很强的,他们的生存环境不好但是身体健康就是免疫系统好的体现,但是就是这样的人群却被德尔塔血洗,因为德尔塔攻击得正是他们的免疫系统。我记得当时看了一个视频,说是感染的人尿呈绿色,肿瘤患者或血脂高的慢性病患者急性发病期尿是红色的,两者有着明显的不同,按中医理论来说前者是阳亢,后者是阴实。
正在印度爆发疫情的时候,比尔盖茨突然离婚(大家可以细品),我记得有一个在美国打了疫苗的印度教授回印度照顾患病的家人也在印度染疫去世了。
因为新冠病毒452位亮氨酸L变成了精氨酸R(带正电荷),一个关键位点的突变使得新冠病毒更加容易结合健康人细胞膜(带负电荷),所以大量中青年印度人染疫暴病而亡。
当时也有亮氨酸突变成谷氨酰胺的突变株(L452Q),但被更强的L452R压下去了。
病毒突变位点大部分是适应性突变,不起决定作用,如我们的疫苗可以很好地保护原始毒株和阿尔法α,贝塔β,但对德尔塔δ毒株就差一点。关键位点的突变可以突破免疫屏障和物种特异性,往往仅一个氨基酸突变就够了。到底是哪些氨基酸起关键作用,只能是通过自然选择,计算机模拟是模拟不出来的。L452位点是选择出来突破之前新冠病毒免疫屏障的。
当印度人为人类抵挡了德尔塔疯狂攻击后,德尔塔进入了平静期,这时奥密克戎迅速将它代替了。奥密克戎是从艾滋病人体内由新冠病毒早期毒株进化而来,因为奥密克戎没有L452R或者L452Q突变,所以这个奥密克戎不是从德尔塔毒株进化来的。这个毒株传染性极强,应该是获得了其他位置的关键性突变了,到底是哪几个氨基酸,这个得靠科学家花时间一个一个去验证。
但是今年3月9日的《自然》杂志报道了奥密克戎也出现了L452R突变了。文章题目说这个突变点增加了奥密克戎的细胞融合能力,比奥密克戎更容易感染人体,而且还增加了人体(宿主)的糖基化,细胞膜糖基化程度高了会导致炎症,和免疫紊乱,这就可以理解为什么西方有儿童会出现不明原因肝炎。肝细胞糖基化修饰程度高了,炎症起来控制不了。有些人说这些孩子与新冠无关,因为他们体内没有检测到,生活在周围充满病毒的环境里,即使体内病毒含量极低测不到,到不保证他们什么时候被病毒咬了一口就走了,留下了宿主糖基化能力高的后遗症了。
自然杂质报道L452R突变增加了奥密克戎胞膜融合力、感染力和宿主糖基化力
正在西方形成第二波奥密克戎流行的优势毒株B.2.12.1含有L452Q(目前已经占到感染毒株的25%了)。B.2.12.1比现在的奥密克戎传染率更高接近极限了。这次L452R突变被L452Q压下来了。L452Q突变成为优势毒株,它使得病毒对有基础病的人群攻击力强,因为谷氨酰胺带弱负电荷,而基础病患者组织液弱酸性,他们的细胞膜带弱正电荷。这就是自然选择的结果,毕竟奥密克戎是从免疫功能弱的艾滋病人群中进化来的,它们喜欢攻击的对象就是免疫系统弱的人群。
当B.2.12.1成为优势毒株应感尽感后,新冠病毒与人类的演化进程就告一段落了,因为变无可变了。
通过这些分析,我判断当我们控制住B.2.12.1对我们国家的袭击后,新冠病毒的威胁就下降了。后面的任务是确保B.2.12.1不要再形成气候,一直保持在低水平。目前西方已经开始B.2.12.1流行了,我们国家会紧随其后,我判断明年再努力控制B.2.12.1,我们就可以确定新冠疫情的胜利。
病毒贯穿人类始终,也许新冠消停了,另一个高致病的病毒也会突破物种屏障。且行且小心吧。
通过L452R突变判断新冠疫情
DNA分子活性比较低,它需要特定蛋白质的帮助才能完成自我复制。但反过来讲,特定的蛋白质不是无缘无故产生的,它们需要经过自然的筛选,而要通过自然选择,它们就必须能被遗传且能产生变异。然而蛋白质本身不是遗传的模板,它要由DNA编码。所以问题就是,蛋白质没有DNA就无法进化,而DNA没有蛋白质也无法进化。如果两者缺一不可,蛋白质与DNA两者谁先谁后,这类似于鸡生蛋蛋生鸡的问题。
在20世纪80年代中期,科学家有一项超凡的发现,那就是RNA可以当作催化剂。RNA分子很少形成双螺旋,它们常卷成小而复杂的形状,同时具有催化作用。这样一来RNA分子就可以打破前面的困境。在这个假设的“RNA世界”里,RNA既可以扮演DNA的角色也可扮演蛋白质的角色,它可以催化自我复制以及很多其他反应。
从现代细胞工作的角度来看,该假设是有意义的。今天的细胞里,氨基酸并不会和DNA直接接触,当细胞需要合成蛋白质时,许多基础反应都是由核酶(一种具有催化功能的RNA)催化完成的。“RNA世界”假设让整个学界为之着迷,它让生命密码的研究方向,从“DNA密码如何编码蛋白质”转向“RNA和氨基酸之间到底发生了什么”,然而至今我们仍没有明确的答案。
美国生物化学家哈德罗·莫洛维兹与分子生物学家谢利·科普利以及物理学家埃里克·史密斯假设:由成对字母组成的RNA也可以作为催化剂。他们认为双核苷酸会和氨基酸的前体结合,然后催化它们成为氨基酸。至于催化成哪一种氨基酸,则要看双核苷酸里的字母是什么。理论上第一个字母会决定氨基酸的前体,第二个字母决定反应形式。比如说,如果两个字母是UU,那么丙酮酸会先接上来,然后被转换成疏水性极强的亮氨酸。
从这里到三联密码只剩下两步了,而它们都只需要简单的字母配对即可。首先,一段较大的RNA分子和双核苷酸通过惯常的碱基配对法则配对,也就是G配C, A配U。接着氨基酸会被转移到这个较大的RNA分子上,因为分子较大,吸引力也比较大。结果就是一段RNA分子接了一个氨基酸,而氨基酸的种类取决于最初携带它的双核苷酸字母。
第二步则是将二联密码变成三联密码,配对规则不变。如果三个字母配对的效果比两个字母配对来得好(也许好处是分子间有较多空间或结合力较强),那三联密码自然会胜出。
当然整套“RNA世界”理论都还只是假说,目前也没有太多证据可以证明。但是重要的是它为解开密码起源之谜带来希望之光,从简单化学反应到三联密码诞生,看起来也有可能发生,也可以被实验检验。