蛋白质氨基酸测序原理
南京大学龙亿涛教授团队在纳米孔道中的单分子特征离子指纹图谱研究进展
纳米孔道是一种自然界广泛存在的可运输离子、水分子和生物分子的纳米级孔道。生物纳米孔道可由天然的蛋白质构成。近年来,研究人员利用电场力将单个分子牵引至单个生物纳米孔道内,排开孔道内的部分离子,进而产生特征的离子流阻断信号反应了单分子的化学组成、质量、结构等信息,这便是纳米孔道单分子电化学的基本原理。纳米孔道内壁氨基酸残基、质子、离子及单个传输分子之间发生的协同弱相互作用还会引起限域空间内几十个离子的瞬态变化,其产生的极微小的离子流信号常常被掩盖在纳米孔道的电流噪声中,使得这些单分子特征信息无法获取。
龙亿涛教授团队多年聚焦于对电化学高精度测量仪器的研制,通过新的复杂信息提取方式,获取了纳米孔道离子流信号的瞬时频率,发展了单分子时频谱学分析技术,阐明了纳米孔道电流中低频域区频率特征值的物理化学特性,提出了单分子频率指纹图谱的数学模型,建立起孔道内离子指纹图谱的谱学分析方法,实现了对突变Aerolysin纳米孔道内离子相互作用网络特性的预测。
图1. 纳米孔道中的单分子特征离子指纹图谱分析方法 (A)纳米孔道单分子电化学测量原理图(左);单个模型分子poly(dA)4通过Aerolysin纳米孔道产生的离子流特征信号(右上),及该信号被经验模态分解(EEMD)后获得的本征模态函数(IMF);(B)经希尔伯特-黄瞬时频率分析变换后的单分子特征离子频率谱图;(C)低频域区下单分子特征离子频率谱图。
?研究团队将单个单个模型生物分子poly(dA)4穿过Aerolysin蛋白质孔道所获得的离子流电号经过经验模态分解(EMD)及希尔伯特谱分析(HAS),获得了信号在整个测量频率相应范围内的单分子特征离子频率谱图,提取了特征峰值频率(fm)和峰值振幅(am)。通过研究不同pH、电解质浓度及类型、外加电压、温度等条件下的单分子特征频率指纹图谱变化,发现离子、单个传输分子、纳米孔道内壁氨基酸残基间的可逆平衡调节了质子、离子与纳米孔道的结合/解离过程,影响了离子流电信号的低频组分。进一步,研究团队总结了特征频率的物理化学特性,即fm反映了纳米孔道内离子与孔道内壁氨基酸残基间的解离速率,am描述了纳米孔道内壁氨基酸残基在限域相互作用网络下的结合离子数目。
图2. 特征峰值频率(fm)和峰值振幅(am)的影响因素研究 (A) pH;(B)离子强度;(C)离子种类;(D)实验温度;(E) 施加电压。揭示离子相互作用网络的峰值频率(上)和峰值振幅(下)。
图3. 单分子特征离子指纹图谱及预测研究 (A)系列238位点突变型AeL纳米孔道238(左)及特征峰值频率(fm)的相关性分析(右);(B)特征峰值频率(fm)与突变氨基酸等电点,单分子阻断时间,突变氨基酸范德华体积间的非线性依赖关系;(C) 238位点突变型AeL纳米孔道的单分子特征离子指纹图谱预测模型。
为进一步验证单分子特征离子指纹图谱的普适性,研究人员构建了系列238位点突变型Aerolysin纳米孔道,改变了纳米孔道灵敏探测区域内氨基酸残基与单个生物分子的相互作用,归纳了氨基酸残基的化学特性对频率指纹特性的影响规律。实验结果显示,在无分析物存在于纳米孔道的情况下,特征峰值频率(fm)与体系电导相关;而在有单个分子通过纳米孔道的时候,特征峰值频率(fm)与突变位点氨基酸残基化学性质的相关性显著增加。进一步,利用多元回归分析建立了单分子频率指纹图谱经验模型,描述了离子指纹图谱特征fm和氨基酸残基电性、范德华体积、亲疏水性等物理化学特征间的关系,实现了对突变型纳米孔道离子指纹图谱频率特征的预测。该方法有助于精准探测纳米孔道单分子动态相互作用,实现纳米孔道单分子蛋白质测序。
?相关成果以“Single-Molecule Frequency Fingerprint for Ion Interaction Networks in a Confined Nanopore”为题(VIP Paper),发表于《德国应用化学》(Angewandte Chemie International Edition)文章链接:网页链接
该工作得到了国家自然科学重大科研仪器研制项目及优秀青年基金项目、南京大学化学和生物医药创新研究院的支持,南京大学化学专业博士研究生李欣怡为论文的第一作者,应佚伦教授和龙亿涛教授为论文的通讯作者。
来源:南京大学
承启生物发布超高精度蛋白质测序方案,蛋白质测序实用化时代到来
深圳2022年3月21日 /美通社/ — 近日,承启生物发布由其首席科学家、暨南大学张弓教授团队研发的一种方便操作、超高精度蛋白质全长测序方案,准确率可达99-100%,刷新了迄今为止的世界纪录。该方案使得蛋白质测序实用化,在生物学、医学、生物安全、法医物证等领域有广阔的应用前景。
蛋白质是由20种氨基酸组成的长链,是所有生命功能的实际执行者。氨基酸序列决定着蛋白质的功能,绝大多数疾病都是由于蛋白质的异常而导致的。虽然绝大部分蛋白质由基因转录翻译而来,但许多机制可以使蛋白质序列在这个过程中发生变化,一个基因可以产生少则一两种、多则几万种不同的蛋白质,因此对蛋白质的序列进行直接研究就尤为重要。
蛋白质测序的精准化和实用化,在许多领域可以产生前所未有的应用。例如,利用蛋白质测序比核酸测序更快速、更不容易被污染干扰的特点,癌症、老年痴呆等重疾的早筛和诊断将变得更加快捷方便;遇到生物安全事件(如重大疫情)时,蛋白质测序能几个小时内快速锁定病原体,大幅缩短疫情初期明确病原体的周期,为应对疫情争取宝贵时间;抗体药物研发过程中对筛选出的优秀抗体进行直接测序,将可以很快通过合成生物学方法大量生产这种抗体,大大缩短抗体药物的研发周期;蛋白质测序技术也可以轻松破解被国外垄断的蛋白质制剂,大幅度降低药品价格;测定从环境中分离到的具有优异特性的蛋白质,如细菌真菌中降解各种污染物的酶,加以改造和工业应用,可实现绿色环保低碳的发展目标。
蛋白质测序技术在1967年就已出现,这比基因测序技术早了约10年,然而现在基因测序技术已高度成熟发达,蛋白质测序技术却一直进展缓慢,完整度低、精准度低、成本高,导致蛋白质测序一直没有得到大范围的应用。这其中最大的区别在于,DNA可以准确地进行复制或互补配对,几乎所有基因测序技术都基于此,而蛋白质无法复制,也无法依据序列来配对。
张弓教授团队在基因测序方面深耕多年,其全自主开发的FANSe系列核酸测序算法是迄今为止稳健性和准确性最高 的比对算法,同时具备很高的容错性。团队将基因组测序中的分步拼接和使用FANSe进行高精度校正的思想移植到蛋白质测序上,对蛋白质质谱分析进行了策略改进,对同一样品的多份质谱数据进行自我比对和校正,最终对蛋白质全长序列的测序准确度达到了空前的99-100%,甚至可以发现买来的标准品蛋白中存在着突变。在不同结构特性的多个蛋白质的测试中,一律能达到近乎完美的全长测序结果,除非质谱仪测不出原始数据。更令人欣喜的是,这个策略甚至能应对质量较差的、有污染的实验数据,同样能稳健地输出准确的结果。实验操作简便,算法也大部分可自动化运行,因此这种方法成本低、速度快、易于推广。
正如基因测序精准化、廉价化之后引发人类生活和产业的巨变一样,蛋白质测序精准化、廉价化,将又一次给人类社会带来巨变。
目前,这一蛋白质测序方法的论文已在分析化学的权威期刊Analytical Chemistry上发表,算法可在承启生物网站上免费下载:
参考资料:Highly Robust de Novo Full-Length Protein Sequencing, Anal. Chem. 2022, 94, 8, 3467–3475
承启生物发布超高精度蛋白质测序方案,蛋白质测序实用化时代到来
有哪些看似离生活很遥远但很必要的科学研究?
看到这个问题,我居然脑中马上冒出了一堆答案…..而这一堆答案,都可以归属于一个名词范畴——基础研究(basic research),当然,与之对应的还有一个名词——应用性研究(applied research)
为什么这么说呢?想当年,我博士一毕业就去了企业,一个最主要的原因,就在于我不想继续做基础研究。而之所以不想继续做基础研究的原因,就是因为,它们往往离我们生活太远了,我甚至都无法让我爸妈理解,我博士期间盯着一个蛾子研究了 4 年,还维持很兴奋,到底是为了什么……
那基础研究和应用性研究有什么区别呢?如果粗暴一点总结,大部分基础研究的出发点是为了填补人类对未知世界的认知,而应用性研究的出发点,是为了解决人类的某一种具体的需求。这就是为什么通常企业都只做应用型研究,而基础研究往往主要是在高校和科研机构中开展。
这么一看,是不是就明白了,为什么已看到题目,我脑子马上蹦出了基础研究这个词。但是,虽然从现实层面来看,应用性研究好像确实更有价值,但是!我可以很负责任的告诉你,现在很多应用性研究的底子,都是从数十年前的基础研究中来的,甚至可以说,没有基础研究,就不会有应用性研究。
下面就到了讲故事时间了,作为一个生物人,当然要给大家提一提,绿色荧光蛋白 (Green fluorescent protein:GFP)和水母的故事。
1962 年,一个神奇的现象,引起了日本研究人员下村脩的兴趣,为什么有一种水母(维多利亚多管发光水母(Aequorea victoria))会在晚上发光?随后,在他的推动下,他的团队在水母体内发现了冷光蛋白质水母素与绿色萤光蛋白,以及编码它们的基因。绿色萤光蛋白是一个由约 238 个氨基酸组成的蛋白质,从蓝光到紫外线都能使其激发,发出绿色萤光。整个发光过程,需要这两种蛋白的配合,且这个冷光蛋白质与钙离子(Ca2+)可产生交互作用。
谁能料到,就这样一个在当时看上去平淡无奇,离我们生活很远,甚至在中途因为无法获取足够得研究经费一度被放弃的研究,却在其它研究学者的持续改良下,在几十年后彻底重新定义荧光显微镜,并且被做成了经典的分子生物学追踪体系,让很多的研究得到了极大的推动。
比如把绿色萤光蛋白基因克隆到其它模式生物上进行表达,由于其发光的特性,常被用做报导基因(reporter gene),可以帮助研究人员对含有特定成分的细胞在体内进行追踪,比如我们想要了解神经系统的发育途径,就可以通过大脑中出现荧光的顺序来获取信息。而这些应用性研究的结论,又最终被用在医学上,使我们人类在日常生活中获益,所谓天道轮回,有没有感觉到很神奇?
当然,2008 年 10 月 8 日,发现 GFP 的下村脩、后期改良 GFP 的美国科学家马丁·查尔菲和钱永健也因此,在 2008 年获得了当年的诺贝尔化学奖。
当然类似的科学研究还有很多,比如当年花费 30 亿美金,由 6 国科学家共同参与,与曼哈顿原子弹计划和阿波罗登月计划齐名的人类基因组计划,在当时看来,无疑是跟大众的生活是毫不相干的研究,却在今天与我们每个人息息相关。
比如,通过基因组比对,我们真的发现有一些突变与疾病的产生有相当的关联性,一些完全不抽烟,但患肺癌基因风险较高的人群,肺癌的患病率却比有些基因风险较低的重度烟民高出 40%。
而现在的基因测序成本,已经降低到全民都可以接受的程度,那么,如果我们每个人从一出生就获得了自己的基因组数据,是不是就可以根据自己基因层面的风险,从小就开始针对性的注意自己的生活饮食习惯,从而极大的降低未来的患病概率呢?
人均 120 岁的目标,说不定真的能在 21 世纪实现!