来自查理大学理学院,BIOCEV和IOCB(捷克共和国),约翰霍普金斯大学(美国)和ELSI(日本)的一组研究人员发现了为什么现代蛋白质使用20种规范氨基酸(AA)的准通用库。这项发表在《美国化学学会杂志》上的研究表明,可折叠性可能是选择规范字母表的关键因素。
先前的证据表明,古代蛋白质依赖于10个“早期”AA的有限字母表,而10个“晚期”AA是生物合成途径的产物。然而,许多非蛋白质的AAs是益生元可获得的,这就引出了一个问题:为什么我们有目前的现代氨基酸字母表,如果不同的氨基酸组成遗传密码,蛋白质是否也能够折叠成球状结构?
为了回答这个问题,研究小组在合成组合25-mer肽库的背景下通过实验评估了几种益生元相关氨基酸的溶解度和二级结构倾向。将益生元丰度最高的线性脂肪族和碱性残基与其他早期氨基酸一起掺入或代替其他早期氨基酸,以探索这些替代序列空间。
结果表明,尽管益生元丰度很高,但未支链的脂肪族氨基酸仍从蛋白质字母表中清除,因为它们产生的多肽溶解过度且包装效率低。令人惊讶的是,短链碱性氨基酸的加入也降低了多肽的二级结构潜力,研究小组提出了一个生物物理模型。
该研究的结果支持这样一种观点,即尽管缺乏基本残基,但早期的规范字母表在支持蛋白质折叠方面具有显着的适应性,并解释了为什么碱性残基仅在蛋白质进化的后期阶段被纳入。
“我们很高兴发现了蛋白质字母表进化成我们现在所知道的一些原因,”该研究的主要作者Stephen D. Fried和Klara Hlouchova说。“我们的研究结果表明,可折叠性在规范字母的选择中起着关键作用,并解释了为什么一些益生元可用的氨基酸从蛋白质字母表中清除。
这项研究的结果提供了对蛋白质进化的见解,并可能对蛋白质工程和药物设计产生影响。该团队计划进行进一步的研究,以探索其发现的含义。