(资料图)

一个被称为unknome的蛋白质数据库根据人们对蛋白质的了解程度对蛋白质进行排名,结果显示,人们对数千种人类蛋白质几乎一无所知,而其中一些蛋白质对生存至关重要。8月8日,相关成果发表于《科学公共图书馆—生物学》。

为了创造unknome数据库,英国剑桥大学MRC分子生物学实验室的Sean Munro和同事从人类身上发现的大约2万个蛋白质基因入手。他们将密切相关的、可能具有相似功能的人类基因或蛋白质组合在一起,产生了大约7500个蛋白质簇。

接下来,他们将在老鼠或果蝇等常见研究动物中发现的密切相关的蛋白质添加到这些蛋白质簇中,因为这些蛋白质可能也具有相同功能。然后,他们根据基因功能主要信息库中的条目数量,给每个蛋白质簇打分。

一种没有被直接研究过的人类蛋白质,如果其在另一种动物身上的等效蛋白质得到了充分研究,它的得分仍然很高。如果蛋白质在被认为更可靠的条目中出现也会得到更高的分数,比如发表在期刊上。 Munro坦言,这种评分有些武断,但在试图弄清人们未知的东西时,这是不可避免的。

一些蛋白质被研究得十分透彻,因此其得分远远超过100。例如,一种参与胚胎发育的名为音猬因子的蛋白质得分为168,而帮助阻止细胞癌变的蛋白质p53得分为126。然而,仍有超过2200种蛋白质的得分低于2、1100种低于1、超过800种为0。

理论上,这些得分低的蛋白质可能没有被研究过,因为它们没有任何重要的作用。为了解这些蛋白质是否重要,研究小组使用了一种名为RNA干扰的技术,降低果蝇中260种得分低于1的蛋白质的水平。在60个案例中,果蝇死亡,这表明这些特殊的蛋白质具有重要的功能。

Munro说,这对研究果蝇的团队成员来说是一个很大的惊喜。“他们只是假设已经找到了所有可能的重要基因,事实证明并非如此。”

他说,未知蛋白质的数量正在慢慢减少,但他希望加快发现的步伐。目前的问题是,资助机构和研究人员都不愿意冒险研究未知蛋白质,因为他们担心相关的研究工作无足轻重从而无回报。

“甚至可能有我们不知道的生物过程,但没有人在寻找与这一过程有关的蛋白质,因为没有人知道它们。”Munro说,这听起来可能令人惊讶,但被称为CRISPR的基因编辑技术是基于细菌蛋白质的,后者的功能直到2012年才被发现。

推荐内容