蛋白质紊乱对于生物学功能至关重要,蛋白质的结构异常比您想象的更普遍。具有紊乱区域的蛋白质也可能发粘,并在细胞内部和细胞之间聚集在一起,并直接参与许多神经退行性疾病。因此,能够鉴定蛋白质中的无序区域非常重要。
不幸的是,通过实验表征多肽的结构倾向是挑战性和费时的,因此用于从序列预测蛋白质失调的生物信息学方法是必不可少的。
因此,近年来,许多生物信息学家构建了区分不折叠的肽序列的算法,这些算法也可以基于各种“特征”,这些特征也源自理化参数(如氨基酸的电荷或疏水性)看进化的相关性。
现在已经有了许多这样的预测程序,拥有某种基准来验证和测试预测具有明显的价值。为了解决这个难题,Nielsen和Mulder使用沉积的NMR化学位移数据分析了上百种选定的蛋白质,从而生成并验证了具有代表性的特定于位点和连续性疾病的实验基准。然后,他们分析了26种广泛使用的疾病预测方法的性能,发现这些方法有显着差异。
他们的研究中进行的全面比较将帮助全球的蛋白质科学家就哪些程序最适合使用做出更明智的选择。