X射线晶体学方法在非晶态物质研究中的应用取得新进展
原子尺度下的物质结构分析,对于上世纪科学和技术的发展起到了重大的推动作用。这种作用在本世纪还会继续增强。因为,21世纪的、原子尺度下的物质结构分析,有一个重要的动向:其分析对象将从晶态物质向所有非晶态的凝聚态物质扩展。在此个过程中,基于高强度的硬X射线自由电子激光(HXFEL)的X射线衍射分析是义不容辞的主力军,而冷冻电子显微学(Cryo-EM)则是个当仁不让的先锋。
传统的X射线晶体学方法是近原子尺度微观结构解析的主要方法。目前在蛋白质结构库(PDB)中,有89.5%的结构是通过该方法得以解析。然而为了获得理想的衍射强度,使用该方法的一个前提,是获得微米尺度的生物大分子晶体,这一要求对于很多重要的蛋白,如膜蛋白、大分子复合物而言,是难以实现的。而具有高亮度、全相干性以及飞秒脉冲时间结构特点的硬X射线自由电子激光的出现,为这一问题的解决带来了新的希望。在高强度和高相关性射线的轰击下,大量纳米级别的晶体在飞秒量级的时间内就能够提供充分有效的衍射信息,我们将这一新的技术方法称之为串行飞秒晶体学(SFX)。由于纳米晶体的制备要比微米晶体容易得多,因此,串行飞秒晶体学的出现开启了晶体结构解析的新时代。
新时代的开启意味着与之相关的样品制备、数据收集、数据处理方法都需要革新,在这样的机遇下,我们从2014年开始深入研究串行飞秒晶体学的数据分析方法,先后提出了“基于倒空间衍射强度分布规律的衍射数据推演方法”、 “无机粉晶样品的串行飞秒晶体学分析方法”、“同晶置换样品的串行飞秒晶体学分析方法”,以及“串行晶体学数据中杂质信号的消除方法”(Acta Cryst A70, 670-676 (2014).,Acta Cryst. D71, 2513-2518 (2015).,IUCrJ 2, 322-326 (2015))。其中,利用串行飞秒晶体学方法直接对包含多个晶型的粉晶样品进行衍射成像,并通过数据分析进行衍射强度分离,得到多套完整的、与不同晶型样品对应的数据(图1)。这一构思以及实现方法,是当前粉晶分析领域一个革命性的突破,它能够将多晶型数据分析的效率提高一个数量级。而生物大分子反常散射数据中杂质信号的影响分析以及消除方法的提出,意味着样品制备过程中非常常见的样品纯度不高导致的数据质量不理想的问题,可以通过后续的数据分析方法解决,这将在很大程度上降低生物样品制备的要求,为串行飞秒晶体学的推广以及数据整体质量特别是相位求解准确度的提升,提供崭新的思路和理论依据。
图1:利用串行飞秒晶体学方法分离多晶型的粉晶数据得到多个独立的结构。
而在电子显微学方面,早在上世纪八十年代,我们首先开展了“X射线衍射分析方法用于高分辨电子显微学的图像处理”这个研究方向,并获得了重要的成果(Acta Phys. Sin.《物理学报》28, 276-278 (1979))。而新的项目则是针对冷冻电子显微学单颗粒分析技术的电势分布图像处理展开。我们将适用于传统X射线晶体学的以P+公式为基础的相位推演方法“直接法”,应用于冷冻电子显微学单颗粒分析技术的电势分布图像处理之中,以减少冷冻电子显微图像的相位偏差,提升冷冻电子显微学单颗粒分析技术的电势分布图的质量,提高最终模型构建的准确度和完整度。
在该项目中,我们首先提出了一种混合方法,以生物大分子的Cryo-EM map作为相位出发点,利用以直接法为基础的IPCAS2.0程序(J. Appl. Cryst. 53, 253–261(2020).),将相位拓展至高分辨的晶体X射线衍射数据之中,并利用IPCAS2.0的双空间迭代功能,实现高分辨生物大分子三维模型的构建。该项目于2016年启动,该方法的普适性已于四个案例中体现:从低分辨率EM map出发(分辨率最低为6.9 Å),通过EM map置换(FSEARCH)、相位扩展(Phenix)、分子建模(IPCAS),最终成功解析出同一目标蛋白的晶体学模型(IUCrJ 5, 382-389 (2018).)。随后,我们将这一方法拓展至利用同源结构的低分辨率Cryo-EM map解析生物大分子高分辨率晶体结构的工作中,并同样获得成功。测试表明,利用该方法能够从同源度低至34%的结构所对应的Cryo-EM map出发,获得目标晶体近乎完整的三维结构模型(Acta Cryst. D76, 63–72(2020).)。其后,我们尝试将该方法直接应用于低分辨Cryo-EM map的图像处理和相位修正,以实现对低分辨Cryo-EM map的从头模型构建(ab initio model building)。初步的理论分析和测试表明,以直接法为基础的IPCAS2.0可以实现对超低分辨率(6.9Å)的Cryo-EM map的相位优化和模型的直接构建(图2)。(Asian Crystallographic Association Conference, Auckland, NZ, 2~5, Dec, 2018)
图2:X射线衍射分析方法在高分辨电子显微学图像处理中的应用。A:IPCAS2.0在冷冻电镜数据与X射线衍射数据相结合中的应用,获得完整度达到99%的模型。B: IPCAS2.0在超低分辨率(6.9Å)冷冻电镜数据处理中的应用,获得完整度达到74%的模型。