总结:本文详细介绍了冷冻电镜单颗粒分析(SPA)技术的核心原理、完整工作流程,重点阐述了关键技术环节的实操要点及常见问题解决方案,同时提及技术相关的核心概念。
读者可学习到冷冻电镜SPA技术的理论基础与标准化操作流程,了解如何通过优化样品制备与数据处理获得生物大分子的精细结构,为开展结构生物学研究提供全面的技术参考与实操思路。
结构生物学是分子生物学、生物化学和生物物理学的一个分支,涉及对大分子结构的解析。过去,大分子的高分辨率3D模型主要是采用X射线晶体学技术,最近,随着Cryo-TEM的技术进步,单颗粒分析(single particle analysis,SPA)领域现处于结构生物学的前沿。术语“Particle”用于指单个生物大分子或复合物。现在,以3埃的分辨率确定单颗粒结构已经比较普遍,也有越来越多的2埃或更高分辨率的结构被报道。
电子显微镜和电子探测器的不断改进,加上更强大的计算工具(三维重构软件),导致了所谓的“Resolution Revolution分辨率革命”。2017年诺贝尔化学奖授予了 Jacques Dubochet, Joachim Frank和 Richard Henderson,以表彰他们“开发了冷冻电子显微镜技术,用于溶液中生物分子的高分辨率结构测定”。
1 什么是单颗粒分析技术?
基本上,纯化的大分子被冷冻在一薄层玻璃冰中,然后在冷冻箱中观察。数万个颗粒的图像是在非常低的电子剂量下拍摄的,这种方法背后的基本原理是颗粒将在玻璃冰中以不同的方向保存。当电子束穿过样品时,这些颗粒的不同的方向将会在TEM图像上形成许多不同的形状。通过计算分析,上万个图像被重建成所述颗粒的高分辨率3D图。

图1 旋转形状,查看从上方照射时投影的变化。这说明了方向如何影响 TEM 图像中颗粒的形状。模型图由 Martyn Cook 提供。

图2 单颗粒分析技术的工作流程
即使用理想的成像参数,单个电子显微镜图像也不包含足够的信息来提供原子信息。为了限制对样品的辐射损伤,图像是在固有噪声的低电子剂量下收集的。为了解决这个问题,需要收集许多图像并进行平均。如果相同的噪声图像可以被分组并平均,则图像中的高分辨率信号相干相加,而噪声逐渐被平均掉。

图3 GroEL 颗粒的Cryo-EM图像。A. 在未使用能量滤波器的情况下拍摄的原始图像,显示图像中的噪音有多大,很难看到实际颗粒。(已经对原始图像进行平均化和漂移校正)B. 在 A 中的图像上使用了低通量的能量过滤器,可以清楚的看到颗粒。图片由新南威尔士大学的 Nick Ariotti 提供。
Cryo-EM中的“分辨率”一词是指基于特定位置的信号强度与噪声强度之比,在大分子的3D重建图中各种特征的可信度。

图4 Cryo-TEM获得的图像细节较少,噪声较高。将许多类似的图像平均到一起,信号就会增加,噪声就会降低,将不同数量的颗粒图像,比如10、50、100、200、400、800、1600 和 3200 幅平均到一起就可以看到这一点。图片由莫纳什大学的 Hari Venugopal 提供。

图5 利用单颗粒分析技术解决的阿泊铁蛋白结构。图片由新南威尔士大学的 Nick Ariotti 提供。
2 关键技术:样品的制备与稳定
只有制备出理想的样品,高分辨率重建才有可能。因此,样品制备对整个过程至关重要,必须投入大量时间及严格的过程控制,这包括感兴趣的蛋白质或蛋白质复合物的表达、其纯化和生物物理分析。
在开始单颗粒分析研究之前,需要制备出具有质量、形状和尺寸近似相同的的单颗粒分散制剂。尺寸排阻色谱法(Size exclusion chromatography)可以很好地评价样品的单分散性,能显示是否存在聚集物甚至解离的复合物。应通过各种生物物理技术验证蛋白质的稳定性、完整性和活性,并在制备电镜铜网前调整样品浓度。

图6 蛋白质纯化工作流程。相关蛋白质在细胞培养物中表达,利用不同的细胞破坏方法将细胞质蛋白质释放到溶液中或获得细胞膜提取物。通过液相色谱等技术纯化蛋白质。通过各种生物物理技术验证蛋白质的稳定性、完整性和活性,以确保样品可用于电子显微镜筛选。
2.1 样品的稳定性
颗粒的不稳定性会导致颗粒变性或聚集,或者在制备中出现优先取向。制备和储存大分子的生理条件对其稳定性有重要影响,因此即使是悬浮缓冲液也很关键。应该试验许多不同条件的效果。
有时可能需要稳定蛋白质以避免构象变化,这可以通过添加与颗粒结合的特定分子以保持结构稳定。一系列不同的溶液已用于此目的,包括Fab抗体片段。当然,添加的分子现在是分析过程中要考虑的问题,是否已成为结构的一部分。
也可以通过感兴趣的蛋白质和蛋白质复合物的化学交联(通过共价结合蛋白质的紧密结合区域)来提供更大的稳定性,从而防止变性。然而,这样做应该小心,以确保它本身不会引入结构性的假象。为此,通常使用低浓度的戊二醛。
通过超速离心含有递增浓度的交联剂的梯度样品,这样就能以可控的方式进行,因为梯度上的条带应该包含均匀的颗粒群。这一过程被称为GraFix,它在很大程度上阻止了分子间交联,而有利于分子内交联。

图7 稳定颗粒的不同方法举例。A. 在某些情况下,蛋白质在铜网上冷冻时会迅速移动到空气–水界面。B. 这种现象导致聚集的一个例子。C. 使用戊二醛交联,有助于不稳定的低聚物不在空气–水界面上展开。D. 使用不同的缓冲条件和不同浓度的盐也有助于稳定颗粒。E. 加入极低浓度的洗涤剂可以 a) 在空气–水界面产生表面活性剂层,避免蛋白质展开 b) 降低表面张力,使冰更薄、更好。
遗憾的是,这些条件可能会导致颗粒发生变化或影响分辨率,但在某些情况下可能别无选择,至少可以构建低分辨率图形。图片由昆士兰大学的 Lou Brillault 提供。
膜蛋白在细胞中发挥着特别重要的作用,据估计,所有已知基因组中有20-30%的基因编码膜蛋白,但它们的结构在蛋白质数据库中的代表性很低。它们很难通过其他技术结晶或研究,但Cryo-TEM已成功用于许多膜蛋白的结构研究,现在已经是首选方法。有必要将它们从它们的生物膜中溶解出来,然后稳定在类似的胶束、膜或其它基质中。这可能涉及大量的实验工作,也可能是特定于感兴趣的蛋白质。
选择正确的洗涤剂将它们从膜脂质环境中溶解出来是至关重要的。最近设计了一类新的增溶剂,它由一种具有亲水主链和疏水侧链的混合共聚物组成,称为两亲醇。这些增溶剂具有许多优点,包括改进的稳定性、增强的衬度和改进的颗粒分布。纳米盘,由膜支架蛋白带结合在一起的膜双层区域,也已经用于稳定SPA的蛋白或蛋白复合物。这一领域继续扩大,并且也已经使用了几种其他技术,如脂质体、bicelles和苯乙烯–马来酸共聚物颗粒。
图8 比较不同的膜蛋白稳定方法。Sgro, G.G and Costa, R.D. Front. Mol. Biosci. 2018, 5,74.
图9 使用纳米盘稳定的三聚谷氨酸转运体的结构,如黄色所示。A. 俯视图。B. 侧视图。悉尼维克多–张研究所 Alastair Stewart 提供。
3 通过负染色筛查样品
在进行Cryo-TEM测试之前,尽可能多地了解样品是很重要的,以确保颗粒的稳定性和均一性。
进行目视筛选的最简单方法是使用常规TEM进行负染色。基本上,样品沉积在TEM铜网的支撑膜上,并嵌入重金属层中,这提供了高衬度,这种负染色技术可以看到样品的精细结构。背景被染成深色,而样品看起来是浅色的,因此称为负染色。

图10 负染色原理的示意图,在重金属染色的深色背景下,样品呈现浅色。
许多不同的染色剂用于负染色,包括磷钨酸和钼酸铵,但浓度为1-2%的乙酸铀酰是单颗粒工作中最常见的。它对可见光敏感,需要在使用前立即过滤或旋转以去除沉淀物。
虽然这是一种快速简便的技术,但存在相对较大的颗粒尺寸和不均匀的脱水假象的局限性,这限制了对精细结构特征的解释,最多只能达到约2埃的分辨率。染色良好的样品将提供颗粒分布和均匀性的信息。低分辨率3D重建可以使用负染色,有时可以提供一个初始重建,稍后可以用Cryo-EM进行细化。

图11 良好的负染色颗粒制备实例。A. 磷脂酰铁蛋白 B. 病毒样颗粒 C. SARS-CoV-2 尖峰蛋白。图片由昆士兰大学 Naphak Modhiran 提供。

图12 负染色不佳的制备实例。A. 染色分布不均。B. 制剂中含有污染物,颗粒数量少。C. 染色太重。图片由昆士兰大学 Naphak Modhiran 提供
4 样品的玻璃化
玻璃化的目的是将纯化的样品保存在TEM铜网上的一薄层无定形冰中,以便将其以尽可能接近其原始自然状态的方式呈现给Cryo-TEM。
通常,SPA研究的样品制备方法包括三个主要步骤:
1将包含悬浮颗粒的小液滴施加到EM铜网的碳表面用滤纸吸干液滴,2直到只剩下一层非常薄的液体薄膜,3然后将铜网投入到冷冻环境中。
图13 将样品颗粒溶液装入铜网、印迹,然后冷冻到液态乙烷中的工作流程。图片由昆士兰大学的 Lou Brillault 提供。
用于此的铜网是有孔的碳涂层,这样含有颗粒的超薄冷冻溶液就悬浮在孔中,后面没有支撑膜。通常使用具有规则的圆孔重复阵列的薄膜(商业上是Quantifoil或C-Flat铜网),因为它们便于自动收集数据,而且均匀的间距和形状允许更多的颗粒分布重复。另外,也可以使用具有不规则孔径和分布的铜网,如 lacey碳,这些铜网可以在实验室中很容易地制备。
图14 TEM铜网表面涂有一层薄薄的穿孔无定形碳。市售的网格上有一系列大小和间距规则的孔。也曾使用过带不规则孔的lacey薄膜,但由于孔的随机性,很难实现良好的颗粒冷冻效果。样品在孔中的玻璃化水层中冷冻。在特殊情况下,在孔上附加一层连续薄膜(如无定形碳)可能会有好处。图片由昆士兰大学的 Lou Brillault 提供。
现在有几种不同的商用急速式冷冻仪器,可以控制所有的冷冻参数,如温度、湿度、印迹力和印迹时间(blot time)。一般来说,为改变冰的厚度,最常调整的参数是印迹时间,它控制滤纸在铜网上保持多长时间。目的是使颗粒均匀地分布在铜网上,形成广泛的方向分布。理想情况下,对于Cryo-TEM来说,颗粒应该包含在一层薄薄的玻璃质冰中,其厚度应尽可能接近颗粒本身的尺寸,以尽量减少多重散射事件,并在TEM中最大限度地提高样品衬度。然而,实现完美的Cryo-TEM铜网样品可能是一个困难的过程,往往需要大量的试验和错误。
一旦试样被冷冻,铜网就会被储存在液氮中的特定铜网盒中,直到它准备好被装入电子Cryo-TEM进行成像。
5 颗粒分布和取向的优化
用于SPA的Cryo-TEM样品,理想的状态需要包含均匀分布的颗粒,并呈现出一系列的方向。然而,这并不容易实现,可能会出现许多问题:
要达到理想的样品可能需要一些试验和错误,在获取最终数据之前,在Cryo-TEM中进行筛选总是必要的。
图15 颗粒分布不均的示例,显示了在空气–水界面和碳膜边缘的聚集和优先取向。图片由昆士兰大学的 Lou Brillault 提供。
颗粒倾向于优先聚集在空气–水界面,这导致了玻璃化过程中遇到的很多问题。最关键的是,颗粒只在一个方向上定向。通过在孔上添加另一个薄膜,通常是碳、石墨烯或氧化石墨烯,以产生一个连续的薄膜,颗粒就有东西可以粘附。这可以克服一些问题,如低颗粒浓度和跨孔分布,并使颗粒的更多随机方向。然而,额外的碳膜会降低信噪比。
辉光放电,将铜网暴露在低能量的气体等离子体中,用于使表面更加亲水,以使溶液更均匀地扩散到整个铜网。在富含氨的气氛中进行这种操作,会给碳膜带来净正电荷,这可以排斥颗粒并迫使它们进入孔中。疏水的铜网可以有类似的效果。
如果在获得均匀分布的方向上有很大的困难,另一种可能性是倾斜铜网。这样做的不幸的副作用是,冰层在较高的倾斜角度上变得更厚,降低了图像质量。然而,现在已经写好的算法可以帮助缓解这个问题。
图16 A. 颗粒会优先对准空气–水界面,因此它们都显示相同的方向。B. 将网格倾斜到不同角度会使颗粒显示不同的方向。
新的冷冻仪器已经被开发出来,其目的是克服颗粒在空气–水界面上的粘附。将超小的液滴沉积到铜网上,其时间尺度可以防止颗粒的这种重新分布。这也意味着只需要非常小的体积,从纳升到飞升的悬浮液。已经使用了各种技术来做到这一点,包括压电点胶装置、静电系统、针式印刷和超声波喷雾,以及冷冻喷射冻结。其中一些已经有商业产品了。
6 筛选冷冻样品
虽然使用负染色筛选可以很好地了解样品的质量,但有许多与玻璃化过程相关的问题会给SPA带来很大的问题。因此,在继续进行检测之前,有必要在Cryo-TEM中对完全冷冻的颗粒样品做另一组筛选。这种筛选对整个过程非常重要,因为如果没有一个非常好的样品,是不值得进行检测和数据收集。这个理想的样品包含均匀颗粒的良好分布,由一层薄薄的玻璃质冰支撑。
在筛选阶段,在不同的放大率下记录图像,以检查样品是否值得Cryo-TEM数据收集,尤其是冰和颗粒的质量。
整个Cryo-TEM铜网的低倍率视图,称为拼图(atlas),是通过将一系列的图像拼接在一起,产生一个铜网的整体视野。在这里,冰的厚度可以通过电子透明的程度辨别出来。过于厚重的黑暗区域,效果被打了折扣。在中等放大倍数下,可以检查出冰晶、玻璃化程度低的冰或其他污染,以及孔内较厚的冰区域。如果冰层太厚,信噪比会很差。
图17 如何分辨质量好的TEM铜网 A. 有些好的孔洞呈现均匀的浅色,有些差的孔洞则有较深的厚冰区域,还有一些孔洞周围有一圈深色的圆圈,这些孔洞都是干孔,但由于污迹太重,所以现在是空的。B. 与 A 中的问题类似,这个方格的边缘有厚厚的冰层,遮住了很大一片区域。C. 这个方格中几乎所有的孔都是好的,因为它们呈现出均匀的浅色。少量的冰污染掩盖了几个洞。
图18 TEM铜网的整体视野,可以在高倍数下对TEM铜网的每个小方格进行样品筛选
更高的放大镜可以检查颗粒本身,以确定样品的特征,包括:1浓度(最好有大量的颗粒存在,但不重叠或相互接触);2聚集;3变性;不均匀的颗粒分布(例如,颗粒优先结合在孔的中心或碳的边缘);4颗粒的取向。
一些问题,如颗粒损伤,往往在成像后的分析中更容易识别,如二维分类。在这些原始图像中,由于信噪比差和衬度低,看到足够清晰的颗粒来评估它们是很困难的,所以可能有必要增加离焦来成像,特别是对较小的颗粒。
图19 样品进行玻璃化的问题。A、B、C、D 显示了厚冰和污染区域。E. 铜网薄膜上的裂缝。F. 这是冰厚度较好的理想网格。图片由新南威尔士大学的 Juanfang Ruan 和昆士兰大学的Lou Brillault 提供。
图20 样品进行玻璃化的问题。A. 辐射损伤,B. 大型六角冰。C. 这是一个理想的网格,冰的厚度很好。图片由新南威尔士大学的 Juanfang Ruan 和昆士兰大学的 Lou Brillault 提供。
图21 样品进行玻璃化的问题。A. 乙烷污染, B. 冰晶。C. 冰晶 D. 良好颗粒。E. 与 D 中相同的区域,但在电子束照射后显示出辐射损伤。F. 颗粒聚集,尤其是在图像左侧与碳相邻的孔边缘。图片由新南威尔士大学的 Juanfang Ruan 和昆士兰大学的 Lou Brillault 提供。
图22 样品进行玻璃化的问题。A. 颗粒浓度过高,许多颗粒相互重叠。B. 孔中的颗粒浓度高,且分散均匀。图片由昆士兰大学 Naphak Modhiran 提供。
Cryo-TEM的 SPA工作流程是一个反复的过程,需要在样品净化、铜网准备和铜网筛选之间来回穿梭,以获得理想的样品来进行分析。
7 Cryo-TEM数据收集
样品和铜网被优化后,就可以进行Cryo-TEM数据采集了。在采集之前,需要对设备进行标准流程的对准,以确保仪器的成像参数能够捕捉到高分辨率的图像。TEM必须对准平行照明,以避免由于离焦和放大率的微小局部变化而导致的图像恶化。
如前所述,玻璃化的样品相当容易受到电子束的辐射损害。为了减少这个问题,必须在“低剂量“模式下操作,在这种模式下,即使样品被暴露在最小的电子剂量下,足以使结果图像中获得足够的信息。
当然,这类图像会有令人难以置信的噪音,不能作为独立的图像使用。如前所述,TEM中的数据采集涉及到拍摄大量包含许多颗粒的图像,然后通过对所有这些图像进行平均,就可以获得高分辨率的信息。
在铜网筛选过程中,质量好的孔会在软件中进行标记,这样TEM就可以返回到这些孔进行图像采集。
收集图像的标准工作流程是搜索(目标)–聚焦–记录:
样品台的移动会受到限制,每次移动后都要等待稳定下来,这样会减慢进程。
数据采集的速度很重要,现在使用电子束偏转到连续的采集位置。无畸变的电子束倾斜策略对这种偏移进行补偿,以确保成像的最佳电子束排列。
数据是以许多帧的电影形式获取的,这些帧后来被对齐和平均化。所有的数据采集都是通过系统地在铜网上移动到筛选阶段标记的所有孔的位置进行的。这些方法的重要考虑因素是采集速度,新的更快的读出探测器和无像差的电子束倾斜采集使之成为可能。TEM的采集过程可以通过软件实现自动化采集,通常在几小时到几天内完成这一过程。
通常是使用一个聚焦点来采集与此相邻的孔阵列。从同一个孔中收集几个数据集可以提高产量,一天内可以收集成千上万的“电影”(movie )。
为了找出最佳的记录设置,需要解决几个参数:
3剂量:使用的剂量是在造成辐射损伤和产生足够的信号以获得高分辨率信息之间的平衡。通常情况下,使用30-50 e/Å2的曝光,但也有使用低至25 e/Å2的剂量来获得高分辨率的数据。电影(movie)中较晚的帧受到累积的较高剂量的影响,因此被“剂量加权“或曝光过滤,以减少初始处理中影响。
图23 铜网方格的低倍图像,显示标有数据采集的孔。焦点将放在九个孔中与中心孔相邻的碳上。图片由昆士兰大学的 Lou Brillault 提供。
现代Cryo-TEM监测数据的收集,通过测量参数,如漂移、平均离焦、相对冰层厚度,甚至估计分辨率CTF拟合,直接反馈其质量。大量的图像处理实际上是在数据采集过程中即时进行的。最初的漂移校正、剂量加权和平均化都可以在这个时候完成。
图24 可在成像过程中或成像后直接获取有关所获数据质量的信息。x 轴上的指数为电影编号。在这种情况下,可以计算出总的帧漂移、平均离焦、CTF 拟合的估计分辨率以及相对冰厚度。如果这些数据不在规定范围内,可以放弃个别影片或整个数据集。图片由昆士兰大学的 Michael Landsberg 提供。
8 漂移校准
尽管是用低电子剂量进行成像,但电子束依旧会引起试样的漂移,导致高分辨率细节的模糊。具有快速读出数据功能的MAPS直接电子探测器的开发可以解决这个问题,它可以获取多个子帧,每个子帧的剂量都是分散的。然而,由于总会有一些电子束引起的漂移,所以获得的电影的子帧并不一致。如今已经开发了算法,使它们对齐,以纠正这种电子束引起的漂移,这个过程通常被称为移动或漂移校正。
图25 A. 碳膜小孔中的颗粒在冰中冻结。B. 在电子束辐射碳膜的过程中,减小了孔的大小,冰中的压力增加。这些效应导致冰向随机方向移动,引起移动和旋转。
最初的辐射破坏导致强烈的漂移,这种漂移在整个铜网中并不均匀,随着辐照降低,漂移也逐渐降低,后来的子帧就几乎没有漂移。
图26 胶片堆栈中每张显微照片的不同区域都有不同的漂移,随着样品的沉淀,后几张显微照片中的漂移会变小。漂移校正可对漂移进行补偿,使显微照片完美对齐,然后求平均值,得到单一图像。图片由昆士兰大学的 Lou Brillault 提供。
漂移校正可以通过两种方式进行:
1 全局漂移,即对整个图像的漂移进行平均化,并在此基础上进行校正。然而,这不是一个刚体漂移,不同的颗粒以相当独立的方式漂移。为了弥补这一点,图像被划分为一组小方块,并对每个方块的漂移进行计算。
全局方法被用于初始图像对齐。使用漂移校正软件,将所有子帧合并并平均化,以产生一个单一的图像。在新的软件中,有可能在采集过程中进行漂移校正。
2 单颗粒漂移,这通常是在三维重建的阶段完成。
图27 A. 从影片开始到结束的子帧内,不同片段中颗粒运动轨迹的示意图。样品所有区域的运动轨迹并不相同。B 经过运动校正的图像,显示出高质量的颗粒。图片由昆士兰大学的 Michael Landsberg 提供。
9 剂量权重
在曝光过程中,电子束辐射会损害冷冻的生物样品。虽然使用低剂量操作条件可以减少这种损害,但随着电子剂量的增加,对样品的损害是不可避免的。
在电影中收集的最初的子帧只有低电子剂量,并显示很少的损害,保持所有高分辨率的细节,但衬度非常小。即使这些具有最高分辨率特征的早期帧也表现出最大的漂移量。
相比之下,后面的子帧被暴露在更高的剂量下,造成更大的电子束损伤,但漂移量较小。后来的帧有更高的衬度,但更多的噪音和更少的细节。这在功率谱中表现为较少的高频信息(外环)和较多的低频信息,其形式是较高的衬度(内环)。剂量加权或曝光过滤的使用,意味着后期帧中这些分辨率较高的傅里叶成分在帧的平均中被降低了权重。
图28 电影中较后的画面受到的辐射损伤越来越大,导致高频损失和噪声增加。剂量加权法通过应用逐渐增加的温度系数(图中黄色表示),在保留低频信息的同时,对较后画面中分辨率较高的傅立叶成分进行降权。当使用剂量加权对所有帧的傅立叶变换求和时,结果会提高低分辨率信噪比,而不会降低最终图像中的高分辨率信噪比。
剂量加权的目的是为了防止在高分辨率下进一步积累噪声。这样做的好处是仍然可以提高低分辨率的信噪比,或图像衬度,而不会降低高分辨率的信噪比。剂量加权是与漂移校正同时进行的。
然而,不使用剂量加权,仍然是非常有用的,特别是对最初的低分辨率模型的构建,其中高分辨率的信息可能使其难以轻松和准确地对齐类别。因此,通常有两个数据集,一个是剂量加权的,另一个是非剂量加权的。这两个数据集是直接联系在一起的,所以一旦初始对准完成,高分辨率的信息就可以被添加回来。这通常发生在软件的后台,不易被看到。
10 图像平均法
即使在完美的低剂量条件下,单个图像也没有足够的信息来提供生物样品的原子分辨率信息,这些图像本身是有噪音的,因为需要低剂量辐射来减少损伤。因此,Cryo-TEM使用了图像平均法,这能去除随机分布的噪声和增强一致的结构信息的效果。
玻璃化的样品包含相同结构的多个副本,因此,来自玻璃化样品的每张图像都显示了在不同视图中呈现的相同结构。如果同一结构在同一视图中的图像能够被分组和平均,那么图像中的高分辨率信息就会被加在一起,而噪声则逐渐被平均掉。随着更多的图像被平均化,这个高分辨率的信号变得越来越清晰了。
图像平均法在SPA工作流程的不同地方使用,将捕获的电影中的子帧加在一起,并将一个二维类中的所有颗粒图像加在一起。它也被用于三维重建。
11 提取颗粒
每张修正过的图像包含许多不同方向的颗粒。为了能够在重建中使用这些方向,有必要识别它们,然后将它们作为单独的颗粒图像提取出来。为了进行高分辨率的三维重建,可能需要对数十万个颗粒进行平均化处理。在工作流程中,很大比例的颗粒会因为质量差而被丢弃,往往只有5%到10%的初始颗粒会被用到。所以,可能有必要在原始集合中选择数以百万计的颗粒。
由于噪声大,衬度差,颗粒往往很难在图像中看到。为了改善这种情况并使它们更加明显,通常需要采用两种策略。
一旦颗粒被选中,图像将再次恢复到原始质量,以消除这些策略的影响。
有几种挑选颗粒的方法。
1手工挑选:这是非常耗费人力的,所以不能用于挑选全部的数据。然而,少量的,比如几百到几千的颗粒,可以手工挑选,以帮助训练像模板挑选这样的方法。
2 模板挑选(Template picking):手工挑选的颗粒可被用作模板,然后软件可以用它来识别颗粒。为了与该模板相匹配,设置了一个相关分数,以最大限度地提高被挑选的颗粒数量。不幸的是,这可能会在挑选的颗粒中引入一些偏见。
3 Blob picking – 这对于大致球形的颗粒效果最好。该软件会挑选出特定尺寸范围内的所有圆球。虽然这是无偏差的,但它可以挑出很多非颗粒,如类似大小的冰污染物。因此,所产生的数据需要在以后进行大量的清理。
图29 人工挑选出的颗粒的图像。然后,软件将使用该模板从所有图像中挑选出所有相似的结构。图片由Nick Ariotti 提供 新南威尔士大学。
一旦它们被识别出来,就需要提取颗粒,以便它们可用于进一步的分析。这是以单独的方块形式进行的,每个方块包含一个颗粒。方块的大小是一个重要的参数,原因有几个。
12 颗粒的二维分类
无论使用什么算法,颗粒挑选的问题是,许多垃圾颗粒甚至非颗粒都被选中了。颗粒的二维分类是进一步分析前清理数据的最佳步骤。只有显示最佳质量图像的一系列不同颗粒,否则三维数据的分辨率将大大降低。
我们的想法是将所有类似的颗粒图像归为特定的组或类,这应该考虑到由于X和Y的平移以及旋转而产生的方向差异。SPA软件的设计是为了找到组成和构象的差异,并识别出彼此有些相似的图像,而且这些图像的数量要足够多,多到足以证明创建了特定的类。接着对该类中的所有图像进行平均,以获得相对于原始图像具有良好信噪比的单一代表性图像。
图30 分析软件会选择 2D 类别,并将它们从最常见到最不常见排序,同时显示每个类别中的粒子数量。此外,还给出了每个类别可能实现的图像分辨率。在这里,前 28 个类别是可用的。在软件中,图像采用反转对比度。
图31 根据该数据集绘制的分子图如上所示,图片由昆士兰大学的 Michael Landsberg 提供
检查这些颗粒种类的图像为评估数据的质量提供了一个很好的方法。它可以显示:
虽然这种评估对清理颗粒数据集很有价值,但它可能意味着原来的样品制备不够好,整个数据集应该被丢弃。当准备一个新的样品时,需要要研究新的准备方法来克服这些问题。
进行多轮迭代的二维分类可以细化类别,进一步清理数据集。
13 三维重构
在开始三维重建之前,首先要考虑的是实际上是否有足够的颗粒来实现所需分辨率的重建。Crowther方程给出了一个很好的近似值。
N是颗粒的数量(或所需的最小独特投影数),d是分辨率,D是颗粒的直径。这也可以表示为

三维重建有2种主要方法
1投影匹配排列。这是基于中心截面或傅里叶切片定理的。一个三维物体的单一二维投影的傅里叶变换是通过该物体垂直于投影方向的三维傅里叶变换的一个中心截面。该物体在许多不同方向上的图像提供了许多不同的中心截面。将所有这些二维傅里叶变换结合在一起,就得到了一个三维傅里叶变换,而对其进行三维反傅里叶变换,就会产生一个原始物体的重建。
这涉及到通过与已知的三维模型图进行比较来确定数据集中所有投影的方向。
图32 中心截面定理。不同方向粒子的二维投影被转换为二维傅里叶变换。将所有方向的傅里叶变换组合起来,就得到了三维傅里叶变换。在此基础上进行反傅里叶变换,就能得到物体在真实空间中的三维图像。图片由昆士兰大学的 Lou Brillault 提供。
2最大似然法。这些方法不需要一个模型来比较初始方向,而是考虑颗粒的所有可能方向,并根据其概率为每个方向分配权重。它为数据集找到最可能的三维重建,使观察到的颗粒图像产生的概率最大化。最大似然法最适合于像Cryo-TEM数据那样具有高噪音水平的数据。
这两种技术产生的新图都可能是低分辨率的,在20到60Å之间,可作为下一轮排列的参考结构。这个过程不断循环,每次都能产生更好的高分辨率图片。迭代一直持续到重建分辨率没有改善,这就是所谓的收敛。
图片的3D分类有助于再次评估数据的质量,通常显示出在二维分类中不明显的异质性,并导致从数据集中去除更多的颗粒。它也可能显示出缺失的方向或对特定方向的优先取向,这可能会使模型出现偏差。这可能意味着准备新的样品,试图避免方向问题。
由于在TEM下成像和图像处理过程中的许多问题,最终三维重建的信号在高频率下被抑制。衡量这些信号损失的每一项都是一个衰减包络。导致数据恶化的包络有很多,它们可能包括成像系统中的光学缺陷、冰的厚度和平均排列中的噪音引起的错误。
有可能确定一个包含所有这些因素的总包络函数。这被描述为 “B因子“。B因子实际上是一个从数据中估计出来的数字,它告诉你相对于分辨率(或空间频率),信噪比恶化的速度。
通过对每个傅里叶分量应用一个负的B因子来抵消这些影响,从而使三维图形变得更加锐利。B因子可以帮助指导重建,因为它可以用来更准确地估计随着颗粒数量的增加,分辨率将如何提高。它可以从Guinier图的斜率中估算出来,该图将log F(三维傅里叶变换中振幅的对数平方)与每次细化的分辨率平方的倒数作衬。在一个非常简单的层面上,对数F可以被认为是代表数据中的信号量。B因子也可以用Rosenthal-Henderson图的斜率来测量,该图也是每个细化的分辨率平方的倒数,但与相应子集的颗粒数量的对数相对应。
图33 阿泊铁蛋白提纯数据的Guinier 图。通过数据拟合的直线的斜率给出了 B 因子。
通常,图形的全球分辨率是通过一个“黄金标准 “程序来衡量的。这涉及到将原始数据分成两半,并独立地完善每个数据以产生两个重建。这两张图形之间的比较是在三维傅里叶空间中进行的。相应的傅里叶壳(相当于Thon环的三维空间频率)在互换空间的相关性被产生。这就是所谓的傅里叶壳相关性(FSC)。
所有壳的平均值被绘制成一条曲线,相关度在Y轴上,空间频率在X轴上。FSC实际上是对图形的信噪比的测量,相关性为1是没有噪声的完美相关性,而0代表没有相关性或只是空间频率的噪声。空间频率是以埃-1为单位测量的,它是埃的直接倒数,所以这可以用来读取图形的分辨率。Cryo-TEM界现在已经接受了0.143的值是读取分辨率的阈值,正如在示例图上看到的那样。
图34 图形细化的黄金标准。数据集分为两个半集,分别进行三维重建。两者之间的傅立叶壳相关性显示地图的分辨率为 0.143。图片由昆士兰大学的 Lou Brillault 提供。
模型的三维细化是一个非常复杂的过程,已经采取了许多不同的策略来解决具体问题。首先,模型的不同区域的分辨率可能有很大差异,因此有必要对该区域进行特定的细化。解决这个问题的方法之一是在特定的部分应用软三维掩码,因此分类将只集中在该区域。
图35 阿朴铁蛋白图的 FSC 图,显示了在未使用掩膜、松散掩膜和细化过程中使用紧密掩膜时图的分辨率。分辨率在 0.143 相关性处读取。
图36 根据局部分辨率绘制的 GroEL 地图。蓝色表示分辨率最高的区域,红色表示分辨率最低的区域。
14 图形验证
图形验证是为了确保你所创建的三维图形确实是原始样品的真实代表,它就像一个质量控制。虽然这通常是流程的最后一步,但三维重建细化本身也应该在验证措施的指导下进行,以确保图形在每次迭代中不断改进。
判断一张图形的真正有效性,要看它是否包含感兴趣的大分子所期望的高分辨率特征。
参考资料:
1 .Glaeser, Robert M. “How good can cryo-EM become?.” Nature methods 13.1 (2016): 28-32.
2 .Egelman, Edward H. “The current revolution in cryo-EM.” Biophysical journal 110.5 (2016): 1008-1012.
3 Issman, L., and Y. Talmon. “Cryo‐SEM specimen preparation under controlled temperature and concentration conditions.” Journal of microscopy 246.1 (2012): 60-69.
4 .https://myscope.training
5 Bai, Xiao-Chen, Greg McMullan, and Sjors HW Scheres. “How cryo-EM is revolutionizing structural biology.” Trends in biochemical sciences 40.1 (2015): 49-57.
6 Egelman, Edward H. “The current revolution in cryo-EM.” Biophysical journal 110.5 (2016): 1008-1012.
7 Dubochet, Jacques. “Cryo‐EM—the first thirty years.” Journal of microscopy 245.3 (2012): 221-224.
8 Kühlbrandt, Werner. “Cryo-EM enters a new era.” elife 3 (2014): e03678.
9Lyumkis, Dmitry. “Challenges and opportunities in cryo-EM single-particle analysis.” Journal of Biological Chemistry 294.13 (2019): 5181-5197.
10Elmlund, Dominika, and Hans Elmlund. “Cryogenic electron microscopy and single-particle analysis.” Annual Review of Biochemistry 84 (2015): 499-517.
本文源自微信公众号:老千和他的朋友们
原文标题:《TEM专题 | 冷冻电镜单颗粒分析技术指南》
原文链接:https://mp.weixin.qq.com/s/HmbMKCbNIRAZ8egsXQaTYQ
本转载仅出于分享优质测试干货,旨在传递更多观点,并不代表赞同其全部观点或证实其内容的真实性。文章中所包含的图片、音频、视频等素材的版权均归原作者所有。如有侵权请告知删除。