染色质免疫沉淀(ChIP)是分子生物学中应用最广泛的技术之一,它已经有30多年的历史,有些技术已经发生了变化,而有些则保持不变。
ChIP的基本操作方案仍与上世纪80年代开发的方案类似,涉及用甲醛将蛋白质与DNA交联,然后对DNA进行剪切。对于与DNA相互作用的蛋白质使用抗体进行免疫沉淀,加热解除交联,并分析捕获的DNA。研究人员后来将这项技术与深度测序联系起来,开发出ChIP-seq技术,在基因组层面探索蛋白质与DNA的相互作用。
ChIP被广泛地用于研究转录因子工作原理、组蛋白对基因表达的调控机理以及其它与生物发育和疾病相关的基本问题。2018年9月,C. David Allis和Michael Grunstein因基于ChIP的组蛋白研究成果获得著名的拉斯克奖。ChIP-seq现在是ENCODE(DNA元件百科全书)项目的基石,该项目旨在绘制各种细胞类型中基因组的调控区域。
染色质研究者们也在开发一种点阵技术,以超越或者拓展已有的ChIP和ChIP-seq技术,用来检测蛋白质复合物,更准确地鉴定某个蛋白因子结合的具体核苷酸,研究小量的细胞样品,甚至开始在单细胞水平初步探索蛋白质-DNA的相互作用。
所有这些技术都旨在完成ChIP-seq单独无法完成或只能缓慢完成的任务。它们都有一个共同的基本目标:找出与DNA相关的分子以及它们的位置。
位于马萨诸塞州坎布里奇市的Broad研究所表观基因组学项目主任Bradley Bernstein表示:“我们真的不了解基因组中调控功能序列决定基因何时何地表达的基本原理。”他补充说,ChIP “在很多方面都有局限性。因此,人们努力尝试和发明新方法或以新方式改良技术”。
为经典技术赋能
“把ChIP-seq称为黑魔法有点太过分。”以色列耶路撒冷希伯来大学计算机科学和生物学教授Nir Friedman表示。但尽管这是一种常用的技术,“很少有人有足够的耐心来校准他们的实验”。
Friedman指出,ChIP-seq实验会产生很多噪音。甲醛可以使未参与反应的分子交联,抗体可以捕获非靶蛋白,而超声波作为最常见的分解DNA的方法,更倾向于分解处于开放构象的DNA。他说:“有可能超过一半的测序或观察的结果是非特异性结合的。”
Friedman介绍,ENCODE发布了评估抗体质量和筛选无意义数据的指导方针。该项目还提供了对最新计算工具的访问地址,例如,将实验组与对照组数据归一化的方法和识别可能的DNA结合的“峰值”或区域的方法。
特别是,选择正确的抗体是一项挑战,北卡罗来纳州达勒姆研究三角公园的表观遗传学公司EpiCypher首席科学官Michael-Christopher Keogh指出。Keogh参与了最近的一项研究,该研究表明,许多在组蛋白研究中被广泛使用的抗体在ChIP中表现不佳,例如与非靶标蛋白的表位结合。该研究还提出了ENCODE准则之外的验证步骤。
一些研究人员通过在他们的目标上设计一个抗原决定簇标签来绕过抗体问题,比如CETCh-seq(CRISPR抗原决定簇标签ChIP-seq)。一个长期存在的技术——DamID(DNA腺嘌呤甲基转移酶鉴定)是利用工程化的蛋白因子和标签分子来标记相邻的DNA。
还有一些研究人员仍在改进基本的ChIP技术,比如加州大学圣地亚哥分校医学部的Alon Goren团队,他们已经开发出了自动化的ChIP-seq。Goren说,抗体和细胞类型之间的最佳抗体浓度可能有很大差异,某些步骤(如解交联)是不必要的。Goren实验室还表明单克隆抗体优于多克隆抗体。
但是,即使在完全优化之后,ChIP-seq从根本上仍然是有局限性的。Goren说,例如通常需要10万个或更多的细胞来研究转录因子,需要1万个或更多的细胞来研究组蛋白。在大多数情况下,这种方法每次只针对一种蛋白质、一种抗体。
Goren说:“一旦我们能够将思考的对象从蛋白质转向复合物,我们就能更好地理解生物是如何工作的以及在疾病中会发生什么。”
给蛋白质复合物加一个把手
研究复合物的一种方法是将ChIP-seq与质谱(MS)相结合,使用RIME(内源性蛋白质的快速免疫沉淀质谱)和ChIP-MS等方法。
然而,费城宾夕法尼亚大学的分子生物学专家David Steger说,这些方法的一个缺点是,与DNA无关的蛋白质也可以通过免疫沉淀被拉下来。“每个人都在努力开发针对特定增强子的位点特异性蛋白质组学。”
鉴定染色质结合复合物的一种新兴技术是ChIP-SICAP(选择性分离染色质相关蛋白),其由德国海德堡德国癌症研究中心的Jeroen Krijgsveld和他的同事开发。这项技术包括用生物素标记抗体结合的DNA,然后用链霉亲和素珠子将生物素化的分子进行捕获,随后利用质谱进行分析。
Steger正在应用ChIP-SICAP检测与促进间充质干细胞向脂肪细胞转化的增强子结合的蛋白质。Steger说:“我们正在尝试鉴定一个增强子蛋白质组。”
有些方法还利用Cas9的基因编辑系统,其中包括能识别特定DNA序列的向导RNA。研究人员已经用生物素或一种酶标记了Cas9,这种酶可以促进附近蛋白质的生物素标记,MS.分析了这些蛋白质。这样的方法可能会扩展ChIP-seq相关的方法,评估基因组的三维结构,如Hi-C、ChIA-PET(通过配对末端标记测序进行染色质相互作用分析)和HiChIP以及更新型的方法,如SPRITE(通过标记扩展进行相互作用的分类识别)。
这些检测DNA结合复合体的新方法有望使生物学研究人员对基因调控的认识更加清晰。但是当它们被用于质谱分析时,它们面临的限制是不容易检测到低丰度蛋白质,Steger说。此外,并非所有较新的技术都适合非专业人士使用。
有几家公司提供RIME或ChIP-seq等相对成熟技术的外包服务。提供ChIP-seq和相关服务的公司包括加利福尼亚州卡尔斯巴德的Active Motif公司、位于比利时列日和新泽西州登维尔的Diagenode以及北京的Novogene。这些公司和其他公司也提供ChIP-seq试剂盒和试剂耗材,不过很多实验室都有自己的试剂。Keogh还指出,内部研究可能意味着对优化步骤的更好控制。
Cigall Kadoch的团队在Dana-Farber癌症研究所和马萨诸塞州波士顿的哈佛医学院研究一些大型的蛋白质复合物。他说,在ChIP实验过程中对实验参数的关注可以提高数据的质量。
Kadoch仔细优化甲醛的浓度,在应用不同抗体和细胞类型时,甲醛的作用是将各种蛋白质与DNA相互交联。当选择抗体时,她提醒研究人员应该预测抗原决定簇是否会出现在蛋白表面,从而可以实现免疫沉淀。为了了解一个完全组装好的复合物的DNA足迹,她建议选择一种在组装过程后期加上的蛋白质的抗体。“这些是决定项目成败的因素。”
关注蛋白因子的结合
Steger使用的另一种技术是ChIP-exo(ChIP外切酶)。他将其应用于各种蛋白因子结合在基因组上结合位置的鉴定,以达到碱基对水平的分辨率。
这项技术开始于DNA的超声破碎。外切酶将DNA(以5' -3 '方向)剪切到DNA通过甲醛与结合蛋白连接的边缘。这种方法为结合因子提供了一个清晰的DNA“足迹”,它比使用ChIP-seq计算生成的推断序列更精确。
“我们总是从ChIP-seq开始,随着问题的发展转向ChIP-exo。”Steger说,他使用这项技术来评估糖皮质激素受体与DNA的结合,受体作为二聚体与相邻的两个短DNA序列结合。Steger能够解决一个单体的结合,这是用ChIP-seq无法做到的。
宾夕法尼亚州立大学帕克分校生物化学和分子生物学教授Frank Pugh的团队最近简化了ChIP-exo方法,并将其应用于常用的Illumina测序平台。同样,密苏里州堪萨斯城斯托尔斯医学研究所副研究员Julia Zeitlinger和同事发表了一项相关技术ChIP-nexus。这两项进展都“很有希望”,加州斯坦福大学遗传学系主任、基因组学和个性化医学中心主任Michael Snyder表示。
测得更小也更深
Friedman说,通过调整实验参数,例如使用高质量的抗体,研究人员已经能够减少ChIP-seq所需的细胞数量。某些技术包括Friedman开发的一种使用条形码测序适配器的技术,使样本量减少。而一项名为“ChIPmentation”的新技术则减化了构建测序文库的程序。
一种进入实验室的新方法是CUT&RUN(目标引导并利用核酸酶的切割和释放),由华盛顿西雅图Fred Hutchinson癌症研究中心的Steve Henikoff和他的同事开发。该方法不需要甲醛交联,也不需要超声剪切DNA。相反,一种针对靶标蛋白的抗体与微球菌核酸酶(MNase)结合,后者能够被钙激活而切割靶标两边的DNA。接着,产生的DNA片段被测序。
位于西雅图的Altius生物医学科学研究所所长John Stamatoyannopoulos说,与ChIP-seq相比,“它可以大大减少噪音,而得到有效信号”。这在一定程度上是因为核酸酶对DNA的干净切割,而非位点特异性切割的水平较低。因此,CUT&RUN所需的DNA测序读取量通常比ChIP-seq要少,从而获得低成本,而且适用于细胞数量少得多的情况。Henikoff的团队最近将这项技术应用于在1000个细胞中研究一种转录因子,以及应用于100个细胞检测一种组蛋白修饰。Stamatoyannopoulos说,在他的实验室里,这种方法已经在很大程度上取代了ChIP-seq。
CUT&RUN还具有比处理微量样本更大的优势。分子生物学专家、哈佛大学教授Stuart Orkin称赞这种技术具有“实质上的单核苷水平”的分辨率。通过对计算工具的微小调整,他的团队能够区分出控制胎儿血红蛋白表达的转录因子的紧密结合位点。在获得这一结果之前,他无法用常规ChIP免疫沉淀该转录因子,这可能是因为甲醛交联隐藏了表位。他说,一换成CUT&RUN“马上就成功了”。
Henikoff的实验室已经采用了这项技术来评估DNA的长期三维相互作用,并使用第二抗体对分离出的片段进行免疫沉淀。该小组研究了同一蛋白质复合体上的两个分子特征,这种方法对于研究诸如“哪些组蛋白标记的组合会影响不同的基因状态”之类的问题可能很有帮助。
单细胞水平的工作
对于许多分子生物学研究人员包括染色质研究者来说,单细胞是最后的要塞。
Bernstein说:“我们需要用精准的、确定性的方法直接评估单个细胞中单分子间的相互作用。这是一个长期目标。”当细胞在发育过程中或在细胞高度异质性的肿瘤中退出干细胞状态时,单细胞数据可能有助于跟踪DNA结合因子。
有几种方法正在接近这一目标。然而,“许多单细胞方法的灵敏度仍然有限。”加州大学圣地亚哥分校基因组生物学专家Christopher Benner说。例如,Bernstein和他的同事使用微流控系统和条形码技术采集单细胞ChIP-seq数据。该技术从每个细胞中捕获到500~10000个独特的代表DNA结合事件的“可读取片段”,而在细胞群中则可以捕获到数百万个可读取片段。
有几种方法也可以产生基因组活跃区域的数据。ATAC-seq(基于测序的转座酶可达染色质测定)在开放染色质区域部署一个整合到基因组的超高活性转座酶,并引入测序适配器。ATAC-seq可适用于单个细胞,而且得到的序列数据可以用各种计算方法进行分析。例如,这些方法可以鉴定启动子序列,或者识别实验中的条件同时敲除DNA控制元件,又或者评估RNA表达。
Snyder指出,ATAC-seq存在一些缺陷,例如未完全整合到可达区域。但是这项技术仍然很强大,它可以被用于插入荧光团并进行成像,从而在测序之前得到3D基因组结构的成像数据。
Snyder表示,在斯坦福大学的Alistair Boettiger等实验室里,成像工作正在进行,他们正在开发利用超分辨率成像技术同时成像基因元件和新生RNA转录本的方法,以评估哪些元件促进或抑制了基因表达。“成像是未来的趋势。”Stamatoyannopoulos补充道。其他研究人员注意到,随着“三代”纳米孔测序技术的改进,将会开发出类似ChIP的方法来插入它。
“我们可能需要完全正交的方法来达到这个目标。”研究单细胞染色质分析的Bernstein说,基于“某些与我们现在使用的完全不同的技术”,这个目标最终很可能会成功实现。■
(译者李楠系中国科学院深圳先进技术研究院副研究员)
作者Charlotte Schubert是一位常驻西雅图的自由记者。2015~2016年,她曾经在Steve Henikoff的实验室里参与一些与本文所涉及内容无关的项目研究工作。
鸣谢:“原文由美国科学促进会(www.aaas.org)发布在2018年12月16日《科学》杂志”。官方英文版请见https://www.sciencemag.org/features/2018/12/chip-old-block-beyond-chromatin-immunoprecipitation。
《科学新闻》 (科学新闻2020年12月刊 科学·生命)