2023年12月22日,复旦上医徐彦辉团队在《科学》(Science)杂志上在线发表题为“Structural visualization of transcription initiation in action”的研究长文(Research Article)。该项研究首次用结构重现出了转录从头起始的16个连续动态全过程,揭示了通用转录因子(GTFs)和转录泡协同RNA聚合酶Pol II调控转录起始向转录延伸转变的分子机制。
一部58万张照片的分子定格电影
生命的遗传物质是DNA,而DNA可以通过自我复制,伴随着细胞的分裂传递遗传信息。DNA可以通过转录形成RNA,RNA通过翻译的过程合成蛋白质。
转录是基因表达调控的核心,基因表达调控在人的发育、疾病发生过程中起到重要作用。真核细胞的基因转录需要经历起始,延伸,终止等多个阶段。多细胞生物为了满足在同一套基因组的基础上实现差异性的基因表达,需要经过非常复杂且精细的基因表达调控过程。基因表达调控主要集中发生在转录的起始阶段,细胞中基因的转录默认是低活性状态,需要经历一系列复杂的转录起始过程,才能起始基因表达。转录起始过程涉及十余个复合物上百个蛋白的巨大转变,过去几十年来,众多的实验室利用生物化学、单分子生物物理以及结构生物学等方法开展了大量探索性的工作,但对其发生过程和分子机制的理解还不够深入。
转录起始调控示意图。黄色数字标注是徐彦辉团队过去几年来在转录起始方向取得的代表性成果。
在此项研究中,徐彦辉团队解析了一个转录过程中重要的动态事件:从转录起始向转录延伸的过渡,这一事件也被称为启动子逃逸。启动子逃逸是转录从起始到延伸的关键转折步骤,在这一过程中RNA聚合酶II的构象需要发生变化,在生成RNA产物的同时解离通用转录因子。
长期以来,这一过程一直蒙着神秘面纱。中国科学院生物物理研究所研究员朱冰在专家点评中解读,“这(揭示启动子逃逸过程)是领域中一个长期未能解决的问题,因为这是一个快速的动态事件,RNA聚合酶II延伸的速度一般被认为是每分钟几千个碱基,而启动子逃逸过程涉及的大约只有最初的20个左右的碱基的合成,也就是说需要在几秒钟内完成一系列的动态事件,这对于结构生物学研究是一个极大的挑战。”
在研究过程中,徐彦辉团队致力于将这一瞬间定格为永恒。据介绍,研究人员设计了一系列的转录模板,可以控制RNA聚合酶II停在转录最初17个碱基时的任意一个碱基位置。这一设计好比让连贯的场景变成一桢桢定格画面,随后,研究人员逐步捕捉每一步的画面,连贯而成一部动态“电影”。这部“电影”也首次描绘出了连续的转录起始动态全过程,揭示完整转录起始过程及其分子机制。
三个不同的方式展示同一个动态过程。其中左侧为完整复合物,右上为隐去覆盖核酸的部分蛋白质以显示催化中心和核酸相互作用关系,右下为核酸(黄色的为模板链)。
由于复合物的组成和构象不均一,为了获得高分辨率结构数据,研究人员利用复旦上医平台300 kV冷冻电镜采集了约110天,共58万张照片数据,获得了分别暂停在转录起始位点下游2-17位核苷酸,核心分辨率为2.7-3.3 Å,共16个转录复合物(TC2-TC17)的结构。通过这16个连续的结构,结合早期该团队解析的转录前起始复合物PIC结构,研究团队得以描绘这一动态全过程。
体外重建转录复合物体系。
(A)16个(分别暂停在转录起始位点下游2-17位核苷酸的位置)的G-less DNA模板示意图。(B)体外转录活性实验。(C)转录复合物体外组装示意图。
解析的16个转录复合物结构
通过动态全过程的描绘,研究团队首次观测到启动子逃逸的“关键一刻”正是当RNA链由9个核苷酸(nucleotide,nt)增加到10 nt时,NTP水解驱动RNA-DNA移位并推动所累积的模板单链胀破由TFIIB和Pol II形成的模板链通道,导致TFIIB连带其他GTF从Pol II上解离,转录泡“崩塌”(bubble collapse),转录复合物由ITC转变成EEC状态,Pol II从启动子逃逸(promoter escape)。
生命设计这一分子层面的“过河拆桥”,其逻辑在于:为了避免异常的基因表达,真核基因默认是沉默状态,Pol II本身无法打开启动起始转录,为了起始转录,需要GTF帮助Pol II结合启动子开始合成RNA,完成起始后当RNA-Pol II-DNA足够稳定,Pol II要进入延伸阶段离开启动子区域,需要摆脱GTF和启动子的束缚。
“用最复杂的完整的复合物去开展研究”
过去几十年来,关于转录起始研究达数百篇,但由于实验设计和实验材料的不一致,不同的实验结论之间相互矛盾,许多结论长期以来未得到统一。
本研究将众多看似矛盾的结论作了统一,回答了起始过程中众多问题,揭示了转录起始调控的机制,为理解基因表达调控奠定了结构基础。该研究也开创了利用生化和结构生物学重构生物大分子机器动态过程,揭示其工作机制的新路径,为众多复杂过程的研究提供了新思路。
此前,徐彦辉团队连续在Science杂志发表5篇研究论文,揭示多个转录起始关键过程的分子机制,包括揭示人源BAF复合物的染色质重塑机制(点此阅读)、转录起始复合物识别基因启动子及其动态装配机制(点此阅读)、中介体促进RNA聚合酶磷酸化和转录激活机制(点此阅读)、+1核小体调控转录起始的分子机制(点此阅读)以及发现并鉴定新型转录调控复合物INTAC(点此阅读)。上述工作较为系统地揭示了转录起始各个阶段关键点的复合物状态,推动了对转录机制的深入理解。
“当我们想进入到这个领域的时候,我们也可以走简单的路,但是我们希望从根本上去回答这个问题,用最复杂的完整的复合物去开展研究。”徐彦辉表示。“我们都是站在几十年生化和结构研究基础上,才能得到现在的一些发现。当然,给大家传递的信息是我们对于生命的分子事件的理解还远远没有达到真实的程度,还有很多未知的东西需要我们去探索。”未来,团队将进一步探索更多转录过程的图景。
复旦大学生命科学学院青年研究员陈曦子、复旦大学生物医学研究院2019级直博生刘维达、青年研究员王茜敏以及粤港澳大湾区精准医学研究院博士后王鑫鑫为本文共同第一作者,复旦大学附属肿瘤医院研究员、生物医学研究院兼职研究员徐彦辉为通讯作者。
原文链接:
https://doi.org/10.1126/science.adi5120