盘点2022年值得关注的七大生物欧宝app技术精准基因组编辑、靶向基因疗法、量子模拟……
从基因编辑到蛋白质结构确定,再到量子计算等,七种技术可能在未来一年内对科学产生重大影响。
当加利福尼亚大学圣克鲁斯分校(University of California, Santa Cruz)的基因组学研究人员Karen Miga和马里兰州贝塞斯达国家人类基因组研究所(National Human Genome Research Institute)的Adam Phillippy在2019年创立端粒到端粒联盟(Telomere-to-Telomere, T2T)时,大约十分之一的人类基因组仍未被破译欧宝app。现在,这个数字已降至零——人类基因组已被全部破译。在2021年5月发表的预印本中,该联盟报告了人类基因组的首个端到端完整序列,为广泛使用的人类共有基因组序列GRCh38 添加了近2亿个新碱基对,并撰写了人类基因组计划的最后一章。
GRCh38于2013年首次发布后,一直是非常有用的工具,是各类测序结果的参考基因组。但这一序列充满了漏洞,原因在于加利福尼亚州圣地亚哥的Illumina开发的、广泛使用的测序技术产生的读数虽然准确,但只能实现短序列的检测。该技术不足以明确地绘制出高度重复的基因组序列,包括覆盖染色体末端的端粒和在细胞分裂过程中协调新复制的DNA分配的着丝粒。
读长较长的测序技术被证明是游戏规则的改变者 这些技术由加利福尼亚州门洛帕克的 Pacific Biosciences和英国牛津的Oxford Nanopore Technologies (ONT)开发,可以在一次读取中对数万,甚至数十万个碱基进行测序,初代长读长测序技术存在准确性方面的问题。然而,当T2T团队在2020年重测他们的第一条个体染色体(X染色体和8号染色体)时,Pacific Biosciences的测序已经发展到长段重复序列中的微小变化的程度,准确程度不亚于T2T使用的短读方法。这些微妙的“指纹”使长的重复染色体片段易于识别和追踪,很快能实现对剩余基因的测序。ONT平台还捕获了许多调节基因表达的DNA修饰,T2T也能够在全基因组范围内绘制这些“表观遗传标签”。
T2T检测的基因组来自包含两组相同染色体的细胞系。正常的二倍体人类基因组中每个染色体含有两个拷贝(一个来自父亲,一个来自母亲),研究人员现在正在研究“定相”策略,可以可靠地将每个序列分配给对应的染色体拷贝。Miga指出,他们已经获得了一些非常惊人的分阶段装配。
这项二倍体组装工作是与T2T的合作伙伴——人类泛基因组参(Human Pangenome Reference Consortium)合作进行的,该组织渴望根据来自世界各地的数百名捐赠者制作更具代表性的基因组图谱。该联盟的首席研究员之一、纽约市洛克菲勒大学(Rockefeller University)的遗传学家Erich Jarvis表示,他们的目标是平均捕获97%的人类等位基因多样性。作为脊椎动物基因组计划(Vertebrate Genomes Project)的主席,Javis还希望利用这些完整的基因组组装能力为地球上的每个脊椎动物物种生成完整的基因组测序。他认为在接下来的10年内,他们将定期进行端粒到端粒的基因组研究。
结构决定功能。但解析结构本身就是一件难事儿。过去两年的重大实验和计算进步为研究人员提供了互补的工具,以前所未有的速度和分辨率确定蛋白质结构。
由伦敦Alphabet子公司DeepMin开发的AlphaFold2结构预测算法,依靠“深度学习”策略从其氨基酸序列中推断折叠蛋白质的形状。在2020年蛋白质结构预测关键评估竞赛中,计算生物学家在该竞赛中直接测试了AlphaFold2算法,并取得了决定性胜利。之后,AlphaFold2名声大噪,采用率不断增长。英国欣克斯顿欧洲生物信息学研究所(European Bioinformatics Institute)高级科学家兼前主任Janet Thornton提到,对于某些结构,预测几乎出奇地好。自去年7月公开发布以来,AlphaFold2已应用于蛋白质组,以确定在人类和20种模式生物中表达的所有蛋白质的结构(参见 Nature 595, 635; 2021),以及Swiss-Prot数据库中近440,000种蛋白质的结构。这一计划将大大增加可用于高置信度建模数据的蛋白质数量。AlphaFold 算法也证明了其处理多链蛋白质复合物的能力。
与此同时,低温电子显微镜 (cryogenic-electron microscopy, cryo-EM) 的改进使研究人员能够通过实验解决即使是最具挑战性的蛋白质和复合物。Cryo-EM使用电子束扫描快速冷冻的分子,生成多个方向的蛋白质图像,然后可以通过计算重新组装成3D结构。2020 年,cryo-EM硬件和软件的改进使两个团队能够生成分辨率低于1.5埃的结构,捕获单个原子的位置。纽约市结构生物学中心西蒙斯电子显微镜中心(New York Structural Biology Center’s Simons Electron Microscopy Center)的联合主任Bridget Carragher表示,在此之前,他们疯狂地谈论‘原子分辨率’这个词,但它只是接近原子的,冷冻电镜确实是原子级分辨率。Carragher还指出,尽管两个团队都使用了一种经过充分研究的模型蛋白(脱铁铁蛋白),但现有研究表明,近原子分辨率对于其它更困难的目标也是可行的。
许多最初对AlphaFold2持怀疑态度的实验者现在将其视为对冷冻电镜等实验方法的补充,其计算模型可以帮助数据分析和重建。冷冻电镜可以生成目前无法进行计算预测的结果。例如,Carragher的团队正在使用“时间分辨”冷冻电镜来捕捉蛋白质与其它分子相互作用时发生的快速构象变化。她表示,她们可以动态捕捉事物,并查看在一百毫秒的时间内发生了什么。
一种相关的方法也很令人兴奋,即低温电子断层扫描 (cryo-electron tomography, cryo-ET),它可以捕捉冷冻细胞薄切片中的自然蛋白质行为。但对这些拥挤、复杂的图像的解释具有挑战性,Carragher认为机器学习领域的计算进步将是必不可少的。她想不出还有其他方式能解决这些几乎难以解决的问题。
原子大小非常小。但在适当的条件下,它们可以被诱导成一种高度激发的、超大尺寸的状态,直径约为一微米及以上。物理学家已经证明,通过以受控方式在精心定位的数百个原子阵列上执行这种激发,他们可以解决将传统计算机推向极限的、具有挑战性的物理问题。
量子计算机以量子位的形式管理数据。使用称为纠缠的量子物理现象耦合在一起,量子位可以在一定距离内相互影响。相对于经典计算机中同等数量的比特,这些量子位通过给定的量子比特分配,可以极大地提高计算能力。
几个小组已经成功地将单个离子用作量子比特,但它们的电荷使它们难以以高密度组装。包括法国国家科学研究中心(Centre National de la Recherche Scientifique)的Antoine Browaeys和马萨诸塞州剑桥哈佛大学(Harvard University)的Mikhail Lukin在内的物理学家正在探索一种替代方法。团队使用光学镊子将不带电的原子精确定位在紧密排列的2D和3D阵列中,然后应用激光将这些粒子激发成大直径的“里德堡原子”,并与它们的邻居纠缠在一起。据韩国大田韩国科学技术高级研究所(Korea Advanced Institute of Science and Technology)的物理学家Jaewook Ahn解释,里德堡原子系统是单独可控的,它们的相互作用可以打开和关闭。这反过来又赋予了可编程性。
这种方法在短短几年内获得了相当大的发展势头,技术进步提高了里德堡原子阵列的稳定性和性能,以及从几十个量子比特快速扩展到几百个量子比特。早期的应用集中在确定的问题上,例如预测材料的特性,但这种方法是通用的。Broways提醒,到目前为止,理论家提出的任何理论模型,都有实现它的方法。
该领域的先驱者已经成立了一些公司,这些公司正在开发基于里德堡原子阵列的系统供实验室使用,Broways 估计这种量子模拟器可能在一两年内上市。但这项工作也可以为量子计算机铺平道路,使其更广泛地应用于经济、物流和加密领域。研究人员仍在努力确定这项仍处于起步阶段的技术在计算世界中的地位,但Ahn将其与莱特兄弟早期进军航空业的做法相提并论。Ann认为,虽然第一架飞机没有任何运输优势,但它最终改变了世界。
就其基因组编辑能力而言,CRISPR-Cas9技术更适合基因失活,而非修复。这是因为尽管将Cas9酶靶向基因组序列相对精确,但细胞对由此产生的双链切割的修复却不太精确。由名为非同源末端连接的过程介导,CRISPR-Cas9修复经常因小的插入或缺失而变得混乱。
剑桥哈佛大学的化学生物学家David Liu指出,大多数遗传疾病需要基因校正而不是破坏。刘等人已经开发出两种有前途的方法来做到这一点。两者都利用了CRISPR的精确定位,同时也限制了Cas9在该位点切割DNA的能力。第一种称为碱基编辑,将催化受损形式的Cas9与一种酶结合,帮助一种核苷酸化学转化为另一种核苷酸——例如,胞嘧啶转化为胸腺嘧啶或腺嘌呤转化为鸟嘌呤(Nature2016)。但目前只能使用此方法访问某些碱基的更改。Prime编辑是该团队的新开发,将Cas9与一种名为逆转录酶的酶联系起来,并使用一种引导RNA,该RNA被修饰以包括对基因组序列的所需编辑(Nature 574, 464–465; 2019)。通过多阶段生化过程,这些成分将引导RNA 复制到DNA中,最终取代目标基因组序列。重要的是,碱基编辑和Prime编辑都只切割一条DNA链,这对细胞来说是一种更安全且破坏性更小的过程。
2016年首次报道以来,碱基编辑已经进入临床:由Liu创立并总部位于剑桥的Beam Therapeutics于11月获得美国食品和药物管理局FDA的批准,首次在人体中试验这种方法,目的是修复导致镰状细胞病的基因。
Prime编辑还处于相对早期的阶段,但该技术的改进不断出现,并且该方法的前景是明确的。首尔延世大学医学院(Yonsei University College of Medicine)的基因组编辑专家 Hyongbum Henry Kim等人已经证明,他们可以使用Prime编辑来纠正小鼠视网膜基因突变的效率高达16%。如果他们使用最近报道的更高级的版本,效率将会得到更大的提高。Liu的团队发现,主要机制可以帮助将基因大小的DNA序列插入基因组,从而为基因治疗提供更安全、更严格控制的策略。Liu指出,这个过程效率相对较低,但有时即使是一点点修复也能起到很大的作用。在某些疾病中,众所周知,如果你能以10%甚至1%的水平替换一个基因,你就可以挽救这种疾病。
基于核酸的药物可能会在临床上产生影响,但它们在可应用的组织方面仍然受到很大限制。大多数基因疗法需要对从患者身上采集细胞进行局部给药或离体操作,然后回输到患者体内。一个突出的例外是负责过滤血液的肝脏。肝脏被证明是选择性药物输送的强大目标,静脉内——甚至皮下——给药可以就能实现肝脏的基因治疗。
剑桥麻省理工学院 (Massachusetts Institute of Technology, MIT) 的化学工程师Daniel Anderson指出,对于基因治疗,向任何组织输送药物都是很困难的。我们的身体被设计为使用我们拥有的遗传信息,并不接受新的基因指令。但研究人员在开发策略方面取得了稳步进展,这些策略可以帮助将这些药物引导到特定的器官系统,同时不影响其它非靶组织。
腺相关病毒是许多基因治疗工作的首选载体,动物研究表明,仔细选择合适的病毒与组织特异性基因启动子相结合,可以实现有效的、器官受限的递送。然而,病毒有时难以大规模生产生物科技资讯,并且会引发免疫反应,从而破坏疗效或产生不良事件。
脂质纳米颗粒提供了一种非病毒替代品,过去几年发表的几项研究解释了脂质纳米颗粒在靶向器官方面的潜力。例如,达拉斯德克萨斯大学西南医学中心(University of Texas Southwestern Medical Center)的生物化学家 Daniel Siegwart 等人开发的选择性器官靶向(selective organ targeting, SORT)方法能够快速生成和筛选脂质纳米颗粒,以识别那些可以有效靶向组织(如肺或脾)中细胞的脂质纳米颗粒。荷兰埃因霍温科技大学(Eindhoven University of Technology)的生物医学工程师Roy van der Meel表示,这是最早的论文之一,它表明,如果你对这些脂质纳米颗粒进行系统筛选并开始改变它们的组成,你可以控制颗粒在体内的生物分布。Anderson指出,几个小组也在探索细胞特异性抗体等蛋白质成分如何帮助靶向过程。
Anderson对Beam Therapeutics和Intellia等公司在骨髓中靶向血液和免疫细胞前体的临床前进展感到特别兴奋,这两家公司都使用专门设计的脂质纳米颗粒配方欧宝app。他表示,成功靶向这些组织可以使患者免于当前体外基因疗法所涉及的艰苦过程,其中包括在移植前杀死现有骨髓的化学疗法。Anderson认为,在体内做这些事情真的可以改变患者的治疗。
单细胞组学发展的爆炸式增长意味着研究人员现在可以常规地从单个细胞中获得遗传、转录组、表观遗传和蛋白质组学的见解——有时是同时进行的()。但是单细胞技术也通过将这些细胞从其原生环境中剥离出来而牺牲了关键信息。
2016年,由斯德哥尔摩KTH皇家理工学院(KTH Royal Institute of Technology)的Joakim Lundeberg领导的研究人员制定了一项战略来克服这个问题。该团队准备了带有条形码的寡核苷酸(RNA或DNA的短链)的载玻片,可以从完整的组织切片中捕获信使RNA,这样每个转录本就可以根据其条形码被分配到样本中的特定位置。Lundeberg表示,没有人真正相信他们可以从组织切片中进行转录组范围的分析,但结果却出奇的容易。
空间转录组学领域从此爆发。现在有多种商业系统可供使用,包括10x Genomics的Visium空间基因表达平台。该平台建立在Lundeberg的技术之上。学术团体继续开发创新方法,以不断增加的深度和空间分辨率绘制基因表达图谱。
现在,研究人员正在他们的空间地图之上对 “组学见解”进行进一步分层。例如,康涅狄格州纽黑文耶鲁大学(Yale University)的生物医学工程师Rong Fan开发了一个名为 DBiT-seq的平台。该平台采用了一种微流体系统,可以同时为数千个mRNA转录物和数百个用寡核苷酸标记的抗体标记的蛋白质生成条形码。与仅从转录组数据中获得的数据相比,这可以更准确地评估细胞基因表达如何影响蛋白质的产生和活性,Fan的团队一直在使用它来研究免疫细胞激活等过程。他表示,他们看到皮肤中的免疫细胞如何对 Moderna COVID-19疫苗作出反应的早期迹象。一些商业系统还可以从多种蛋白质中获取空间数据,同时获取转录组学见解,包括Visium平台和Nanostring的GeoMx系统。
同时,Lundeberg的小组改进了其空间转录组学方法,以同时捕获DNA序列数据。这使他的团队能够开始绘制肿瘤发生背后的时空事件。他们可以追踪空间中的这些遗传变化,了解它们如何演变成最终导致肿瘤的其他遗传变异。
Fan的团队已经展示了组织样本中染色质修饰的空间映射,这可以揭示影响发育、分化和细胞间通讯等过程的细胞基因调控景观。Fan相信该方法可以与RNA,甚至蛋白质的空间分析相结合。他们有初步数据表明这是完全可行的。
CRISPR-Cas系统精确切割特定核酸序列的能力源于其作为抵抗病毒感染的细菌“免疫系统”的作用。该链接激发了该技术的早期采用者考虑该系统对病毒诊断的适用性。麻省理工学院和哈佛大学布罗德研究所(Broad Institute)的遗传学家Pardis Sabeti表示,将Cas用于天然的目的是很有意义的。自然界有数十亿年的进化。”
但并非所有的Cas酶都是一样的。Cas9是基于CRISPR的基因组操作的首选酶,但基于 CRISPR的诊断中的大部分工作都使用了称为Cas13的RNA靶向分子家族,该家族于 2016年由布罗德研究所分子生物学家张锋及其团队首次发现。据加州大学伯克利分校(University of California, Berkeley)的 Jennifer Doudna 解释,Cas13使用其RNA向导通过碱基配对识别RNA靶标,并激活核糖核酸酶活性,可通过使用报告RNA将其用作诊断工具。Doudna与Emmanuelle Charpentier因开发CRISPR–Cas9的基因组编辑能力而获得2020年诺贝尔化学奖,她现在在柏林的Max Planck病原体科学部门工作。这是因为Cas13不仅切割导向RNA靶向的RNA,还对附近的任何其他RNA分子进行“附带切割”。许多基于Cas13的诊断方法使用一种报告RNA,该RNA将荧光标签连接到抑制荧光的猝灭剂分子上。当Cas13在识别病毒RNA后被激活时,它会切割报告基因并从猝灭剂中释放荧光标签,从而产生可检测的信号。一些病毒留下了足够强的特征,可以在不放大的情况下进行检测,从而简化了即时诊断。例如,去年1月,加利福尼亚州旧金山格莱斯顿病毒学研究所(Gladstone Institute of Virology)的Doudna和Melanie Ott 展示了一种基于鼻拭子的快速CRISPR-Cas13测试,用于使用手机无扩增检测 SARS-CoV-2相机。
RNA扩增程序可以提高对微量病毒序列的敏感性,Sabeti等人开发了一种微流体系统,该系统使用来自几微升样本的扩增遗传物质并行筛选多种病原体。现在,她们有一种检测方法可以同时检测21种病毒,每个样本的成本不到10美元。Sabeti等人已经开发出基于CRISPR的工具,可以同时检测超过169种人类病毒。
Doudna指出,其他Cas酶可以充实诊断工具箱,包括Cas12蛋白,它们表现出与Cas13 相似的特性,但靶向DNA而不是RNA。总的来说,这些可以检测更广泛的病原体,甚至可以有效诊断其他非传染性疾病。Doudna提醒,“如果你能相对快速地做到这一点,那将非常有用,特别是当不同的癌症亚型由特定类型的突变定义时,这也能很快确定癌症的亚型。欧宝app欧宝app