2023-03-09 16:27

人类组织学图谱正在制作中

什么被炒作,什么被忽视,往往取决于好的故事叙述。1990年,当人类基因组计划开始时,它有一个简单的故事,讲得很好。从一开始,美国纳税人将为人类基因组中发现的24种染色体(女性有23种;男性拥有一个额外的小细胞,携带着男性化的基因开关)。欢迎其他人加入(他们也加入了;三分之一的工作是在英国完成的,由威康基金会资助),并且将有国际协调,以防止工作重复。但真正让人感动的是美国政府。预算以数十亿计。

这是一次辉煌的成功,无论是在科学上还是作为美国科学界的一次公关活动。当它完成时,大多数自认为消息灵通的人都听说过它。事实上,公众对科学术语的意识发生了罕见的转变,编辑不再要求记者在每次提到DNA时都解释它到底是什么。

然而,有谁听说过人类细胞图谱?寥寥无几。然而,它的目标与基因组计划相似。它为组织学所做的,就像为遗传学所做的那样,为人体的一系列组成部分绘制详尽的地图——在这种情况下,是人体的细胞,而不是DNA。正如今年在华盛顿特区举行的美国科学促进会(AAAS)会议上所听到的,这是一个与基因组计划同等重要的医学目标。但是,人类细胞图谱的开端并不大,组织分散,领导者也不强势,这意味着它几乎一直不为人所知。

基因组计划的领导者(他们都是男性)是无限自负和在公众面前露面的人。相反,细胞图谱项目是由一对低调坚定的女性创立和管理的:莎拉·泰希曼和阿维夫·雷格夫。他们的日常工作分别是在英国剑桥附近的惠康桑格研究所和旧金山附近的生物制药公司基因泰克。但他们也设法找到时间来运作指导委员会,使地图集展览继续进行。他们与斯蒂芬•奎克(Stephen Quake)一道,向与会人员通报了迄今为止该项目的进展情况。奎克是在加州陈-扎克伯格生物中心(Chan-Zuckerberg Biohub)开展的一个名为Tabula Sapiens的平行协调项目的组织者。

我公司ntain众多

平均一个成年人的身体由37.2万亿个细胞组成。显然,目前还没有一种可以想象的技术能够将它们逐个定位。但是,就像真正的地图集不会显示每个建筑一样,细胞地图集也不需要显示每个细胞。然而,它应该识别和描述每一种类型的细胞,以及这种细胞类型在体内的位置——不仅是哪个器官,甚至是器官中的哪个组织,而且还应该是组织中的位置。

截至3月3日,即Regev、Teichmann和Quake博士发表演讲的日期,细胞图谱项目始于2016年10月,已有来自86个国家1483个研究所的2704名研究人员签约。这些科学家总共检查了来自9554名捐赠者的14635个样本,记录了1.2亿个细胞的数据——这个数字每180天左右就会翻一番。

重要的是,对于组织者的目标(也与基因组计划相反),每个有人居住的大陆上的研究所都在帮助创建地图集。由于他们从当地样本中提取材料,这意味着从一开始,尽管地球上较富裕的地区不可避免地被过度代表,但来自各种种族背景的数据已经被包括在内。

基因组计划有一个明确的终点,事先就知道(人类基因组中基因“字母”的数量可以通过测量DNA的含量来计算),而细胞图谱计划的目标是模糊的。当它开始的时候,没有人知道有多少种细胞。答案是,“比人们曾经认为的要多得多”。

2016年出版的教科书可能会给出约300个数字,但同时承认这肯定是低估了。到目前为止,图谱的研究人员已经确定了数千个细胞,确切的数字取决于你对两个细胞之间的差异有多挑剔,才能算作不同类型。

没有白板

这种差异是由基因组计划确定的20,000个蛋白质编码基因中哪些在细胞内活跃决定的,因为这种蛋白质的混合决定了细胞的结构和功能。正是蛋白质组成的可变性允许了分工和功能的专业化,使复杂的多细胞生物,如人类得以进化。

图谱的制图者不是直接寻找蛋白质,而是寻找RNA。蛋白质是通过将被称为信使RNA (mRNA)分子的经过编辑的基因转录物翻译成氨基酸链而制成的。因此,这些信使可以充当它们编码的蛋白质的代理。计算和描述RNA分子的技术比蛋白质的技术要成熟得多。

因此,有可能取单个细胞,提取其mRNA,并测量每个这样的转录本的数量(如果有的话)。正如Regev博士在会议上解释的那样,这意味着这样分析的细胞可以被放在数学空间中的某个位置,这个位置不是像标准图那样用两个轴来描述,也不是像三维图那样用三个轴来描述,而是用2万个轴来描述,每个轴代表一个蛋白质编码基因。

虽然人类的大脑还不能开始处理2万维图的概念,但计算机可以。它能够根据细胞在这样一个多维空间中的位置对细胞进行聚类,并从聚类的方式,将它们分类到对应细胞类型的篮子中。

然后,为了让愚昧的人类大脑受益,它可以应用一种数学技术,将整个事物压缩到二维,以便于观看。由此(见上图)就有可能看到细胞类型的出现。

不同的器官有不同数量的细胞类型。最多的是大脑(从早期的草稿来看是3000个,但毫无疑问不止这个数字)。考虑到大脑工作的复杂性,这不足为奇。但即使是普通的肠道也至少有137个。

然而,每个器官,无论细胞类型丰富还是贫乏,都是该项目中自己的子图谱的主题。参与组织收集的所有数据在收集和验证后立即向世界公开,以便其他研究人员可以从中受益。

经过一年左右的初步准备,由Regev博士(当时在马萨诸塞州剑桥的Broad研究所)和Teichmann博士组织的细胞图谱项目在伦敦的一次活动上启动。大约有100名研究人员参加了这次会议。2017年,陈-扎克伯格倡议开始实施。到目前为止,该慈善机构已经为该项目捐赠了2.54亿美元,并赞助了Tabula Sapiens。该企业在2019年收集了第一批样本,这是在早期小鼠项目的基础上进行的。这个想法是在2025年产生完整地图集的第一份草案。

除了立即发布数据外,每个相关小组都发表了自己的论文。例如,Tabula Sapiens团队在2022年发表了一份手稿,描述了他们所做的事情。他们专注于从同一个人身上获取多个不同器官的样本。为此,他们从自愿捐献器官的人身上采集了器官,然后过早地结束了生命。

该项目的“应急小组”与当地一家器官捐赠慈善机构合作,在征得家属同意后,从这些捐赠者身上取出了不需要移植的组织,并在生命维持系统被撤销后的一个小时内完成了这一工作。并不是所有的捐赠者都被认为是合适的。特别是,为了得出尽可能广泛的结论,研究小组需要平衡性别和种族。最后,他们从15名捐赠者那里获得了24种组织和器官的多个样本。

大多数其他研究小组都没有这么专注。他们将使用因医疗原因而收集的活组织检查的材料,如果可以的话。但他们经常研究死后的样本,这些样本经常被冷冻,因此它们的结构可能发生了微妙的变化。然而,无论样本的来源是什么,都必须进行处理。

基因组计划依赖于两项主要技术。一种是从染色体上随机截取的短段DNA序列,按顺序提供遗传字母。另一种是计算机,它可以发现这些序列之间的重叠,从而将整个染色体拼接在一起。然而,细胞图谱需要许多方法。事实上,是很多倍。

方法和手段

Teichmann博士和Regev博士在2022年12月发表的一篇论文描述了细胞图谱项目涉及的六类技术方法。它们的范围从组织成像和通过转录组学的组织学到“基因组和表观基因组学”。这些类别进一步细分为100个类别,从可以应用于整个身体的磁共振成像技术,到核小体占用和甲基组测序,这涉及到染色体内包裹在蛋白质簇周围的单个DNA节点。

然而,最重要的技术是处理单个细胞的能力,以便研究它们的mRNA模式,以及进行所谓的空间测序的能力,这种能力允许在显微镜载玻片上安装的组织薄片中识别单个细胞的类型。

细胞处理是奎克博士的专长。2012年,他将一种微流体装置商业化,这种装置可以将细胞打开,释放其mRNA,并分析产生的转录模式,一次96个细胞。仅仅十年之后,现在一次处理几十万个细胞已经成为可能——诀窍是将每个细胞悬浮在浮在油介质中的一滴液体中,并伴随着一颗标记了分子的珠子,这些分子就像条形码一样可以识别它。

用这种方法确定了细胞类型之后,下一阶段是在实际组织中寻找它们。这就是空间排序的作用。就像在本科生的组织学实验室里经常发生的那样,要研究的组织被埋在一块蜡里,然后用锋利的刀把它切成薄片。然后将每一片切片放在显微镜载玻片上。

经典组织学的下一阶段将是使用化学染色来显示单个细胞。在这种情况下,污渍是由单链DNA分子组成的,这些分子上有荧光标记。它们只会粘附在切片中的互补RNA分子上,因此只标记含有与所研究的细胞类型相关的RNA的细胞。

这样绘制的幻灯片本质上是地图集的几页,或者更准确地说,是正在制作的地图集的各个卷中的某一卷,因为每个器官都有自己的卷,生命的各个阶段,特别是产前,病变组织和健康组织也都有卷。

最后一点尤其重要,因为锻炼的最终目的是改善人类健康。如图所示,到目前为止,已经建立了15个男女通用的器官系统的病变组织的独立图谱卷。它们也适用于男性和女性的生殖系统,以及发育中的胎儿。Regev博士向会议概述了这一方法已经取得成效的四个例子。

第一个是改变对囊性纤维化的理解,囊性纤维化是一种由一个人遗传了两个被称为CFTR的坏基因,分别来自父母。缺乏有效的CFTR基因会导致肺气道内细胞产生的粘液太厚。这会导致呼吸困难,并鼓励感染,缩短患者的寿命。

那些研究囊性纤维化的人很早就知道这一切。他们不知道的是(尽管他们认为他们知道)哪些肺细胞表达CFTR。通过研究转录模式,细胞图谱研究人员发现,具有这种功能的细胞是一种罕见的、迄今为止未知的类型,他们将其命名为离子细胞(其中一些在故事开头的图片中)。这一发现正在改变囊性纤维化研究的方向。

肠道细胞图谱研究人员同样发现了与炎症性肠病有关的全新细胞类型,这些细胞可能因此成为药物治疗的靶点。研究癌细胞图谱的人可以通过mRNA谱来预测黑色素瘤是否会对免疫疗法产生反应。

不过,Regev博士和Teichmann博士对地图集在应对covid-19中的作用感到特别自豪。与所有病毒一样,新冠病毒的病原体SARS-CoV-2通过附着在细胞表面膜上的特定分子(通常是蛋白质)上进入细胞。一旦确定了SARS-CoV-2进入细胞的相关蛋白质,世界各地的研究人员就能够通过图谱寻找表达ACE2和TMPRSS2的细胞类型,这两种蛋白质是有问题的。这使他们能够精确定位呼吸道以外的组织,这些组织也可能受到感染,如肝脏、心脏和肾脏(上一页所示的细胞,其表面膜上有SARS-CoV-2颗粒萌芽)。

细胞图谱的其他医学用途包括确定细胞工程的最佳候选者(使用转基因细胞作为治疗方法),大规模筛选潜在药物以观察它们对特定细胞类型的单独影响,以及类器官的设计,类器官是实际器官的小型拟像,可以用来进行在人身上无法进行的实验。简而言之,人类细胞图谱将使人体不再像以前那样不为人知,并使其在出现问题时更容易修复。换句话说,它将继承人类基因组计划的遗志。现在,你终于听说了。