基因和基因组

人类基因组首次测序至今已有十多年,耗资超过10亿英镑,耗时13年。今天,我们已经接近千美元基因组了……
2012年8月14日
提出的Kat Arney

人类基因组首次测序至今已有十多年,耗资超过10亿英镑,耗时13年。今天,我们接近于千美元基因组。但是基因组里有什么,它能告诉我们我们的疾病风险是什么?此外,我们还会讨论北极熊的年龄,并找出患皮肤癌的鱼。我们这个月的基因是给星际迷们的,它是tribles。

在这一集里

人类基因组

01:10 -基因,基因组和垃圾DNA

自从第一个人类基因组被解码以来,测序技术的发展速度几乎难以想象,成本也大幅下降。今天的机器吐出大量的DNA序列,通常在…

基因、基因组和垃圾DNA
和蒂姆·哈伯德博士,来自威康信托桑格研究所

哈伯德博士:现在,我们在这里做的大部分是重新排序。我们有人类和其他一些脊椎动物的参考序列,我们感兴趣的是观察这个序列在大量个体中是如何变化的。所以,当我们对另一个个体进行测序时,对他们中的大多数人来说他们的序列将与参考序列相同所以这是一个比较和发现差异的问题。这就是处理新基因组的方法。

这里有一些独特的部分。有一个过程叫做组装,你基本上把这些碎片放在一起,就像把砖头放在墙上一样。它们彼此重叠,你希望它们独特地组合在一起,这样你就能做出一个独特的序列。随着片段的长度越来越长,构建一个独特的组装就变得越来越容易。

凯特:所以你把所有这些片段取出来,把它们组装在一起,把它们排成一行,你就得到了一个完整的基因组。有多少不同物种的全基因组是这样被解读的?

哈伯德医生:我数不清了。我们在ENSEMBL数据库中有大约50种脊椎动物,但也有计划对10000种脊椎动物进行测序。我这里说的只是脊椎动物。病原体和细菌的基因组有很多很多。基本上,现在测序变得如此便宜,所以有大量的测序正在进行。尽管制造出任何特定物种的第一个版本仍然很困难。建立一个参考要困难得多。

凯特:所以你有了这个基因组,这个组成生物体DNA的字母集。。那太好了。我相信拥有它是件好事。我想真正的挑战在于理解它。你怎么知道里面有什么?是什么使这个物种成为这个物种?

哈伯德博士:一旦你有了一个组装,你首先感兴趣的是基因。基因是基因组的片段,它们被表达以制造物理蛋白质,这是每个细胞的一部分,以及调节这些基因开启和关闭的机制。比如说人类有多少个基因?所以在相当长的一段时间里,我们认为基因的主要定义是制造蛋白质的东西,最初的估计是可能有多达10万个。这些都是2000年的分析数据,这个数字逐渐下降。

一开始的冲击分析说只有3万辆,现在下降到大约2万辆。它看起来像是一小部分基因但最近,我们发现还有其他种类的基因不产生蛋白质只产生rna。

所以,使用基因的过程是,有一个DNA序列,你复制这个序列的一个区域,那就是RNA,然后你翻译它,制造蛋白质。有一组重要的基因永远不会产生蛋白质。你只需要制造RNA RNA本身就是一个功能单元。有时是监管的一部分,事实上,有时是某种结构功能。但这似乎比我们几年前想象的要多得多。确切地说,它们有多少,实际上很难,因为它们比蛋白质更难识别,因为有一个特征使得识别蛋白质序列相对容易。RNA要难得多。

凯特:我想这些是基因组中以前几乎被认为是垃圾DNA的区域。。我们不知道他们做了什么。你认为垃圾DNA的概念还存在吗?你认为基因组的任何部分是垃圾还是我们会发现它们都是功能性的?

哈伯德博士:“垃圾”的定义取决于基因组的某个区域是否保守,而这种保守是基于比较物种之间的序列。这个区域在老鼠、斑马鱼、黑猩猩或其他人类身上是否相似?我们在这方面做得更好了,但相似性仍然是基于蛋白质的。

可能还有其他东西是保守的比如基因组上元素之间的间隔。这是守恒,但你不会用同样的方式来得分。现在突然很清楚,我们可以用这种DNA技术来找到整个转录组,基因组中转录的所有东西,我们也可以用它作为另一种形式的分析来发现基因组的另一层修饰,也就是表观基因组。

它是一种修饰层,似乎至少能捕捉到细胞的状态。所以从这个意义上说,大多数DNA对于表观基因组来说都处于某种状态所以你可以说,好吧,到底剩下多少垃圾?有多少东西可以被归类为垃圾?因为事实上,大多数似乎都以某种方式被贴上了标签。

凯特:我们将在未来一期的裸遗传学播客中介绍表观遗传学,并对此进行更多的探索。。但是就我们现在拥有的所有数据而言,这些关于活跃基因,转录基因的数据,生物体基因组中的基因,所有这些物种,所有这些病原体的数据,你如何组织这些数据,如何存储这些数据,如何使研究人员可以使用这些数据?

哈伯德博士:现在已经出台了一项政策——部分来自人类基因组计划和当时的其他项目——要求立即公布数据。DNA数据库已经存在了30年了,我想,当你排序和发表时,数据应该被存储起来,这已经成为一种政策。

但这是一大堆原始数据,对研究人员来说很难使用,所以数据库已经发展起来来组织这些数据。随着整个基因组的测序,整个基因组已经成为DNA的组织原则。

因此,像ENSEMBL这样的项目已经成为一个你可以看到基因组的地方,以及所有已知的关于它的注释,关于基因在哪里,因子在哪里结合,调控模式。一开始,ENSEMBL是基于脊椎动物的,但由于现在收集了不同细胞类型的数据,你开始能够显示这些信息,以及不同细胞类型的表观遗传状态。

凯特:刚才是蒂姆·哈伯德,来自威康基金会桑格研究所。。

一只北极熊

08:38 -争论北极熊的年龄

第一个故事来自美国宾夕法尼亚州立大学和布法罗大学的一位科学家。它基本上是关于北极熊在历史上什么时候开始进化的……

争论北极熊的年龄
萨菲亚·达诺维

达诺维博士:第一个故事来自美国宾夕法尼亚州立大学和布法罗大学的一位科学家。它基本上是关于历史上北极熊是从什么时候开始从其他种类的熊进化而来的。

凯特:因为我们几个月前就报道过这个问题,有一些新的研究表明,北极熊和棕熊在大约60万年前分裂了。但实际上,这个新数据把它放得更早了。

达诺维医生:当然,我的意思是几个月的改变是多么大啊。所以目前,他们说目前的数据表明北极熊和棕熊大约在400万到500万年前分开,所以这是一个巨大的差异。我想区别在于他们使用的技术。这项新研究完成了核基因组的全基因组测序,而上一项研究只观察了基因组的各个点。所以我想细节才是决定成败的关键。

凯特:还有一件很有趣的事,人们回顾四五百万年前的地球,然后说,你知道,很明显,你可以看到大约60万年前有浮冰,北极熊在地理上是分开的。但在更早的时候,棕熊和北极熊是共存的,所以实际上这提出了一种想法,可能是杂交,它们之间有繁殖,当我们观察这些熊的进化时,情况就更加模糊了。

达诺维博士:当然,我认为这些数据正受到另一个总部设在德国法兰克福的研究小组的质疑,他们认为冰原不是在四五百万年前形成的。那么是什么选择压力导致北极熊分裂呢?所以我想这还不是故事的结尾。但说真的,谁知道北极熊会如此有争议呢?

凯特:有些人说,也许随着冰盖的消失,我们会看到北极熊回到陆地上。也许他们可以再次开始与陆地熊繁殖?

达诺维博士:我们可能会看到一只米色熊的出现。

凯特:这当然是一个有趣的想法。

人类牙齿的模型,因为他们存在于牙槽骨。

10:32 -牙齿干细胞

这个月我注意到的另一个故事来自赫尔辛基生物技术研究所的Emma Juuri和她的团队,他们在《发育细胞》上发表了这篇文章。他们一直在学习……

牙齿干细胞
萨菲亚·达诺维

凯特:这个月我注意到的另一个故事来自赫尔辛基生物技术研究所的艾玛·朱丽和她的团队,他们在《发育细胞》杂志上发表了这篇文章。他们一直在研究牙齿,尤其是老鼠的牙齿,他们发现一种叫做Sox2的特殊转录因子在老鼠门牙的干细胞中表达。这很有趣,因为老鼠的门牙实际上是一生都在生长的。但很明显,人类的牙齿会停止生长,所以我们正在寻找是什么驱使干细胞在老鼠身上长出牙齿,也许我们可以用它来让人类的牙齿再生。你认为这个故事怎么样?

达诺维医生:我认为这是一个极好的消息。我是作为一个牙齿非常糟糕的人说这番话的,如果我有能力从头开始长出更多的牙齿,我会非常非常高兴。

但严肃地说,我想知道Sox2在人类身上是否也起着同样的作用会很有趣我们知道Sox家族是一个非常专横的基因家族。它们喜欢告诉细胞该做什么,最著名的例子是Sox9,它告诉发育中的胚胎变成男孩。你知道,我对这个故事很感兴趣,我认为它在商业上很重要。

珊瑚鳟鱼

11:37 -有癌症的鱼

研究人员首次在鱼类中发现了黑色素瘤。这是大堡礁外澳大利亚海岸的一个野生鱼类种群,它令人担忧,因为它……

患癌症的鱼
萨菲亚·达诺维

凯特:现在,我们从有牙齿的老鼠转移到有癌症的鱼。。最后一个故事是什么?

达诺维博士:这实际上是一个非常令人不安的故事,因为他们第一次在鱼类中发现了黑色素瘤。这是大堡礁外澳大利亚海岸的野生鱼类种群,这令人担忧,因为它是一种重要的商业鱼类。这是珊瑚鳟鱼,这是他们第一次在鱼身上发现黑色素瘤。所以这很有趣,特别值得注意的是,这部分海岸就在臭氧层最大空洞的正下方。

凯特:所以他们认为臭氧的损失实际上是导致这些鱼过度暴露在紫外线下,从而导致它们癌症的原因? ?

达诺维医生:是的,当然,我认为他们已经排除了微生物病原体和污染的可能性,所以目前,紫外线似乎是最有可能的原因。。我认为他们必须通过实验来证明这一点但他们也证明了他们在这些鱼身上发现的黑素瘤和在人类身上发现的黑素瘤非常相似。所以,如果紫外线是主要原因也就不足为奇了。

凯特:但是这种情况有多普遍呢? ?我的意思是,人类的黑色素瘤并不是一种常见的癌症。有多少鱼得了这种病?

达诺维博士:所以,他们对不到140条鱼进行了取样,发现大约15%的鱼有黑色素瘤病变,当然,他们怀疑野生鱼类患黑色素瘤的比例可能要高得多,因为很明显,重病的鱼可能会撤退,躲在海底,在那里它们不太可能被捕获和取样,所以我们不知道这个问题有多普遍。

凯特:那么,既然他们发现了这个问题,下一步打算做什么呢? ?

达诺维博士:我想他们的下一步将首先观察黑色素瘤并对其进行特征描述,当然,这就引出了一个问题:是否有任何一种鱼类受到这种癌症的困扰,这实际上是非常令人担忧的。

凯特:这确实值得深思。

心Uni-ventricle

13:42 -恢复心脏细胞活力

圣地亚哥州立大学心脏研究所的一个研究小组发现,老年心力衰竭患者受损的心脏组织可以通过采用改良的干细胞来恢复活力。

活化心脏细胞

圣地亚哥州立大学心脏研究所的一个研究小组发现,老年心力衰竭患者受损的心脏组织可以通过从他们自己的心脏中提取的改良干细胞来恢复活力,并在《美国心脏病学会杂志》上发表了他们的发现。

科学家们从老年患者身上提取了心脏干细胞样本,并添加了一种名为PIM-1的蛋白质,这种蛋白质有助于促进细胞的存活和生长。他们发现细胞中的端粒——染色体末端的帽——开始变长,有效地使遗传时钟倒转,使细胞更年轻。到目前为止,研究人员已经在老鼠和猪身上测试了改良的心脏干细胞,并在短短几周内发现了新的心脏组织生长,为未来心力衰竭患者的组织工程打开了大门。

14:27 -新的癫痫基因

在本月的《自然医学》杂志上,爱尔兰皇家外科学院的伊娃·希门尼斯-马特奥斯博士和她的神经科学家团队发现了一个与……

新的癫痫基因

在本月的《自然医学》杂志上,爱尔兰皇家外科医学院的伊娃·希门尼斯-马特奥斯博士和她的神经科学家团队发现了一种与癫痫有关的新基因。与大多数编码蛋白质的基因不同,这种新基因产生一种被称为microRNA-134的小核糖核酸,这种小核糖核酸在大脑中引起癫痫发作的部分的含量要高得多。

然后,研究小组使用一种被称为“安塔戈米”的新型分子从脑细胞中去除这种特殊的microRNA,并发现它可以防止癫痫发作长达一个月。研究人员希望他们的发现有一天能给癫痫患者带来希望,这些患者的病情无法通过药物有效控制。

人卵母细胞(卵细胞)和周围的颗粒细胞

15:08 -成虫产卵

《公共科学图书馆·遗传学》上的一项新研究为生育研究领域的一个有争议的辩论火上加油——哺乳动物雌性,包括女性,是否能产生新的卵子……

成虫产卵

《公共科学图书馆·遗传学》上的一项新研究为生育研究领域的一个有争议的争论火上加油——哺乳动物雌性,包括女性,是否能在出生后产生新的卵细胞。许多研究人员认为,卵细胞只有在女性胎儿在子宫内发育时才会形成,出生后就不会再产生卵子了。

但是,当马萨诸塞州总医院和爱丁堡大学的科学家重新评估了2月份发表在该杂志上的一项小鼠研究的数据时,他们得出了一个令人惊讶的结论,即有证据表明卵细胞在出生后可以分裂。尽管要证明这一点还有很多工作要做,而且尚不清楚这种现象是否也发生在人类身上,但它提出了一种有趣的可能性,即成年女性随着年龄的增长可能能够产生新的卵细胞。

15:52 -发现新的儿童疾病基因

发表在《自然遗传学》杂志上的两项研究揭示了两种罕见但使人衰弱的儿童疾病背后的基因缺陷。

发现新的儿童疾病基因

发表在《自然遗传学》杂志上的两项研究揭示了两种罕见但使人衰弱的儿童疾病背后的基因缺陷。在第一项研究中,美国杜克大学医学中心的研究人员发现了导致儿童交替性偏瘫(AHC)的基因突变。AHC是一种导致身体两侧瘫痪、癫痫发作和学习困难的疾病。

这种情况并不是遗传性的,因此科学家们只能搜索7名AHC患者的基因组,将他们与他们的父母进行比较,直到他们发现了所有7名AHC患者共有的基因缺陷。然后,他们继续证明,在一个名为ATP1A3的基因中,这种突变也存在于全球超过四分之三的AHC患者中。虽然距离治愈还有很长的路要走,但科学家们希望他们的发现能提高人们对这种疾病的认识,并帮助医生做出准确的诊断。

第二个被追踪的基因是利伯先天性黑朦(LCA)的基因,这是一种罕见的失明,发生在婴儿时期。经过近十年的搜寻,由埃里克·皮尔斯(Eric Pierce)领导的马萨诸塞州眼部基因组研究所(Ocular Genomics Institute)的研究小组发现,一种名为NMNAT1的基因的缺陷可能导致这种疾病,从而使已确定的LCA突变总数达到18个。

与之前发现的LCA基因缺陷不同,NMNAT1帮助细胞产生能量。LCA基因缺陷存在于光感应基因中。他们希望这一新发现能为干预铺平道路,以减缓甚至完全预防这些儿童失明的发生。

DNA电泳

17:42 -基因和疾病

测序技术产生影响的一个大领域是我们对基因缺陷和变异的理解,这些缺陷和变异会增加我们患不同疾病的风险。我们经常会看到……

基因与疾病
与卡尔·安德森博士,威康信托桑格研究所

安德森博士:我不太喜欢“基因”这个词,因为我们都有这种基因,这种基因存在于我们的基因组中,用来编码一种蛋白质,这种蛋白质具有某种功能,这种蛋白质的功能对人类的日常生活至关重要。这就是基因存在的原因,这就是蛋白质产生的原因,这就是基因存在的原因。

在某些具有特殊遗传条件的个体中会发生什么,“基因”这个词的来源是,在那个基因中发生了特定的突变正是那些基因中的突变改变了基因的功能。它们会改变蛋白质的功能,改变我们体内蛋白质的丰度,蛋白质的折叠会对蛋白质产生一些微妙的变化从而改变我们的风险。

所以说,这并不是导致乳腺癌的基因。这不是那个基因存在的原因。我们的基因组中不存在导致乳腺癌的基因。它还有一些其他的功能,当基因中有一个特定的突变时,就会增加患乳腺癌的风险,不管这种疾病是什么。

凯特:所以,我们应该开始谈论乳腺癌或心脏病的“突变”,而不是“基因”? ?

安德森医生:正是因为我们都有这种基因,很有可能,如果我们没有这种基因,你就会有很多麻烦。。

凯特:你认为哪一类疾病属于单基因疾病,哪一类疾病属于多因素疾病? ?

安德森医生:所以单基因疾病是像囊性纤维化,亨廷顿氏病。。实际上,当你在学校学习遗传学时,你会学到这些类型的疾病。所以,作为遗传疾病,它们是那些你有系谱图的疾病,你看是妈妈得了这种病还是爸爸得了这种病,有多少孩子得了这种病,你可以看到一个非常清晰的遗传模式。这些是经典的孟德尔疾病,单基因疾病。

更复杂的疾病可能是在人群中频率更高的疾病比如自身免疫性疾病,1型糖尿病,克罗恩病,乳糜泻以及大多数癌症,高血压。不仅仅是疾病,基因还会影响很多人类特征比如身高,体重,整体体型,所有这些人类特征都受到基因的影响。

评估基因对这些特征的重要性是一件很复杂的事情,也是人类遗传学家的工作之一。一旦我们发现基因在这些疾病中扮演着重要的角色,我们的下一个工作就是继续确定那些特定的基因组区域,这些区域看起来是遗传风险的基础。

凯特:那你到底是怎么做到的呢? ?你如何确定基因组的某个区域或者某个特定的基因然后说它与心脏病有关,与精神分裂症有关?

安德森博士:这其实非常简单,所以基本上,我们所做的,就是把一群患有这种疾病的人和一群没有这种疾病的人。那么一堆有多大呢?嗯,这真的取决于你想要找到的基因效应的大小。所以,如果你认为,你正在研究的特定疾病可能会有遗传影响,这是一个相对较小的影响,那么你就需要很多人来做这个实验。

所以在过去的五年左右,我们开始做这个全基因组关联研究,所以,在全基因组关联研究中通常发生的是我们拿3000名患有这种疾病的人与3000名没有这种疾病的人进行比较。我们对它们进行基因分型对整个基因组的不同位置进行基因分型。因此,我们最终在每个人的基因组中都有50万或100万个位点,然后我们只需要看看这些特定的位点,在患有这种疾病的人和没有这种疾病的人之间是否存在差异。

如果我们找到了一个有差异的位点,在参考数据库中我们必须找到基因组的位置,那个特定的位点是什么,这个区域有什么基因,这实际上告诉了他们一些关于这种特殊疾病的信息。

凯特:大概,你不会用铅笔看着这数百万种不同的变化吧。。

安德森医生:没有。

凯特:你是怎么分析这类数据的? ?

安德森博士:所以,我们在桑格所做的科学研究和这些全基因组关联是非常高通量的,从某种意义上说,你得到了成千上万个人的大量基因数据。数据集非常大,所以我们必须使用计算工具在每个地点进行统计测试。然后当我们分析结果的时候,我们必须记住我们进行了多少次测试,以确保很明显,你做了很多测试,所以你发现假阳性的机会是相当高的。所以你需要控制所有这些,所以基本上,我们使用计算机来让我们快速有效地分析所有这些数据。我们用统计方法试图从成千上万的测试中找出剩下的几个有趣的站点。

凯特:你认为这类研究将来会走向何方? ?

安德森博士:我们所能调查的个体基因组数量相对有限。。以前,我们只是对基因组中的特定位点进行基因分型也许是一百万个位点然后利用这一百万个位点在整个基因组中尝试推断整个基因组中发生了什么。现在,随着下一代测序技术的出现,我们几乎可以掌握任何特定个体基因组中的每一个碱基。所以我们对一个人的基因组有了更全面的了解。因此,这确实增加了我们研究的力量。

同时,随着这些技术成本的下降,我们可以开始对成千上万的人进行非常彻底的调查。所以我认为,这将允许我们做的是它将允许我们调查更多的疾病的遗传结构。以前,我们局限于基因变异,这在人群中可能很常见,而现在,我们实际上可以开始调查遗传变异这在人群中可能非常罕见。事实上,我们甚至可以得到那些特定的变异这些变异对任何一个人来说都是独一无二的。

凯特:你认为在不久的将来,当孩子出生的时候,他会被抽血并进行基因组测序吗? ?

安德森博士:我认为这是极有可能的,我认为潜在的医疗效益是相当巨大的,我真的认为我们很快就会实现。

凯特:刚才是来自威康基金会桑格中心的卡尔·安德森。

人类视力两球和儿童视力正常

为什么孩子们都如此不同?

泽格曼博士:所以要理解真正的个性就必须理解你和我是如何形成的。当你父亲的精子和母亲的卵子结合在一起,使你成为一个独立的个体时,它就开始了。精子和卵子是由一种叫做减数分裂的特殊细胞分裂形成的。减数分裂很特别,因为它把二倍体(每条染色体有两个副本)变成单倍体(每条染色体有一个副本)。因此,当细胞经历减数分裂的过程时,你把这46条人类染色体变成一个细胞,每条染色体都有一个副本,现在只有23条染色体。

非常重要的是,减数分裂的过程是随机的。每一个经历减数分裂的细胞都会继承每一条染色体中的一条,但是从母亲还是父亲那里遗传一条是随机的。例如,当你父亲的细胞进行减数分裂产生精子时,你是从他母亲那里遗传2号染色体还是从他父亲那里遗传2号染色体是随机的。现在,你可以看到当卵子和精子融合在一起时,就像你和你的兄弟姐妹一样,你现在看到这是一个随机的染色体集合不仅仅来自你的父母而是随机的染色体集合他们从父母那里遗传了自己。

但它实际上比随机分类要复杂得多。在减数分裂过程中,2号染色体会挨着2号染色体4号染色体挨着4号染色体,以此类推。这个过程对于确保每个单倍体精子或卵子只继承所有不同染色体的一个拷贝是绝对必要的。它不仅对每一条染色体的遗传至关重要,而且还允许一个非常特殊的过程发生,在这个过程中,排列在一起的相似但不相同的染色体现在可以交换DNA片段。这就产生了完全独特的染色体。所以现在你已经交换了一点你父亲从他母亲那里继承的2号染色体和他从他父亲那里继承的2号染色体。最终的结果是2号染色体既不是你父亲的,也不是你祖母的,也不是你祖父的。它完全是独一无二的。它同时继承了一些祖父和祖母的染色体,这就是你的精子遗传给你的染色体。这对精子来说是独一无二的。

立根

28:04 -本月最佳Gene - tribles

我们这个月的基因对正在收听节目的《星际迷航》粉丝来说可能很熟悉——它不是别人,正是特里布尔斯。

本月最佳吉恩-特里布尔斯
与Kat Arney

对于正在收听节目的《星际迷航》(Star Trek)粉丝来说,我们本月的基因可能很熟悉——它不是别人,正是特里布尔斯(tribles)。

2000年,Thomas Seher和Maria Leptin首次发现了这种基因突变,他们发现果蝇体内的细胞无法控制地繁殖,就像《星际迷航》(Star Trek)里那些毛茸茸的小动物一样。从那时起,tribles在包括人类在内的许多其他生物中出现,其中有一个大家族的相关蛋白质有助于控制脂肪酸的产生,胰岛素抵抗,胆固醇水平等。

不出所料,这些Tribbles蛋白中的一些与2型糖尿病和动脉粥样硬化斑块的形成有关。动脉粥样硬化斑块是一种脂肪沉积,可以阻塞血管并导致心脏病发作。在白血病细胞中也发现了异常高水平的Tribbles,这与蛋白质在驱动细胞生长中的其他作用相吻合,尽管我应该指出它不会使癌细胞变得毛茸茸的。

评论

添加注释