保护你的基因组安全

对你的基因进行测序可能意味着更好的治疗,但是一旦你的基因组被测序了会发生什么呢?它是如何存储的?
8月18日

采访

桑格研究所的安娜·米德尔顿和盖伊·科茨

分享

对你的基因进行测序可能意味着更好的诊断,甚至是更好的治疗桑格研究所的数据室你的基因组被测序后会发生什么?所有这些数据都去了哪里,又是如何存储的?最重要的是,它安全吗?回到桑格研究所,格雷哈·杰克逊与安娜·米德尔顿博士和盖伊·科茨博士进行了交谈,后者是负责保护该研究所数千个基因测序的人员之一。

Graihagh -我们现在在数据存储室的中间。我们被空调、各种闪光灯和色彩鲜艳的电缆包围着。这个房间的功能是什么?

盖伊:我们所做的科学研究都是关于大数据的。我们想做的是对许多不同人的许多不同基因组进行测序,然后进行分析。为了做到这一点,我们需要大量的存储空间。

grahagh -我们在这里讨论的是多少数据?

盖伊:我们存储了大约20pb的数据。所以,如果你想想你笔记本电脑里的硬盘大约是1tb, 1pb就是1000tb。所以,我们大概持有的数据量是你家里机器上数据量的2万倍。

Graihagh -这意味着什么?

盖伊:典型的基因组大概有3gb,所以有成千上万个基因组。

Graihagh -你是怎么保证安全的?

盖伊:桑格研究所实际上有一个非常开放的数据政策。因此,这里产生的大部分测序数据都可以在互联网上提供给其他研究人员下载。

Graihagh -这是否意味着任何人都可以访问并确定某人的序列或基因组?

盖伊-原则上,如果数据已经被同意发布,那么是的。任何人都可以访问我们的网站,下载尽可能多的数据。我们确实有一些数据搜索,涉及到机密的患者信息,研究人员想要获得这些数据,必须向伦理审查委员会提交建议,由他们来决定。

Graihagh -有没有发生过数据意外泄露或被黑客入侵的事件?

盖伊-不是我们的。曾经发生过这样的事情,人们把看似匿名的数据与第三方数据集结合起来。其中一个经典的例子是一项研究,在美国,有人能够获取基因信息,甚至不是完整的基因组扫描,然后在某些情况下将其与姓氏联系起来。现在,这还不是完全的重新鉴定,但它显示了我们对基因数据有多小心。

格雷哈——那么,如果你的基因可以追溯到你的家族,那么外界对你有什么了解呢?安娜·米德尔顿博士,桑格研究所的高级科学家和基因伦理专家……

安娜:所以,你可以通过基因的变化来判断一个人的过去、现在和未来,从他们长第一颗牙的年龄,到他们是否有高胆固醇的倾向,再到他们患癌症的几率和平均几率是否更高。所以,这是一系列不同的东西。

Graihagh -这听起来像是一个永无止境的可能性列表。

安娜:是的。实际上,我们身上的每件事都有一些与基因有关的途径。所以,基因和环境一起决定了我们是谁。

Graihagh -你可以潜在地收集到很多关于某人的信息。那是怎么匿名的呢?

安娜:就识别一个人而言,这实际上是非常困难的。如果你对某人进行测序你有他们原始的A, c, t和g,这些组成序列的位。你不能看着那个然后说,“哦,我刚从那个认出了那个人。”你不能这么做。你需要一种解释它的方法。如果这个人在网上有其他东西可以识别他们,比如他们的照片,比如一个特定条件的链接,理论上,你可以把它们全部匹配起来,但这将是一个相当复杂的过程。所以,我们所做的就是尽可能安全地获取校园里的数据。我们使用与银行相同的系统来保护可识别数据,我们只是尽可能地谨慎。

Graihagh -你的基因组现在可能是安全的,不会被窥探,但如果你同意别人看一个特定的基因,而他们不小心看到了另一个,危及生命但可以治愈的基因,会发生什么?

安娜:在研究环境中,如果发现了偶然的发现,没有义务分享这些发现。现在,这实际上与临床环境有很大不同。所以,如果你拍了一张肺部的x光片,然后发现了一处意外的肋骨骨折,那么你就会期望医生检查并分享这个情况。预计基因组学领域也会出现同样的情况。如果你真的看到了意想不到的意外,那么就会有分享的期望,特别是如果它非常严重,可能危及生命,而且是可起诉的。所以,如果我们找到了与严重疾病相关的基因,如果你对此无能为力,那知道这些又有什么意义呢?

grahagh -所以,如果是不治之症,这是不会告诉病人的。

安娜:举个例子,如果你观察一个两岁的患有严重发育障碍的孩子,你就会试图找到这种发育障碍背后的基因。所以,研究阿尔茨海默氏症的基因有多大帮助呢?这些基因直到孩子成年后才与之相关。

grahagh -如果你在看基因测序,这是否只是基因存在的情况,这意味着你患有阿尔茨海默病?

安娜:所以,我们拥有的绝大多数基因都能在一定程度上预测未来,但很难做到精确。所以,当你在研究环境中,甚至在临床环境中,发现一些偶然的发现时,如果没有临床数据的支持,很难真正解释它们。

Graihagh:在这种情况下,世界上有没有一种标准的政策可供人们参考和遵循?

安娜:一般来说,如果我们放眼世界,看看人们在做什么,我会说在英国和欧洲,我们对偶然发现更保守,我们会说,“好吧,你可以从一个完整的序列中得到的信息是巨大的,你知道,你可以看到和分享什么。”仅仅是与严重可诉条件有关的信息吗?关于怀孕或携带者检测的信息呢?对药物的反应如何?所有这些不同的基因都在这些不同的事情中发挥作用。目前,我们说,实际上很难管理所有这些。我们要做的就是专注于回答临床问题。所以,如果有人得了乳腺癌,我们真的只会看一下乳腺癌基因,找出什么样的化疗对他们最有帮助,并试图支持他们的癌症。让我们不要去想这些其他的信息也许要等到下次约会。这与美国目前的情况非常不同。 There, they're recommending every time a sequence is done to automatically look for 24 cancer and cardiac conditions at the same time every time a sequence is done. So, they're using that opportunity to do a screen of other things at the same time and that gives a very strong public health message. So, it's just a different kind of approach. So, we're more conservative here. it may well be we go to the American position at some point, but we just don't quite feel ready yet.

Graihagh -我们什么时候能够看到这种对你的基因组序列的大规模访问?

安娜:十万人基因组计划已经开始了。所以,这是一项庞大的政府计划,要对国民保健服务中的10万人进行排序,所以它不是对每个人都可用。但政府确实做出了巨大的承诺,建立基础设施,以支持大规模测序。

评论

添加注释