研究人员分析了20000个基因组,发现罕见的基因变异可以解释身高是如何遗传的。

如果你观察家庭,不难发现身高是可以遗传的——基于同卵双胞胎和家庭的早期研究证实了这一点。根据这些研究,大约80%的身高差异是由遗传决定的。然而,自从近20年前人类基因组的首次测序开始以来,研究人员一直无法完全确定影响身高的遗传因素。

身高有一定的遗传性,但是研究人员很难找到精确的遗传因素。

在寻找控制身高的基因的过程中,研究人员发现了数百种与身高特征相关的常见遗传变异。然而,这项研究的结果也提出了一个难题:每一个身高变化的影响都可以忽略不计,并且无法达到家庭研究所预测的遗传贡献水平。这种现象被称为“遗传缺陷”,也存在于其他性状和疾病中。因此,一些研究者甚至推测我们对遗传学的理解是否从根本上是错误的。

正如一些研究人员推测的那样,最新的研究发现,大多数身高和体重指数(BMI)的基因缺失可以在一些以前没有发现的罕见基因变异中看到。

伦敦大学国王学院的遗传流行病学家蒂姆·斯佩克特说:“这篇论文让人松了一口气。这至少表明,在我们对遗传学的理解中没有根本性的错误,但它比我们预期的要复杂得多。”该研究于3月25日在bioRxiv预印本服务器[1上发布。

基因组分析

为了找出疾病和性状背后的遗传因素,遗传学家决定采用全基因组关联研究(GWAS)。GWAS通常分析成千上万人,甚至超过一百万人的基因组,并从患有特定疾病的个体的共同基因或可能解释身高等共同特征的基因中筛选出单核苷酸多态性(SNP)。

但是GWAS也有它的局限性。因为对成千上万人的整个基因组进行测序是昂贵的,GWAS只分析了每个人基因组中的一部分单核苷酸多态性,这个数字通常约为50万——相当于60亿个核苷酸的快照。已知的核苷酸是DNA的组成部分,在我们的基因组中是串联的。英国埃克塞特大学的人类遗传学家蒂莫西·弗雷林(Timothy Frayling)说,相反,我们只需要对数百人的基因组进行测序,就能找到这50万种常见变异。

澳大利亚昆士兰脑研究所的彼得·维斯舍尔领导的团队决定研究这种罕见的单核苷酸多态性是否比GWAS常规筛查的单核苷酸多态性更能解释身高和体重指数的基因缺失。为此,他们对21620人的整个基因组进行了测序,也就是说,全部60亿个碱基。(作者拒绝对预印文章发表评论,因为它正处于提交阶段。)

研究小组使用了一个简单而有力的原则,即所有人在某种程度上都是相关的——尽管他们可能相对较远——DNA可以用来计算这种关系的距离。通过这种方式,可以通过结合与人类身高和体重指数相关的信息,找到可能导致这些特征的普通单核苷酸多态性和罕见单核苷酸多态性。

弗雷林解释说,例如,一个家庭中一对三个代表性父母的身高比另一个家庭中一对两个代表性父母的身高更接近:这表明三个代表性父母的身高主要是由遗传决定的,我们可以从身高的相关程度知道遗传的比例。“他们利用所有的遗传信息来分析这种遗传关系在多大程度上源于罕见的单核苷酸多态性,在多大程度上源于普通的单核苷酸多态性。”

这样,研究人员可以捕捉到五分之一甚至五分之一的遗传差异。

基于这些常见和罕见变异的信息,研究人员最终估计遗传力与之前双胞胎研究的结果大致相同。维斯切尔和他的同事估计,遗传因素在身高方面占79%,在体重指数方面占40%。也就是说,如果分析一大群人的身高,79%的差异来自遗传差异,而不是营养等环境因素的差异。

复杂且难以理解

研究人员还提出了以前未发现的变异可能如何影响身体特征。哈佛大学进化生物学家特伦斯·卡佩里尼(Terence Capellini)指出,迄今为止,研究人员发现这些罕见的突变更多地分布在基因组的蛋白质编码区,更有可能对这些区域造成破坏。这表明,罕见的变异可能通过影响蛋白质编码区而不是基因组的其他区域来影响高度——基因组的大多数区域不产生蛋白质,但可能影响蛋白质表达。

这些突变如此罕见,以至于它们可能会被自然选择所消除——也许是因为它们在某些方面是有害的。

考虑到遗传的复杂性,破解常见疾病的根本原因将需要更多的时间和金钱,甚至需要对数十万甚至数百万个完整的基因组进行测序,以便找到能够解释大多数疾病遗传因素的罕见变异——如果研究人员想要开发这些疾病的有效疗法,他们必须这样做。

斯佩克特说,这项研究只揭示了对共同特征有影响的罕见突变的总数,没有具体说明哪些突变更重要。他说:“下一步是找到对性状或疾病很重要的罕见突变。”