该组织的首批示范项目之一是一个简单的搜索引擎。使用这个引擎,存储在九个地方的数千个人类基因组DNA字母可以被分类出来,包括谷歌的服务器场和英国的莱斯特大学。根据该组织(包括人类基因组计划的核心成员)的介绍,搜索引擎是DNA网络的开关,最终将数百万个基因连接在一起。

正在开发的技术称为应用程序接口(API),它可以实现不同基因数据库之间的通信。收集信息可以加快发现的速度,这包括将被怀疑有基因突变的儿童与其他被诊断有基因突变的儿童进行匹配,以确定哪些基因可以,并帮助医生诊断罕见的先天性缺陷。

两年前在纽约举行的一次会议上,50名科学家提出了建立联盟的想法,因为他们担心基因组数据会被锁定在一个特殊的数据库中,受与患者的合法许可协议的约束,受隐私规则的限制,或者受希望继续其科学研究工作的科学家的控制。该联盟将自己定位为一个遵循万维网联盟(W3C)监管网络标准的组织。

该组织的领导人之一、加州大学圣克鲁斯分校基因组研究所的科学主任大卫·豪斯勒说:“这创造了一种交换基因信息的网络语言。”。

该组织去年推出了该软件,希望任何科学家都可以在不触及技术壁垒或隐私规则的情况下,就其他实验室拥有的基因组数据提问,其中大部分尚未实现。

研究人员认为,当基因组解码的成本降低时(从以前的大约1万美元降低到现在的2000美元),他们还没有准备好的大量数据就会产生。为此;他们必须采取行动。美国医院的大多数电子系统都被分成小块,系统之间没有通信。他们担心和这些美国医院一样的结果。

基因组数据的分离方式已经成为一个问题,因为遗传学家需要更大的群体基础。他们将利用100,000名志愿者的DNA信息来找出与精神分裂症、糖尿病和其他常见疾病相关的基因。然而,即使是100,000个数据也不足以获得这些发现。“你将需要数百万个基因组,”剑桥伯德研究所副主任、新组织主席大卫·奥尔特舒勒说。

世界基因组和健康联盟认为答案在于互联网。该网络将开放多个数据库,供其他科学家进行有限的数据搜索。哈佛医学院的遗传学家海蒂·雷姆(Heidi Rehm)认为,基于这一理念,该联盟正致力于将全球最大的乳腺癌致癌基因BRCA1和BRCA2信息数据库中的多个数据库以及目前独立的9个数据库(包含导致罕见儿童疾病的遗传数据)连接起来。

去年3月,该组织发起了一项测试,看看科学组织是否愿意分享数据。一项名为“信标”的成就允许数据库所有者打开数据库进行极其严格的搜索。

“我们不会发明一项技术壮举;我们需要做的是解决人们不愿意共享数据的问题,”马克·菲乌姆说,他是多伦多大学计算机科学系的研究生,参与了界面构建工作。"这将使你能够在不获取或侵犯患者隐私的情况下进行搜索. "

到目前为止,有15个数据库与信标兼容,菲乌姆说,已经取得了一些成就。其中三个数据库存储谷歌备份的公共基因组,而另一个属于波士顿一家名为Curove的软件公司。

豪斯勒认为未来的协议将逐渐提供对更多数据的访问,但是是以可控的方式。科学家需要注册,甚至签署法律协议。“如果‘这能给我整个基因组’,你需要为此签一份合同,”他说。

联盟正在实施的变革之一是新所有者的同意。该文件规定了志愿者在提交基因组时拥有的权利。新的同意书比大多数同意书更广泛,允许“来自世界各地的研究人员”进行“控制下的访问”同意书需要承诺研究人员不会识别参与者,尽管这种DNA是特殊的和成比例的指纹,但这并不能保证研究人员会识别参与者。

像W3C一样,世界基因组与健康组织也有一个“赞助商”来支付费用。根据奥尔特舒勒的介绍,到目前为止,这些单位包括贝尔德研究所、英国韦尔科姆基金会桑格研究所和安大略癌症研究所,但奥尔特舒勒拒绝透露每个单位的资助金额。

非盈利组织赛吉生物网络研究所的首席文职官员约翰·威尔班克斯正在与该财团合作,他是W3C的前成员。他认为联盟的任务比W3C的更难。“在万维网联盟成立之前,互联网已经存在了很长时间。这是一个很大的不同,”他说。“网络需要发展。万维网联盟是为了管理网络而创建的,并不是说联盟创建了网络。”