基因搜索:个性化医疗领域必将诞生谷歌

简介:
导读

建立DNA搜索引擎的竞赛---基因组搜索公司争相成为个性化医疗的谷歌!

0?wx_fmt=jpeg

自2005年,二代测序开始改变遗传学领域的研究。获得个人的全基因组测序变得快速且相对廉价。遗传信息数据库正在以TB字节的速度增长,医生和研究人员迫切需要一种有效的信息筛选方法,以寻找某种异常的原因或者为评估患者对治疗措施的反应提供线索。


在过去的五年,研发DNA搜索引擎的公司如雨后春笋般涌现,争相成为研发DNA搜索引擎的第一人。他们都有不同的战术——有些甚至拥有自己私有的遗传信息数据库,但是大多数正致力于链接足够多的遗传数据库,以便用户可以快速识别大量的各种各样的突变。大多数公司也研究应用生物学文献补充遗传学信息的搜索算法。但在早期网络的日子里,在谷歌称雄之前,没有哪个公司成为明显的赢家。


创造一个有效的搜索引擎是典型的大数据问题, ViaGenetics公司的副总裁迈克尔·冈萨雷斯说,预计本月将重启他们的搜索平台。在医生或研究人员可以使用数据之前,基因组数据必须按照可读取和可搜索的模式来组织。迈向目标的第一步是,按照一种称之为“变体识别格式”或“VCF”的标准格式存储,一个人的完整基因组测序数据约100千兆字节,直接采用原始的数据格式入库,即使每天只有10个病人的基因组数据,数据库也会很快失控。但VCF文件更紧凑,每个基因只有几百兆字节,有助于研究人员在更短的时间内搜索到他们想要找的特定变异。与全基因组测序不同,VCF文件只给出一个人的基因数据在哪里偏离了2001年的人类基因组计划最初编制的基因组标准。


有了VCF, 从基因组数据中筛选出精准的突变基因不是搜索引擎公司面临的挑战。大多数这类公司都集中资源致力于无缝编译从其他网络数据库中补充特定的突变信息,如生物医学研究档案PubMed或各种搜集来的电子医疗记录。许多这些工具都用精细的算法来优化结果的可信度和相关性。“你希望能够将某个位点的突变信息汇集到一起,并迅速作出评估,” 总部位于犹他州的另一家研发基因--搜索引擎的公司Tute Genomics的首席科学官David Mittelman说。


为了拓展信息关联到一个尚无定论的基因组,位于佛罗里达州迈阿密海滩的ViaGenetics公司,正在更新他们提供给想进行跨机构协作的研究人员使用的信息平台。“有了ViaGenetics的工具,研究人员可以将他们的数据提供给其他用户,其他用户可以看到这些项目,请求访问,并形成合作,”冈萨雷斯说,“它帮助人们在不同的研究人员和机构间建立连接点。这对于没有很广泛的基因组数据库的小型实验室或致力于解码相同的突变的不同大学的研究人员都特别有用。


尽管基因组—搜索行业现在专注于服务科学家,但并会不一直如此。Mittelman设想TuteGenomics公司最终可能直接服务于消费者。Mittelman说,人们已经要求了解他们的基因组信息,只是为了能更好的了解自己,但大多数公司还不认为普通人是他们的主要客户。为了实现这样的转变,搜素工具将会更加直观和友好。“使用不容易解释的数据或不标准术语的搜索工具存在让人们困惑的可能。”他说。隐私也是普通用户主要关心的一个方面,Tute用户上传的信息并不是永久保存的,Mittelman说,但是如果平台提供给大众群体使用,就需要有其他的保证。


另外,行业也在向纵深发展,ViaGenetics和Tute都希望能够自己运营整个过程,从最初的DNA测序到展示给用户最终可搜索的结果。 “目前分析和解释基因组数据的市场很分散,就像计算机行业在1990年代一样,当时你不得不去找单独的供应商购买显卡或主板,然后试着把它组装在一起,“Mittelman说。“很快这个领域将会整合,就象计算机行业曾经的那样。



原文发布时间为:2015-07-09

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
8月前
|
人工智能 自动驾驶 安全
破壁人AI百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。 内卷背后也有人感慨,互联网到了尽头。支撑这一论述的是,移动互联网的人口红利已经消失,几款国民型APP用户增长都固定在了10亿这个级别,只能依靠自然人口的增长和迁移。“内卷论”与“尽头论”的流行,让我们看到,中国科技产业尤其是互联网,需要自己的“破壁人”计划,突破封锁,尤其是跳出原有的路径依赖。我们不应该只是一味的看到消费互联网的互联网产业,却不见更为广阔的产业互联网未来。
|
人工智能 自然语言处理 自动驾驶
破壁人 AI 百度:科技公司反内卷的典型样本
互联网整个行业都在陷入被动且尴尬的局面。去年开始流行的“内卷”一词,恰如其分的描述了互联网的现状,比如抖音开始做外卖,微信强推视频号,一直硝烟弥漫的电商市场,更是激战在社区团购上。
破壁人 AI 百度:科技公司反内卷的典型样本
|
8天前
|
NoSQL Cloud Native Redis
Redis核心开发者的新征程:阿里云与Valkey社区的技术融合与创新
阿里云瑶池数据库团队后续将持续参与Valkey社区,如过往在Redis社区一样耕耘,为开源社区作出持续贡献。
Redis核心开发者的新征程:阿里云与Valkey社区的技术融合与创新
|
8天前
|
关系型数据库 分布式数据库 数据库
PolarDB闪电助攻,《香肠派对》百亿好友关系实现毫秒级查询
PolarDB分布式版助力《香肠派对》实现百亿好友关系20万QPS的毫秒级查询。
PolarDB闪电助攻,《香肠派对》百亿好友关系实现毫秒级查询
|
9天前
|
消息中间件 Cloud Native Serverless
RocketMQ 事件驱动:云时代的事件驱动有啥不同?
本文深入探讨了云时代 EDA 的新内涵及它在云时代再次流行的主要驱动力,包括技术驱动力和商业驱动力,随后重点介绍了 RocketMQ 5.0 推出的子产品 EventBridge,并通过几个云时代事件驱动的典型案例,进一步叙述了云时代事件驱动的常见场景和最佳实践。
115106 2
|
10天前
|
弹性计算 安全 API
访问控制(RAM)|云上安全使用AccessKey的最佳实践
集中管控AK/SK的生命周期,可以极大降低AK/SK管理和使用成本,同时通过加密和轮转的方式,保证AK/SK的安全使用,本次分享为您介绍产品原理,以及具体的使用步骤。
101873 3
|
6天前
|
物联网 PyTorch 测试技术
手把手教你捏一个自己的Agent
Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用,用于方便地创建针对各种现实应用量身定制智能体,目前已经在生产级别落地。
|
9天前
|
自然语言处理 Cloud Native Serverless
通义灵码牵手阿里云函数计算 FC ,打造智能编码新体验
近日,通义灵码正式进驻函数计算 FC WebIDE,让使用函数计算产品的开发者在其熟悉的云端集成开发环境中,无需再次登录即可使用通义灵码的智能编程能力,实现开发效率与代码质量的双重提升。
95446 3
|
2天前
|
机器人 Linux API
基于Ollama+AnythingLLM轻松打造本地大模型知识库
Ollama是开源工具,简化了在本地运行大型语言模型(ile优化模型运行,支持GPU使用和热加载。它轻量、易用,可在Mac和Linux上通过Docker快速部署。AnythingLLM是Mintplex Labs的文档聊天机器人,支持多用户、多种文档格式,提供对话和查询模式,内置向量数据库,可高效管理大模型和文档。它也是开源的,能与Ollama结合使用,提供安全、低成本的LLM体验。这两款工具旨在促进本地高效利用和管理LLMs。
37574 19
|
1天前
|
人工智能 自然语言处理 API
Claude3是什么?
Claude 3最近备受各大媒体瞩目,成为了AI领域备受关注的新宠。在ChatGPT推出更高版本之前,Claude 3已经被公认为是语言类AI工具中的佼佼者,特别在处理逻辑性和长篇上下文方面表现突出。然而,与此同时,Claude 3的注册流程也备受诟病,被认为是所有AI工具中最为复杂的之一。 这篇内容教大家 注册Claude 3 以及升级 教程。
13674 1
Claude3是什么?