兰博加快对庞大DNA数据库的搜索
休斯顿——(2021 年 6 月 28 日)——莱斯大学的计算机科学家正在派遣 RAMBO 来拯救基因组研究人员,他们有时需要等待数天或数周才能从庞大的 DNA 数据库中获取搜索结果。
DNA 测序如此流行,基因组数据集的规模每两年翻一番,而搜索数据的工具却没有跟上步伐。跨基因组比较 DNA 或研究诸如导致 的病毒等生物体进化的研究人员通常要等待数周才能让软件索引大型“宏基因组”数据库,这些数据库每月都在变大,现在以 PB 为单位。
RAMBO 是“重复合并布隆过滤器”的缩写,是一种新方法,可以将此类数据库的索引时间从数周缩短至数小时,将搜索时间从数小时缩短至数秒。莱斯大学的计算机科学家上周在计算机协会数据科学会议 SIGMOD 2021 上介绍了 RAMBO。
“使用传统方法在大型数据库中查询数百万个 DNA 序列在大型计算集群上可能需要几个小时,而在单个服务器上可能需要几周时间,”兰博的共同创建者托德·特伦根说,他是赖斯的计算机科学家,其实验室专门研究宏基因组学.“除了查询时间外,减少数据库索引时间也至关重要,因为基因组数据库的规模正以惊人的速度持续增长。”
为了解决这个问题,Treangen 与莱斯大学计算机科学家 Anshumali Shrivastava 以及同行评审会议的共同主要作者 Gaurav Gupta 和 Minghao Yan 合作,后者擅长创建使大数据和机器学习更快、更可扩展的算法。兰博上的纸。
RAMBO 使用的数据结构比最先进的基因组索引方法具有明显更快的查询时间以及其他优点,例如易于并行化、零假阴性率和低假阳性率。
“RAMBO 的搜索时间比现有方法快 35 倍,”电气和计算机工程博士生 Gupta 说。在使用 170 TB 微生物基因组数据集的实验中,Gupta 表示,兰博将索引时间从“在复杂的专用集群上的六周缩短到在共享商品集群上的九个小时”。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
6月25-28日,由中国进出境生物安全研究会、中国国际旅行卫生保健协会主办,中国青年创业就业基金会支持,中国出入...浏览全文>>
-
胃肠镜检查,听起来可能有些令人不安,但实际上,它可能是生活中的救命稻草。对于一些人来说,定期进行胃肠镜...浏览全文>>
-
6月16日-20日,2025年优秀博士后研究人员(绍兴)研学活动顺利举行。本次活动汇聚了来自全国各地的百余名博士后,...浏览全文>>
-
近日,天津松果生物医疗科技有限公司自主研发的牛跟腱来源去端肽I型胶原蛋白原材料成功通过国家药品监督管理局...浏览全文>>
-
在数字化产业转型的浪潮奔涌之际,病理学正经历着前所未有的革新机遇。奥伟登(Evident)凭借百年光学技术积淀,以...浏览全文>>
-
6月6-8日,CHINAGUT 2025中国肠道大会在宁波国际会议中心隆重举办。大会由南京医科大学第二附属医院、国家消化...浏览全文>>
-
在第28届北京国际口腔展这一行业风向标级盛会上,北京易岭生物科技有限公司(下面简称易岭生物)凭借重磅新品发...浏览全文>>
-
2025款上汽大众ID 4 X在安徽阜阳地区的售价会根据配置和选装包有所不同。基础版车型的厂商指导价大约在20万...浏览全文>>
-
岚图FREE,作为一款集豪华与智能于一体的新能源SUV,正以全新的姿态迎接每一位渴望高品质出行的用户。现在,岚...浏览全文>>
-
安徽阜阳的大众ARTEON 2022新款现已到店,最低售价从34 80万元起,无疑是近期购车的最佳时机。这款车型以其...浏览全文>>