fbpx
维基百科

GenBank

基因銀行GenBank)是一个开放获取序列数据库英语sequence database,对所有公开可利用的核苷酸序列与其翻译的蛋白质进行收集并注释。

GenBank
内容
有機體所有
相關信息
研究中心NCBI
发布日期1982年
访问入口
数据格式
网站NCBI
下載地址ncbi ftp
網絡服務地址
  • eutils
  • soap
工具
WebBLAST
StandaloneBLAST
其他
许可Public domain-US Government

此数据库是国际协作核酸序列数据库英语International Nucleotide Sequence Database Collaboration(INSDC)的一部分,由美国国家生物技术信息中心(NCBI)主管,NCBI为美国国立卫生研究院的下属机构。GenBank和它的合作者从全球各个实验室接收了超过百万种生物的数据。

成立三十年来,GenBank数据库成为了最重要的也是最有影响力的生物全领域数据库,其数据正被全球数以百万计的研究人员获取与引用。GenBank中的数据量正以每18个月翻一番的速度持续指數增長[1][2],在2013年2月的版本194中,數據庫包含有1.62億個序列,含有1500億個核苷酸堿基。[3]

历史 编辑

1979年,洛斯阿拉莫斯国家实验室(LANL)理论生物学和生物物理学小组 (页面存档备份,存于互联网档案馆)的Walter Goad英语Walter Goad等人建立了洛斯阿拉莫斯序列数据库,最终成为了公共的 GenBank数据库的前身[4]。1982年,由美国国立卫生研究院、美国国家科学基金会、美国能源部和国防部共同出资,LANL与BBN科技公司合作,成立了GenBank。到1983年底,已有超过2,000个序列被存储在GenBank。

在20世纪80年代中期,斯坦福大学的Intelligenetics bioinformatics公司与LANL合作经营着GenBank项目[5]。作为最早的互联网生物信息学社区项目,GenBank计划为生物学家打造一个开放获取BIOSCI英语BIOSCI/Bionet消息社群。1989到1992年,GenBank被转移到新成立的美国国家生物技术信息中心[6]

 
Genbank和EMBL在1986/1987年出版的《核苷酸序列》I到VII卷
 
Genbank v100版本的CDRom

发展 编辑

在GenBank的版本162.0(2007年8月)的发行说明中道出:“从1982年到现在,GenBank中的碱基数每隔18个月翻一番。”[7]

截至2013年7月8日 (2013-07-08),GenBank的版本196.0已有165,740,164个基因座,152,599,230,112个碱基,165,740,164个报导序列[3]。 GenBank数据库还包括一些额外的数据集,不包括在这个统计内。

 
GenBank中碱基对数目的增长,1982到2007,半对数图英语Semi-log plot
GenBank中碱基数前二十的物种(版本 191)[8]
物种 碱基对
智人 Homo sapiens 1.6310774187×10^10
小家鼠 Mus musculus 9.974977889×10^9
褐鼠 Rattus norvegicus 6.521253272×10^9
家牛 Bos taurus 5.386258455×10^9
玉米 Zea mays 5.062731057×10^9
野豬 Sus scrofa 4.88786186×10^9
斑馬魚 Danio rerio 3.120857462×10^9
紫色球海胆英语Strongylocentrotus purpuratus Strongylocentrotus purpuratus 1.435236534×10^9
普通獼猴 Macaca mulatta 1.256203101×10^9
水稻 Oryza sativa Japonica Group 1.255686573×10^9
红花烟草 Nicotiana tabacum 1.197357811×10^9
非洲爪蟾 Xenopus (Silurana) tropicalis 1.249938611×10^9
黑腹果蝇 Drosophila melanogaster 1.11996522×10^9
黑猩猩 Pan troglodytes 1.008323292×10^9
拟南芥 Arabidopsis thaliana 1.144226616×10^9
家犬 Canis lupus familiaris 951,238,343
酿酒葡萄 Vitis vinifera 999,010,073
原雞 Gallus gallus 899,631,338
大豆 Glycine max 906,638,854
普通小麦 Triticum aestivum 898,689,329

另见 编辑

参考文献 编辑

  1. ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. GenBank. Nucleic Acids Research. 2008, 36 (Database): D25–D30. PMC 2238942 . PMID 18073190. doi:10.1093/nar/gkm929. 
  2. ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. GenBank. Nucleic Acids Research. 2009, 37 (Database): D26–D31. PMC 2686462 . PMID 18940867. doi:10.1093/nar/gkn723. 
  3. ^ 3.0 3.1 GenBank release notes. NCBI. [2013-12-02]. (原始内容于2016-12-22). 
  4. ^ Hanson, Todd. Walter Goad, GenBank founder, dies. Newsbulletin: obituary. Los Alamos National Laboratory. 2000-11-21 [2013-12-02]. (原始内容于2008-11-07). 
  5. ^ LANL GenBank History. [2013-12-02]. (原始内容于2016-03-03). 
  6. ^ Benton D. Recent changes in the GenBank On-line Service. Nucleic Acids Research. 1990, 18 (6): 1517–1520. PMC 330520 . PMID 2326192. doi:10.1093/nar/18.6.1517. 
  7. ^ Dennis A. Benson, Mark Cavanaugh, Karen Clark, Ilene Karsch-Mizrachi, David J. Lipman, James Ostell, Eric W. Sayers. GenBank. Nucleic Acids Research. 2013-1, 41 (Database issue): D36–42 [2019-02-12]. ISSN 1362-4962. PMC 3531190 . PMID 23193287. doi:10.1093/nar/gks1195. (原始内容于2020-05-14). 
  8. ^ Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Sayers EW. GenBank. Nucleic Acids Res. January 2011, 39 (Database issue): D32–37. PMC 3013681 . PMID 21071399. doi:10.1093/nar/gkq1079. 


外部链接 编辑

  • GenBank (页面存档备份,存于互联网档案馆
  • Example sequence record, for hemoglobin beta
  • BankIt (页面存档备份,存于互联网档案馆
  • Sequin (页面存档备份,存于互联网档案馆) — a stand-alone software tool developed by the NCBI for submitting and updating entries to the GenBank sequence database.
  • EMBOSS (页面存档备份,存于互联网档案馆) — free, open source software for molecular biology
  • GenBank, RefSeq, TPA and UniProt: What's in a Name?(页面存档备份,存于互联网档案馆
  • GenBank File-Format Converter (页面存档备份,存于互联网档案馆

genbank, 基因銀行, 是一个开放获取的序列数据库, 英语, sequence, database, 对所有公开可利用的核苷酸序列与其翻译的蛋白质进行收集并注释, 内容有機體所有相關信息研究中心ncbi发布日期1982年访问入口数据格式xml, genbank, format网站ncbi下載地址ncbi, ftp網絡服務地址eutilssoap工具webblaststandaloneblast其他许可public, domain, government此数据库是国际协作核酸序列数据库, 英语, interna. 基因銀行 GenBank 是一个开放获取的序列数据库 英语 sequence database 对所有公开可利用的核苷酸序列与其翻译的蛋白质进行收集并注释 GenBank内容有機體所有相關信息研究中心NCBI发布日期1982年访问入口数据格式XML ASN 1 Genbank format网站NCBI下載地址ncbi ftp網絡服務地址eutilssoap工具WebBLASTStandaloneBLAST其他许可Public domain US Government此数据库是国际协作核酸序列数据库 英语 International Nucleotide Sequence Database Collaboration INSDC 的一部分 由美国国家生物技术信息中心 NCBI 主管 NCBI为美国国立卫生研究院的下属机构 GenBank和它的合作者从全球各个实验室接收了超过百万种生物的数据 成立三十年来 GenBank数据库成为了最重要的也是最有影响力的生物全领域数据库 其数据正被全球数以百万计的研究人员获取与引用 GenBank中的数据量正以每18个月翻一番的速度持续指數增長 1 2 在2013年2月的版本194中 數據庫包含有1 62億個序列 含有1500億個核苷酸堿基 3 目录 1 历史 2 发展 3 另见 4 参考文献 5 外部链接历史 编辑1979年 洛斯阿拉莫斯国家实验室 LANL 理论生物学和生物物理学小组 页面存档备份 存于互联网档案馆 的Walter Goad 英语 Walter Goad 等人建立了洛斯阿拉莫斯序列数据库 最终成为了公共的 GenBank数据库的前身 4 1982年 由美国国立卫生研究院 美国国家科学基金会 美国能源部和国防部共同出资 LANL与BBN科技公司合作 成立了GenBank 到1983年底 已有超过2 000个序列被存储在GenBank 在20世纪80年代中期 斯坦福大学的Intelligenetics bioinformatics公司与LANL合作经营着GenBank项目 5 作为最早的互联网生物信息学社区项目 GenBank计划为生物学家打造一个开放获取的BIOSCI 英语 BIOSCI Bionet消息社群 1989到1992年 GenBank被转移到新成立的美国国家生物技术信息中心 6 nbsp Genbank和EMBL在1986 1987年出版的 核苷酸序列 I到VII卷 nbsp Genbank v100版本的CDRom发展 编辑在GenBank的版本162 0 2007年8月 的发行说明中道出 从1982年到现在 GenBank中的碱基数每隔18个月翻一番 7 截至2013年7月8日 2013 07 08 update GenBank的版本196 0已有165 740 164个基因座 152 599 230 112个碱基 165 740 164个报导序列 3 GenBank数据库还包括一些额外的数据集 不包括在这个统计内 nbsp GenBank中碱基对数目的增长 1982到2007 半对数图 英语 Semi log plot GenBank中碱基数前二十的物种 版本 191 8 物种 碱基对智人 Homo sapiens 1 6310774187 10 10小家鼠 Mus musculus 9 974977889 10 9褐鼠 Rattus norvegicus 6 521253272 10 9家牛 Bos taurus 5 386258455 10 9玉米 Zea mays 5 062731057 10 9野豬 Sus scrofa 4 88786186 10 9斑馬魚 Danio rerio 3 120857462 10 9紫色球海胆 英语 Strongylocentrotus purpuratus Strongylocentrotus purpuratus 1 435236534 10 9普通獼猴 Macaca mulatta 1 256203101 10 9水稻 Oryza sativa Japonica Group 1 255686573 10 9红花烟草 Nicotiana tabacum 1 197357811 10 9非洲爪蟾 Xenopus Silurana tropicalis 1 249938611 10 9黑腹果蝇 Drosophila melanogaster 1 11996522 10 9黑猩猩 Pan troglodytes 1 008323292 10 9拟南芥 Arabidopsis thaliana 1 144226616 10 9家犬 Canis lupus familiaris 951 238 343酿酒葡萄 Vitis vinifera 999 010 073原雞 Gallus gallus 899 631 338大豆 Glycine max 906 638 854普通小麦 Triticum aestivum 898 689 329另见 编辑Ensembl Human Protein Reference Database HPRD 序列分析 UniProt 已测序真核生物基因组列表 已测序古菌基因组列表 RefSeq the Reference Sequence Database Geneious includes a GenBank Submission Tool参考文献 编辑 Benson D Karsch Mizrachi I Lipman D J Ostell J Wheeler D L et al GenBank Nucleic Acids Research 2008 36 Database D25 D30 PMC 2238942 nbsp PMID 18073190 doi 10 1093 nar gkm929 引文格式1维护 显式使用等标签 link Benson D Karsch Mizrachi I Lipman D J Ostell J Sayers E W et al GenBank Nucleic Acids Research 2009 37 Database D26 D31 PMC 2686462 nbsp PMID 18940867 doi 10 1093 nar gkn723 引文格式1维护 显式使用等标签 link 3 0 3 1 GenBank release notes NCBI 2013 12 02 原始内容存档于2016 12 22 Hanson Todd Walter Goad GenBank founder dies Newsbulletin obituary Los Alamos National Laboratory 2000 11 21 2013 12 02 原始内容存档于2008 11 07 LANL GenBank History 2013 12 02 原始内容存档于2016 03 03 Benton D Recent changes in the GenBank On line Service Nucleic Acids Research 1990 18 6 1517 1520 PMC 330520 nbsp PMID 2326192 doi 10 1093 nar 18 6 1517 Dennis A Benson Mark Cavanaugh Karen Clark Ilene Karsch Mizrachi David J Lipman James Ostell Eric W Sayers GenBank Nucleic Acids Research 2013 1 41 Database issue D36 42 2019 02 12 ISSN 1362 4962 PMC 3531190 nbsp PMID 23193287 doi 10 1093 nar gks1195 原始内容存档于2020 05 14 请检查 date 中的日期值 帮助 引文格式1维护 PMC格式 link Benson DA Karsch Mizrachi I Lipman DJ Ostell J Sayers EW GenBank Nucleic Acids Res January 2011 39 Database issue D32 37 PMC 3013681 nbsp PMID 21071399 doi 10 1093 nar gkq1079 nbsp 本条目引用的公有领域材料来自美国国家生物技术信息中心的文档 NCBI Handbook 外部链接 编辑GenBank 页面存档备份 存于互联网档案馆 Example sequence record for hemoglobin beta BankIt 页面存档备份 存于互联网档案馆 Sequin 页面存档备份 存于互联网档案馆 a stand alone software tool developed by the NCBI for submitting and updating entries to the GenBank sequence database EMBOSS 页面存档备份 存于互联网档案馆 free open source software for molecular biology GenBank RefSeq TPA and UniProt What s in a Name 页面存档备份 存于互联网档案馆 GenBank File Format Converter 页面存档备份 存于互联网档案馆 取自 https zh wikipedia org w index php title GenBank amp oldid 64136117, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。