基因銀行(GenBank)

基因銀行(GenBank)

Print Friendly

基因銀行(GenBank)
臺灣大學生命科學系 柯一嘉

依照美國國家健康局 (National Institution of Health) 的說明,基因銀行是一個儲存近二、三十萬物種的核苷酸序列 (nucleotide sequence) 的資料庫,由美國國家生物技術信息中心 (National Center for Biotechnology Information, NCBI)負責管理,每兩個月更新一次,並且對外公開。這些序列資料大多來自個別科學家的貢獻或是整個研究計劃的資料提供。該資料庫定期與歐洲核苷酸檔案庫(European Nucleotide Archive)、日本DNA資料銀行(DNA Data Bank of Japan)交換資料[1]。三者因此共同組成了國際核苷酸序列資料庫合作 (the International Nucleotide Sequence Database Collaboration, INSDC),致力於獲取及保存核苷酸序列信息,為數據建立了標準格式,使個人和組織更容易將核苷酸數據可靠且全面提供大眾使用。

(圖片來源:維基百科)

基因銀行會根據:(1)分類學 (Taxonomic) 及 (2) 獲取序列的方法,將序列記錄到數個不同的部門 (division)。在分類學中共有12個部門大致對應於序列的來源,分別為SYN (合成生物, Synthetic)、PHG (噬菌體, Phages)、ENV (環境樣本, Environmental samples)、VRL (病毒, Viruses)、BCT (細菌, Bacteria)、PLN (植物, Plants)、MAM (其他哺乳類, Other mammals)、VRT (其他脊椎动物, Other vertebrates)、PRI (靈長類動物, Primates)、UNA (未注明, Unannotated)、ROD (鼠類, Rodents)及INV (無脊椎動物, Invertebrates)。在獲取序列方法的部門中有:TSA (轉錄物組槍資料, Transcriptome shotgun data)、WGS (全基因體槍資料, Whole-genome shotgun data)、PAT (具有專利的序列, Patented sequences)、GSS (基因組檢測序列, Genome survey sequences)、EST (表現序列標籤, Expressed sequence tags)、HTG (高通量基因體學, High-throughput genomic)、STS (序列標記區, Sequence tagged sites)及HTC (高通量cDNA, High-throughput cDNA) 等8個[2] 。

1983年Walter Goad在GenBank數據庫的終端前。(圖片來源:維基百科,其轉載經美國哲學學會檔案許可)

基因銀行主要是提供及鼓勵科學社群之間互相交換最新及綜合性的DNA序列,序列資料只可以由原寄送者修改,但是基因銀行鼓勵第三人提供修改意見[2] 。所有序列資料可以透過基因銀行的電子傳輸系統BankIt或Sequin傳送。基本上,基因銀行對於使用該資料庫並沒做什麼限制,不過仍需注意這些序列有可能被申請專利或著作權等智慧財產權。由於,基因銀行沒有提供協助取得這些智慧財產權授權的服務,如果需要做商業上用途等,仍是需要再查詢是否有需要向原權利所有人取得授權(GenBank Overview) 。再者,由於有些作者在投稿期刊論文時,期刊會要求提供資料到公開序列資料庫做為刊登的條件,因此,作者們可以要求基因銀行對於所寄送的序列,在他們論文還沒有被期刊登出來之前不要公開。當然,作者需要告知基因銀行預計刊登日期,以利銀行的相關作業。


參考文獻

  1. Karen Clark, Ilene Karsch-Mizrachi, David J. Lipman, James Ostell, and Eric W. Sayers, GenBank, Nucleic Acids Res. 2016 Jan.
  2. Dennis A. Benson, Mark Cavanaugh, Karen Clark, Ilene Karsch-Mizrachi, David J. Lipman, James Ostell and Eric W. Sayers, GenBank, Nucleic Acids Research, 2013, Vol. 41.
  3. GenBank Overview: https://www.ncbi.nlm.nih.gov/genbank/

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


8 − 1 =