二次データベースとは?
二次データベースは、一次生物学的データソースから派生した事前に計算された情報のコレクションです。これらは、洞察を提供し、生データから直接取得するのが難しいか時間がかかる分析を促進するように設計されています。
重要な特性:
* 一次データに由来する: これらは、プライマリデータベース(GenBankなどのシーケンスデータベースなど)からデータを処理および統合することによって構築されます。
* 整理および構造化: 情報は特定のカテゴリと形式に編成されているため、検索と分析が容易になります。
* 付加価値情報: 彼らは、より深い洞察を提供する、一次データに基づいて注釈、予測、および解釈を提供します。
二次データベースの例:
焦点によって分類された二次データベースの選択は次のとおりです。
* シーケンス分析と注釈:
* uniprot: タンパク質配列と機能情報。
* interpro: タンパク質ファミリー、ドメイン、および機能部位。
* go(遺伝子オントロジー): 遺伝子機能の階層分類。
* kegg: 代謝経路と遺伝子機能。
* pfam: タンパク質ファミリー。
* ゲノムと遺伝子発現:
* ensembl: ゲノムアセンブリ、遺伝子注釈、および遺伝子発現データ。
* UCSCゲノムブラウザ: ゲノムデータの視覚化と探索。
* Geo(遺伝子発現Omnibus): マイクロアレイおよびRNAシーケンスデータリポジトリ。
* arrayExpress: マイクロアレイデータリポジトリ。
* タンパク質間相互作用とネットワーク:
* 文字列: タンパク質間相互作用とネットワーク。
* biogrid: タンパク質間相互作用と遺伝的相互作用。
* 創薬とターゲットの識別:
* ドラッグバンク: 薬物情報の包括的なデータベース。
* chembl: 薬物様分子とその生物学的活性。
* pubchem: 化学構造と生物学的活動。
* 比較ゲノミクスと進化:
* NCBI分類ブラウザ: 生物の階層分類。
* Phylotree: 生物の系統樹。
* ツリーベース: 系統樹のリポジトリ。
二次データベースの利点:
* 時間節約: 彼らは前処理され整理された情報を提供し、研究者に時間と労力を節約します。
* 拡張分析: 注釈、予測、および関係は、より深い分析と理解を促進します。
* 多様なデータの統合: 多くの場合、二次データベースは複数のソースからの情報を統合し、包括的なビューを提供します。
* 標準化された形式: データは通常、標準化された形式で提示され、一貫性と互換性を促進します。
適切なデータベースの選択:
セカンダリデータベースの選択は、特定の研究質問とデータタイプに依存します。以下を検討してください。
* データ型: タンパク質配列、ゲノムデータ、遺伝子発現など。
* スコープ: 特定の生物、経路、病気、またはより広い生物学的領域。
* 必要な情報: 注釈、予測、相互作用など
* データの品質と信頼性: データベースがよく維持されており、正確な情報を提供していることを確認してください。
要約:
二次データベースは、バイオインフォマティクスの研究に不可欠です。それらは、貴重な事前に計算された情報、注釈、洞察を提供し、効率的なデータ分析と理解を促進します。研究のニーズに基づいて適切なデータベースを選択し、意味のある発見の可能性を活用してください。