- 入力:シングルセルRNA-seqデータ(カウントマトリックス)
- 品質制御(QC):低品質の細胞と遺伝子を除去します
- データの正規化:データを正規化して、技術的バイアスを修正する
2。クラスタリング
- 正規化されたデータでクラスタリングを実行して、セルクラスターを識別します
- さまざまなクラスタリング方法を使用できます(例:K-means、階層クラスタリング、ルーバン)
3。マーカー遺伝子識別
- 各クラスターについて:
- クラスター内の細胞全体の各遺伝子の平均発現を計算する
- クラスター内の遺伝子の平均発現を他のクラスターの遺伝子と比較する
- 他のクラスターと比較してクラスターで高度に発現している遺伝子を特定します
4。マーカー遺伝子検証
- 選択基準を適用して、マーカー遺伝子を選択できます。
- 折りたたみの変化:クラスターと他のクラスターの間に高い折り畳み変化を伴う遺伝子を考慮してください
- 統計的有意性:統計テスト(例:t検定、ウィルコクソンテスト)を使用して、発現の違いの重要性を評価する
- 特異性:マーカー遺伝子が関心のあるクラスターで選択的に発現していることを確認してください
5。解釈と視覚化
- 特定されたマーカー遺伝子に関連する機能と経路を分析する
- ヒートマップ、火山プロット、またはその他の視覚化を生成して、マーカー遺伝子とその発現パターンを提示する
6。独立データセットでの検証(オプション)
- 信頼性を高めるには、利用可能な場合は、識別されたマーカー遺伝子を独立したデータセットで検証します。