Drug perturbation analysis 是什麼？— 從疾病基因表現反推候選藥物

概念動畫 · 示意

↑↑↓

ALS 疾病 signature
（上調紅／下調藍）

理想藥物 →

↑↓ ↑↓ ↓↑

被藥物反轉
（方向相反）

理想藥物能把 ALS 中過度上升的基因壓下、過度下降的拉回——紅（疾病異常）逐漸轉為藍（被校正）。

Drug perturbation analysis 概念圖：血液 DEGs、與 iPSC 神經元/脊髓交集得 core genes、LINCS 比對、尋找可反轉疾病 signature 的藥物、候選藥物輸出 — Drug perturbation analysis 概念圖：血液 DEGs → 跨組織交集萃取 core genes → 用 LINCS 找出能「反轉」ALS signature 的候選藥物。（點圖可放大）

第二張圖的問題意識和第一張不同。第一張問的是：能不能分辨病人？而第二張問的是：既然 ALS 有特定的基因表現異常，那能不能找出某些藥物，去反向修正這種異常？

因此，drug perturbation analysis 的出發點，不是直接找已知 ALS 藥物，而是先建立一個疾病的轉錄體 signature。也就是說，研究者先問：在 ALS 血液中，到底有哪些基因上升了？哪些基因下降了？如果這組變化真的代表疾病的一部分，那麼理想的藥物應該要能做到相反的事情——把 ALS 中過度上升的基因壓下來，把 ALS 中過度下降的基因拉回來。這種概念有點像「分子層次的反向校正」。

研究的第一步，仍然是從血液 RNA-seq 出發。作者把 ALS cases 與 controls 比較，得到兩套血液差異基因：一套是原始的 primary DEGs，另一套是校正 immune cell proportions 後的 adjusted DEGs。之所以要做 adjusted 版本，是因為 whole blood 的基因表現很容易受到血球組成影響；有時候你看到的差異，不一定是單一細胞真的改變了功能，而可能只是因為某一類細胞變多了。因此作者希望把「細胞比例差異」與「真正與 ALS 病理相關的分子改變」盡量區分開來。

但研究者沒有直接拿這些 blood DEGs 去找藥。因為光是血液差異，不一定足夠代表 ALS 真正的核心病理。所以第二步，他們把血液 DEGs 分別拿去和兩個 ALS 相關資料集做交集：第一個是 iPSC-derived neurons with TDP-43 knockdown，代表較早期、偏機制性的神經元 disease model；第二個是 ALS postmortem spinal cord，代表較晚期、較接近終末病理的中樞神經組織。透過這種交集，研究者想找出那些不只在血液中異常、而且同時也在神經元模型或脊髓病灶中出現的基因。這些基因比較有機會是真正與 ALS 疾病過程有關，而不是單純的周邊變化。

於是，作者定義了幾種 core genes。若某基因同時存在於 blood 與 iPSC-neuron 中，可視為較偏「early core genes」；若存在於 blood 與 spinal cord 中，可視為「late core genes」；而如果同時出現在 blood、iPSC-neuron 與 spinal cord 三者中，就屬於 overall core genes。這一步的邏輯很重要，因為它其實是在做疾病訊號的「提純」：不是所有差異基因都等重，而是優先保留那些跨組織、跨模型仍然重複出現的訊號。文中最後得到的 adjusted overall core genes 為 282 個，primary overall core genes 為 288 個。

第三步，研究者把這些 core genes 丟進 LINCS 這類大型藥物擾動資料庫。LINCS 收集了大量「某種藥物處理細胞後，細胞基因表現會如何改變」的資料。也就是說，這個資料庫本身就是一個龐大的「藥物 → 轉錄體反應」對照表。當你把 ALS 的 core gene signature 拿去比對時，系統就可以問：有沒有某些藥物，它造成的基因表現變化方向，剛好和 ALS 的變化相反？如果有，這些藥就可能是值得進一步測試的候選者。

這個過程，本質上就是一種 transcriptomic drug repositioning（轉錄體層次的藥物重定位）：不是直接證明藥有效，而是用大規模分子資料，先找出可能值得優先驗證的候選藥。

重要提醒：這類分析找到的是 therapeutic candidates（候選藥物），不是已證實能成功治療 ALS 的藥。它的價值在於把茫茫藥海縮小到「值得優先進實驗驗證」的清單，後續仍需細胞、動物與臨床層級的驗證。