重新思考一個小樣本 EEG 失眠軌跡研究

你目前的框架，也就是以平均 beta 功率加上 BAI/BDI 去預測二元軌跡結果，再用 AUC 評估，已經被困在一個 n≈55 無法真正支撐的典範裡。 強勢的臨床 baseline 讓 EEG 只能去爭取邊際性的區辨增益，事後再切頻段會削弱可信度，而把 3 個時間點的設計硬切成二元 outcome，則丟掉了大量珍貴資訊。好消息是：有多種替代框架比你目前的限制條件更匹配，而且其中不少在失眠、憂鬱與睡眠醫學領域，已有與你相近樣本數的直接發表前例。這份建議會提出 10 種替代框架，依照可發表性與新穎性排序，並對前 3 名提供完整的落地藍圖。

真正的核心問題是研究典範，不是 pipeline

在談替代方案前，先看清楚為什麼你目前的做法表現不好。這裡其實有三個互相疊加的結構性問題。第一，把 3 個時間點的軌跡二分化，會丟掉變異量，還必須依賴一個任意切點；對本來就很小的樣本來說，這會直接減少統計檢定力。第二，平均 band power 把多個 EEG 片段的分布與時間結構，壓縮成每位受試者的一個數字，結果是把可能最有臨床訊號的受試者內變異整個消掉。第三，把研究寫成「用 AUC 來比 prediction」，等於把 EEG 拉進一場它在這種樣本數下註定會輸給 BAI/BDI 的競賽：臨床量表便宜、穩定，又反映了多年累積的精神病理負擔；相較之下，一次 5 分鐘的 resting EEG 本來就更 noisy。

解法不是用更花的正則化去勉強救 AUC。解法是：**改變你在問什麼、怎麼表示 EEG，以及你宣稱這篇研究貢獻的是什麼。**下面這 10 條路線，正是為了做到這件事，而且會從最保守排到最有新意。

十種替代框架，依可行性與企圖心排序

框架 1：過度喚起機制的中介模型

重新定義問題：「皮質過度喚起（EEG）是否中介了共病焦慮／憂鬱對治療軌跡的影響？」

這是最保守、也最穩的一種重構方式，因為它把強勢的 BAI/BDI baseline 變成理論模型的優勢，而不是競爭對手。Perlis（1997, 2001）與 Riemann（2010）的 hyperarousal model，本來就預測：認知情緒喚起（BAI/BDI）會驅動皮質喚起（beta EEG），而後者進一步影響治療結果。中介分析正好就是拿來檢驗這條因果鏈：BAI/BDI → beta power 或 delta/beta ratio → trajectory slope。就算結果只得到部分中介，甚至中介不成立，這仍然是在限制與檢驗 hyperarousal theory，本身就是可發表的。

**前例：**Wassing 等人（2016，PNAS）用 SEM 顯示，失眠與過度喚起之間有 62.4% 的關聯，是透過夜間情緒解決能力下降所中介，樣本數 n=65。Krystal 與 Edinger（2010，SLEEP，n=30）用標準回歸展示 EEG 頻譜可預測 CBT-I 反應。2026 年一篇發表於 Translational Psychiatry 的多中心研究（n=98）則把 delta/beta ratio 當作主要皮質過度喚起指標，並發現 CBT-I 會顯著提高這個指標（p=0.002）。

**實作方式：**在 R 中使用 lavaan 做 bootstrap mediation（5,000 次重抽樣）。把 trajectory 保持為連續變數（由 3 個時間點估出 slope）。模型可設為：BAI → frontal beta power → trajectory slope；BDI → frontal beta power → trajectory slope。報告 indirect effect 與 95% bootstrap CI。**可行性：極高。**對於中大型的 indirect effect，一個簡單的 mediation 在 n≈55 下是可做的。EEG predictor 最多放 3 個即可，例如 broad beta、delta/beta ratio，以及來自 FOOOF 的 aperiodic exponent。

**可發表性：★★★★★。**目標可放在 Journal of Sleep Research 或 Psychophysiology。審稿人會立即理解這套理論邏輯，也沒有黑箱疑慮。

框架 2：FOOOF / specparam 的 aperiodic decomposition 重分析

重新定義問題：「將週期性振盪與 aperiodic broadband 成分拆開後，會發現失眠治療軌跡真正相關的是 excitation/inhibition balance，而不一定是 beta 振盪本身。」

這條路線正面處理了事後切頻段的問題。傳統 beta power 其實混合了真實 oscillation 與 aperiodic 1/f 背景。FOOOF / specparam 演算法（Donoghue 等，2020，Nature Neuroscience）會把 power spectrum 拆成 aperiodic exponent（可視為神經 excitation/inhibition balance 指標）與 periodic peaks（真正的 oscillatory peaks）。aperiodic exponent 比 broad beta 更簡約、更具生理意義，也更直接貼近皮質過度喚起的概念。

**前例：**Bai 等人（2025，Sleep Medicine）把 specparam 用在原發性失眠的 resting-state EEG，發現 更平坦的 aperiodic exponent，反映抑制功能下降，且與 PSQI 分數相關。2025 年一篇 European Journal of Neuroscience 的系統性回顧，整理了 38 種疾病、177 篇臨床報告中的 aperiodic 變化，涵蓋憂鬱、ADHD、OCD 等。Woronko 等人（2026，Psychophysiology）在青少年憂鬱研究中，樣本數 n=53，就發現明顯的 aperiodic 差異，幾乎和你一樣大。2024 年 Cerebral Cortex 研究（n=49）也顯示，眼閉 resting EEG 的 aperiodic exponent 具有不錯的 test-retest reliability（ICC > 0.70）。

**實作方式：**在 Python 中安裝 specparam。對每位受試者的 PSD（1–40 Hz，max_n_peaks=6，peak_width_limits=[0.5, 15]）進行擬合。每位受試者提取：aperiodic exponent、aperiodic offset，以及 beta 範圍內任何 periodic peak 的參數（中心頻率、相對於 aperiodic fit 的 peak amplitude）。以 R² > 0.95 做品質控管。再把這 3–5 個特徵放進框架 1 的 mediation model，或放進框架 5 的 incremental regression。**關鍵優勢：**你現在「broad beta 不夠好、upper beta 比較漂亮但又像事後切出來」的現象，很可能只是 aperiodic slope 差異偽裝成 beta power。FOOOF 可以把兩者乾淨分開；如果最後是 aperiodic exponent 在驅動效果，你就得到一個可預先登記、理論驅動的 feature。

**可發表性：★★★★★。**FOOOF 現在已經是領域內標準工具。若是第一次把它應用在失眠治療軌跡預測上，會很新。期刊可考慮 Sleep、Clinical Neurophysiology 或 Psychophysiology。

框架 3：EEG microstate dynamics 作為時空生物標記

重新定義問題：「區分失眠治療軌跡的，不是靜態功率，而是 resting-state 的腦狀態動態。」

Microstates 捕捉的是全腦拓樸圖短暫穩定狀態的時間序列動態，每一個狀態大約維持 60–120 ms。它能從同一段 resting EEG 中萃取出更豐富的時空特徵，例如狀態持續時間、出現頻率、覆蓋率、轉換機率，以及 microstate 序列的 entropy。這是一種完全不同於頻譜功率的表示方式，可見到 static power 完全看不到的 network dynamics。

**前例：**Weng 等人（2025，Sleep Medicine）使用 恰好 n=55 的失眠患者 加上 67 位控制組，結合線性與非線性 microstate 特徵，達到 82.8% 的分類準確率。Guo 等人（2024，BMJ/PMC）發現基線 microstate transition dynamics 可預測失眠的 rTMS 治療反應（n=60 + 40 controls），且還另有 90 位病人的驗證樣本。Brodbeck 等人（2018，Frontiers in Psychiatry）則指出，失眠患者的 microstate class C 與 D 動態改變，與 somatic awareness 上升一致。

**實作方式：**使用 Pycrostates 或 EEGLAB 的 microstate plugin。這條路需要多通道 EEG（至少 19 channels）。先在 GFP peak maps 上用 modified k-means 分出 4–7 個類別。每位受試者提取各 class 的 mean duration、occurrence、coverage，加上 transition probability matrix 與非線性特徵（例如 entropy rate、Lempel-Ziv complexity）。最後把特徵降到大約 10–15 個，可用 PCA 或理論導向篩選（例如聚焦在失眠最穩定異常的 class D 指標），再拿去預測 trajectory，可用 mixed-effects 或 penalized regression。

**可發表性：★★★★。**睡眠期刊對這類分析的接受度在上升，且你有一篇 n=55 的直接前例可援引。限制是你必須真的有足夠多通道的資料。期刊可考慮 Sleep Medicine 或 Frontiers in Psychiatry。

框架 4：從 segment-level EEG 中提取分布與變異性特徵

重新定義問題：「能預測治療軌跡的，不是平均喚起程度，而是皮質喚起在個體內的時間不穩定性。」

這條路線不是把多個 EEG segments 壓成一個平均，而是保留每位受試者在各 segment 之間的完整分布特性：標準差、變異係數、偏態、峰態、四分位距、entropy 等。核心假說是：皮質喚起的不穩定性可能比平均值更有臨床意義。也就是說，一個「不穩定且忽高忽低」的 hyperaroused brain，可能和「穩定偏高」的 hyperarousal 是不同 phenotype。

**前例：**Jaworska 等人（2018，NeuroImage: Clinical，n=36 MDD + 36 controls）指出，EEG 的 multiscale entropy（MSE） 能預測抗憂鬱治療反應，而傳統 spectral power 不行；responders 在 coarse scales 上有更高的 MSE。Garrett 等人（2022，NeuroImage）也顯示，EEG variability 與穩定的個體差異關聯，比與 task performance 的關聯更強。Richter 等人（2022，Scientific Reports）在自閉症研究中，即使樣本只有 16+19，也發現很大的 EEG variability effect size。Purcell 等人（2022，SLEEP）則指出，睡眠中的 transient oscillation dynamics 具有 trait-like，但同時高度異質的特性。

**實作方式：**這是最容易從你現有 pipeline 延伸的一條路，真的只需要 5–10 行程式。對每位受試者的 segment-level beta power，計算 mean、SD、CV、skewness、kurtosis、IQR、10th percentile、90th percentile。可再加 multiscale entropy（透過 antropy 或 mne-features 套件）。每個頻段會得到大約 8–12 個特徵。接著用 elastic net regression（R 的 glmnet），以連續 trajectory slope 為 outcome。**這條路線直接處理了你目前「舊拼接 vs 新的 per-segment」的爭議：**如果要計算 distributional features，你本來就必須保留 per-segment data，等於讓新版資料格式有了明確的分析優勢。

**可發表性：★★★★★。**非常容易解釋，例如「較高的 beta power variability 預測較差的結果」。方法完全標準，在睡眠或心理期刊都很好交代，審稿阻力很低。

框架 5：Bayesian incremental value 架構

重新定義問題：「在預測失眠軌跡時，究竟有多少證據支持 EEG 在 clinical scales 之外有額外價值？以 Bayesian 的方式來估計。」

這條框架不是單純看 ΔAUC，而是直接量化「支持 EEG 有幫助」與「支持 EEG 沒幫助」的證據強度。Bayes factor 與 LOO-CV 權重，在小樣本時比 frequentist ΔAUC 更合理，也更能誠實地表達不確定性。對 EEG 係數加上 horseshoe priors，則能把沒有資訊量的特徵往 0 強力收縮，但保留真正有訊號的變數。

**前例：**Piironen 與 Vehtari（2017，Electronic Journal of Statistics）提出 regularized horseshoe prior。Harra 與 Kaplan（2023）指出，horseshoe priors 在小樣本條件下能帶來「顯著較佳的 predictive performance」。R 的 brms 套件（Bürkner，2017；引用超過 9,000 次）使得這類方法變得很可實作。Yao 等人（2018，Bayesian Analysis）則提出 Bayesian stacking weights，可用於模型組合。Frank Harrell 的 adequacy index（LR_clinical / LR_combined）則提供一個單一數值，用來衡量 clinical model 已經解釋了多少變異。

**實作方式：**在 brms 中建立 3 個模型：

Model 1（clinical）：trajectory_slope ~ BAI + BDI（弱資訊先驗）
Model 2（EEG）：trajectory_slope ~ EEG_features（horseshoe prior，par_ratio=0.2）
Model 3（combined）：trajectory_slope ~ BAI + BDI + EEG_features（BAI/BDI 用文獻導出的 informative priors，EEG 用 horseshoe）

最後用 LOO-CV、Bayesian stacking weights 與 Bayes factors 比較。報告各係數的 posterior distribution、Bayesian R² 與 posterior predictive checks。**關鍵優勢：**若 EEG 沒有帶來額外價值，Bayes factor 會誠實告訴你；若 EEG 有價值，horseshoe 能避免那只是過度擬合的幻象。

**可發表性：★★★★。**Bayesian 在心理學界愈來愈被期待，brms 也很常見。期刊可考慮 Psychophysiology 或 Psychological Medicine。唯一的缺點是，有些睡眠醫學審稿人可能需要你在方法裡多解釋一點。

框架 6：以 EEG clustering 做失眠亞型探索

重新定義問題：「失眠是否存在不同的神經生理亞型，而這些亞型是否預測不同的治療軌跡？」

這條路線完全從 supervised prediction 轉成 unsupervised discovery。問題不再是強迫一個二元分類器去預測 outcome，而是先問資料本身是否有自然結構。失眠現在愈來愈被視為高度異質的疾病，領域也在積極尋找有生物學基礎的 subtypes。

**前例：**Blanken 等人（2019，Lancet Psychiatry，n=2,224）從問卷中分出 5 種失眠亞型，各自對治療反應不同，憂鬱風險可差到 5 倍，這篇幾乎重塑了整個領域。Kao 等人（2021，Scientific Reports，n=99 insomnia + 25 controls）用 PSG 與 EEG delta spectral power 的 cluster analysis 找出 3 個亞型：short-sleep delta-deficient、normal-sleep delta-deficient，以及 normal neurophysiology。Zhao 等人（2025，SLEEP）與 Bresser 等人（2025，Biological Psychiatry）後續又確認了 Blanken subtypes 在 ERP 與結構連結上的差異。

**實作方式：**每位受試者建立一個 feature vector，可整合 EEG 指標（FOOOF 參數、beta power、delta/beta ratio、variability features），也可以選擇加上 BAI/BDI。接著用 hierarchical clustering 與 k-means，設定 k=2–4，並用 silhouette、gap statistic 與 bootstrap stability analysis（R 的 fpc::clusterboot）驗證。最後用 mixed-effects ANOVA 比較各 subtype 的 treatment trajectory。以 n≈55 而言，2–3 個 subtype 是較現實的範圍（每群至少 18–27 人）。只要兩群也很有價值，只要它們對 trajectory 的分化是明顯的。

**可發表性：★★★★。**Blanken 框架目前是失眠研究的熱門方向。若是第一篇結合 EEG 與 trajectory 的 subtype 研究，會很新。目標可放 SLEEP 或 Journal of Sleep Research。即使最後沒有明顯 cluster，作為限制 subtype 假說的結果也仍有價值。

框架 7：用 LCGA 分析治療軌跡的潛在類別

重新定義問題：「治療軌跡中究竟存在幾種不同的類別？EEG 特徵能否預測這些類別的歸屬？」

這條路不是先武斷定義好／壞 responder，而是用 latent class growth analysis（LCGA） 讓資料自己揭露有幾種 trajectory classes。對 3 個時間點來說，仍然可以估 linear growth（intercept + slope）並把它放進 latent class 裡。接著再用 3-step approach 問：EEG 是否能預測 class membership。

**前例：**LCGA/GMM 的方法本身已非常成熟（Jung & Wickrama，2008；Van de Schoot 等，2017）。2023 年一篇 Journal of Affective Disorders 研究，就用 growth mixture modeling 找出憂鬱 4 類、焦慮 3 類治療軌跡，並由基線嚴重度預測 class membership。

**實作方式：**使用 R 的 tidySEM 或 Mplus（透過 MplusAutomation）。依序 fit 1–4 classes，以 BIC、entropy 與 bootstrap likelihood ratio test 選最佳模型。之後使用 BCH 或 3-step method，在考慮 classification uncertainty 的前提下，檢驗 EEG 與 BAI/BDI 是否預測 class membership。對 n≈55 來說，兩類幾乎是現實上限（每類至少 25 人），但其實這樣已足夠。只要兩群可以被解釋為「快速反應者」與「緩慢改善者」，而 EEG 又能分辨它們，就很有價值。

**可發表性：★★★★。**LCGA 在心理與精神醫學領域被充分接受。把它和 EEG predictor 結合到失眠題目上，算是相對新穎。期刊可考慮 Behaviour Research and Therapy 或 Sleep Medicine。

框架 8：個體 EEG 偏離常模的 normative modeling

重新定義問題：「每一位失眠患者的 EEG 究竟偏離正常神經生理常模多少？這些個體化偏離輪廓是否能預測治療結果？」

Normative modeling（Marquand 等，2019；Rutherford 等，2022）不是去找 group average 差異，而是先用健康控制組資料學出「正常 EEG 變異範圍」，再為每位患者計算 偏離 z-scores。這樣得到的是個體層級的神經生理異常輪廓，而不是平均後的群組差異。

**前例：**Jaramillo-Jimenez 等人（2025，npj Parkinson’s Disease）把 normative modeling 用在 EEG 上，資料規模為 499 healthy + 237 PD + 197 AD，發現約 30% 病人有明顯頻譜偏離，且不同病人之間 deviant features 的空間重疊不到 60%，顯示出 group analysis 看不到的異質性。2023 年一篇 medRxiv preprint 更直接指出，resting-state EEG connectivity 的 normative modeling 可預測 MDD 的抗憂鬱治療反應。Rutherford 等人（2023，eLife）也顯示，normative features 在 group difference 與 classification 上都優於 raw features。

**實作方式：**這條路需要一個外部 healthy control EEG dataset 作為 normative model 的訓練集，例如 Temple University Hospital EEG Corpus、HBN，或其他開放 resting EEG 資料。用 PCNtoolkit，或在 controls 上 fit GAMLSS 模型，根據年齡與性別預測 EEG features。之後為每位患者計算 across channels/features 的偏離 z-scores，再用這些輪廓，例如最大偏離值、異常特徵數量、異常的空間分布，去預測 trajectory。**主要限制：**你的資料與 normative dataset 在 montage 和 recording parameters 上必須相容。

**可發表性：★★★。**新穎性很高，若做成可能會是失眠 EEG 的前沿應用。但外部常模資料的需求也增加了執行複雜度與審稿風險。期刊可考慮 NeuroImage: Clinical 或 Biological Psychiatry: CNNI。

框架 9：用 segment-level EEG 做 mixed-effects trajectory modeling

重新定義問題：「在階層模型裡利用所有可用的 EEG segments，去預測連續治療軌跡。」

這條框架會把所有 segment-level EEG observation 都放進 linear mixed-effects model，正確處理「segments nested within subjects」的資料結構。outcome 是連續 trajectory，而不是二元分類。這樣做同時避免了：一，把多個 segments 平均後造成的資訊損失；二，把 outcome 二分化造成的檢定力流失。

**前例：**Riha 等人（2020，Brain Topography，n=49 tinnitus patients）用 LMM 分析不同頻段與電極群 EEG power 與 psychometric predictors 的關聯，發現 57.8% 的 EEG 變異來自 subject-specific effect。lmeEEG 套件（Visalli 等，2023）也提供了較高效的 mass-univariate EEG LMM 實作。

**實作方式：**在 R 中用 lme4，或小樣本更建議用 brms：

trajectory_score ~ timepoint * beta_power_segment + BAI + BDI + (1 + timepoint | subject)

這個模型直接估 segment-level beta power 如何與時間交互作用，去預測 trajectory，並為每位受試者建立 random intercept 與 random slope。假如你有 55 位受試者、每位大約 30 個 segments，等於有約 1,650 個觀測值，這會大幅改善 within-subject effect 的估計。最後報告 fixed effects、random effect variances、ICC，以及 marginal/conditional R²。

**可發表性：★★★★★。**Mixed-effects model 是心理學界的黃金標準，睡眠醫學審稿人也完全看得懂。任何睡眠或 psychophysiology 期刊都適合。

框架 10：方法比較型 benchmark paper

重新定義問題：「系統性比較不同 EEG 訊號表示方法，在失眠臨床預測中的表現。」

這條路把研究寫成方法學貢獻，而不是臨床 prediction paper。你可以 head-to-head 比較：傳統 band power、FOOOF 分解後特徵、distributional features、microstate dynamics、variability measures，全都去預測同一個 treatment outcome。研究本身關心的是：在你的情境下，哪一種 EEG 表示法最有資訊量。

前例：EEG-FM-Bench（2025）與 EEG-Bench（2024）已經建立了 EEG benchmarking 的典範。Gemein 等人（2020）也系統性比較過傳統 ML 與深度學習在 EEG 分類上的表現。你的樣本小反而變成優點：這就是一個真實臨床場景，而比較「哪些方法在這種受限條件下還能工作」，本來就是臨床 EEG 社群需要的資訊。

**實作方式：**把所有 feature extraction pipelines 套到同一批資料上，評估方式一律統一：repeated 5-fold CV、permutation testing、95% CI，再加 clinical-only baseline（BAI + BDI）。最後報 discrimination、calibration 與 decision curves。整篇論文就是一個 pipeline comparison，且附上 open code。

**可發表性：★★★★。**這條路對「negative result」的風險很低，因為比較本身就是貢獻。期刊可考慮 Clinical Neurophysiology、Computers in Biology and Medicine 或 Frontiers in Neuroscience。

所有框架的優先排序

排名	框架	保守 → 新穎	可行性（n≈55）	得到 negative result 的風險	最適合的用途
1	Hyperarousal mediation（#1）+ FOOOF（#2）	最保守	★★★★★	低	第一篇、最穩妥
2	Distributional features（#4）+ mixed-effects（#9）	保守	★★★★★	低	最大化利用現有資料
3	Bayesian incremental value（#5）	中等	★★★★★	低（null 也能發）	誠實量化證據
4	Subtype discovery（#6）	中等偏新	★★★★	低（有結構或沒結構都可解釋）	高影響力 framing
5	Latent trajectory classes（#7）	中等	★★★★	中等	拯救原本的 trajectory 問題
6	Microstate dynamics（#3）	中等偏新	★★★★	中等	若有多通道 EEG 可用
7	Methods benchmark（#10）	中等	★★★★	很低	若其他 framing 都不滿意
8	Normative modeling（#8）	最新穎	★★★	中等	若想衝更高的新意

前三名框架的詳細落地藍圖

第一名：結合 FOOOF 分解的 hyperarousal mediation

這是把框架 1 與框架 2 合成一篇最有整體性的研究。它檢驗的是：由 EEG 的 aperiodic 成分所量到的皮質過度喚起，是否中介了焦慮／憂鬱與失眠治療軌跡之間的關係。

題目：「皮質 excitation/inhibition balance 中介焦慮與憂鬱對失眠治療軌跡的影響：一項以 aperiodic EEG 為核心的分析」

**要提取的特徵：**對 resting-state EEG 使用 specparam（1–40 Hz，knee mode off）。每位受試者提取：(1) aperiodic exponent（主特徵，反映 E/I balance），(2) aperiodic offset，(3) periodic beta peak amplitude（aaperiodic fit 之上的真實 beta oscillation），(4) periodic beta peak center frequency。可同時計算 frontal average（若有 F3、F4、Fz）與 whole-scalp average。

**主要模型：**在 lavaan 中做 path analysis：

Path a：BAI → frontal aperiodic exponent
Path b：frontal aperiodic exponent → trajectory slope（控制 BAI）
Path c’：BAI → trajectory slope（控制 aperiodic exponent 後的直接效果）
indirect effect（a × b），用 5,000 次 bootstrap 求 CI
再以 BDI 當 predictor 重跑一次
再以 periodic beta peak amplitude 當 mediator 作 secondary analysis

**主要結果表：**報告 total effect、direct effect、indirect effect 與 95% bootstrap CI，再加上 mediated proportion。同時比較：真正承載中介效果的是 aperiodic exponent，還是 periodic beta component。這會直接回答：文獻中的「beta power」究竟反映的是 oscillatory hyperarousal，還是 aperiodic 的 E/I imbalance。

**補充分析：**1. 比較傳統 beta power 中介模型與 FOOOF 分解模型，證明 decomposition 的價值。2. 用 brms 做 Bayesian mediation。3. 依 Imai 等人（2010）的 sequential ignorability bounds 做 unmeasured confounding 敏感度分析。

**對審稿人的賣點：**a. 這是在檢驗 hyperarousal model 一個具體且可預先註冊的預測，而不是事後資料挖掘。b. FOOOF 能解決失眠 beta 文獻長期存在的核心模糊點：到底反映 oscillatory beta 還是 aperiodic 成分。c. BAI/BDI 的強勢反而變成優點，因為現在真正問的是「症狀嚴重度如何影響神經生理」。d. 就算結果是不顯著中介，也是在限制理論。e. 样本數接近的直接前例是 Woronko 等人（2026，Psychophysiology，n=53）。

第二名：distributional EEG features 搭配 Bayesian 評估

這條路把框架 4 和框架 5 結合起來：先從你已經有的 segment-level 資料中挖出更豐富的特徵，再用 Bayesian 的方式誠實估計它是否真的帶來增量價值。

題目：「受試者內 EEG 變異性作為皮質喚起生物標記：一項對失眠增量預測價值的 Bayesian 評估」

**要提取的特徵：**從每位受試者的 segment-level beta power（也可選擇加入每段的 FOOOF aperiodic exponent）計算：mean、SD、CV、skewness、kurtosis、IQR、10th percentile、90th percentile、range，以及 multiscale entropy（1–15 scales，透過 antropy）。每種 spectral measure 大約得到 10–12 個 distributional features。之後可用 PCA 壓到 3–5 個成分，或以理論導向選擇 mean + CV + coarse-scale MSE 這三個當主特徵。

**主要模型：**在 brms 中進行 Bayesian regression：

Model A（clinical）：trajectory_slope ~ BAI + BDI，先驗用弱資訊 Normal(0, 1)
Model B（EEG mean only）：trajectory_slope ~ mean_beta，較寬鬆先驗
Model C（EEG distributional）：trajectory_slope ~ mean_beta + CV_beta + MSE_coarse，EEG 係數用 horseshoe prior
Model D（combined）：trajectory_slope ~ BAI + BDI + mean_beta + CV_beta + MSE_coarse，BAI/BDI 用文獻導出的 informative priors，EEG 用 horseshoe

**主要結果表：**四個模型的比較，報 LOO-ELPD difference、標準誤、stacking weights 與 Bayesian R²。核心問題是：Model D（combined）是否優於 Model A（clinical only）？如果有，真正驅動改善的是 mean，還是 variability？如果沒有，Bayes factor 本身就是有價值的 null evidence。

**補充分析：**1. 對 LOO performance differences 做 1,000 次 permutation test。2. 做 posterior predictive checks 檢驗 calibration。3. 用 decision curve analysis 比較 clinical-only 與 combined model 的 net benefit。4. 用 Riley 等人的 pmsampsize 正式論證樣本數所能支撐的 predictor 數量。

**對審稿人的賣點：**a. Distributional features 是最容易立即落地的升級，不需要任何新資料，只需要用你已經有的 per-segment 結構。b. Bayesian 架構能誠實地呈現 EEG 有無增量價值。c. 若 variability 比 mean 更重要，你會得到一個非常有趣、且具有機制意義的新發現：arousal instability 比 arousal level 更關鍵。d. 就算結果顯示 EEG 沒有帶來增量，Bayes factor 也會提供可發表的「缺乏證據支持增量」結果。e. 這整套流程完全透明，也能用標準 R 套件重現。

第三名：以 EEG 為核心的失眠亞型探索

這條路對應框架 6，核心是把 EEG 從 prediction feature 變成 subtype-defining signal。

題目：「失眠的神經生理亞型：一項以 EEG clustering 與差異性治療軌跡預測為核心的分析」

**用於分群的特徵：**可結合 aperiodic exponent（來自 FOOOF）、periodic beta amplitude、delta/beta ratio，以及 distributional features（如 beta power CV、MSE）。可做一版 EEG-only clustering，也做一版 EEG + BAI/BDI clustering，再比較兩者。所有特徵先標準化成 z-scores。

**分群方式：**1. Hierarchical clustering（Ward’s linkage），k=2–4。2. k-means，同樣跑 k=2–4。3. Consensus clustering（R 的 ConsensusClusterPlus 或 diceR），把不同方法與重抽樣結果整合起來。最後用 silhouette width、gap statistic 與 prediction strength 選最佳 k，並用 bootstrap (fpc::clusterboot，1,000 次) 驗證穩定性；若 cluster 在超過 75% 的重抽樣中被重現，即視為穩定。

**主要分析：**用 mixed-effects ANOVA 比較不同 subtype 的 treatment trajectory：trajectory_score ~ timepoint × subtype + (1 | subject)。畫出各 subtype 的 trajectory plots 與 95% CI。檢驗各 subtype 在 BAI/BDI、睡眠指標與人口學上的差異。如果 EEG-only subtype 只是映射到 BAI/BDI，代表 hyperarousal continuum；如果它抓到的是超越 BAI/BDI 的結構，就表示你找到了新的神經生理維度。

**補充分析：**1. 用 adjusted Rand index 比較 EEG-only clustering 與 EEG+clinical clustering 的一致性。2. 用 discriminant function analysis 看哪些特徵最能分開各 subtype。3. 用 t-SNE 或 UMAP 視覺化 subtype separation。4. 若你有足夠問卷題項，也可以檢驗 Blanken 等人的 subtype 是否和你的 EEG clusters 對應。

**對審稿人的賣點：**a. 這是在把 Blanken 等人（2019）的 landmark questionnaire subtype framework 直接擴展到 neurophysiology，是領域等待中的下一步。b. Kao 等人（2021，n=99）提供了 EEG-based insomnia subtyping 的直接前例。c. 無監督分析天然避開了小樣本 supervised prediction 最容易被批評的 overfitting 問題。d. 就算最後只有兩個 subtype，只要它們的 trajectory 有臨床意義，就是可行結果。e. 失眠領域現在非常需要 biologically grounded subtypes 來支撐 precision medicine。

不管選哪個框架，都必須守住的方法學底線

**一定要做正式的樣本數合理性說明。**用 Riley 等人的 pmsampsize R 套件，正式計算你的樣本最多能支撐多少 predictor。以 n≈55 且 outcome 為連續變數來看，任何單一模型大概都只能承受 3–5 個 predictor。若仍保留 binary outcome，可能還得更少。這一段務必要明確引用 Riley 等人（2019，Statistics in Medicine）。

**把研究定位成第 1–2 階段 biomarker validation。**GREENBEAN checklist（Ewen 等，2025，Clinical Neurophysiology）是在 IFCN 架構下提出的四階段驗證框架，概念類似藥物開發。n≈55 的研究，很明確就是 Phase 1–2（探索性／初步臨床驗證）。這樣 framing 之後，你的研究不再是「檢定力不足的 prediction study」，而是「檢定力與定位都符合早期 biomarker investigation」。

**盡量把 outcome 保持為連續。**只有 3 個時間點時，直接對每位受試者算 trajectory slope 是很自然的，而且能保留全部資訊。把它二分成「好／壞 responder」是你目前最承受不起的資訊損失。如果你還是需要 binary outcome 作為臨床轉譯，應把它放到 secondary analysis。

**誠實報告並遵循 TRIPOD。**使用 TRIPOD+AI（Collins 等，2015；2024 更新版）做透明報告。所有 performance metrics 都要報 confidence / credible intervals。任何 predictive performance 都應用 1,000 次以上的 permutation test 來確認是否顯著。也建議引用 Varoquaux（2018，NeuroImage）關於小樣本 cross-validation 不穩定性的討論，並明確說明你如何在設計上降低這個問題。

**務必預先註冊分析計畫。**由於可行框架與特徵太多，若不 pre-register，你的可信度會被大幅打折。建議在 OSF 或 AsPredicted 上註冊，明確指定 primary features、primary model 與 primary outcome。其餘分析全部歸類為「預先指定的 secondary」或「exploratory」。

最大化發表價值的整合策略

最佳發表策略，可能不是一篇 paper，而是用同一份資料做兩篇互補的文章，各自回答不同問題：

Paper 1（機制 / 驗證型）：使用 hyperarousal mediation + FOOOF decomposition（框架 1 + 2）。這是一篇理論驅動、所需特徵極少、而且能精準補 literature gap 的論文。目標期刊可放 Journal of Sleep Research 或 SLEEP。中介假說應預先註冊。這篇論文完全不依賴 predictive accuracy，因為它要檢驗的是機制路徑。

**Paper 2（方法 / 探索型）：**使用 distributional features + Bayesian evaluation（框架 4 + 5），或 methods benchmark（框架 10）。這篇的重點是誠實評估：更豐富的 EEG 表示法，是否真的能在 clinical scales 之外提供額外預測價值。目標期刊可放 Clinical Neurophysiology 或 Psychophysiology。整篇 framing 成 GREENBEAN 所說的 early-phase biomarker validation。

這種兩篇式策略的最大優點是：即使 predictive gain 在 n≈55 下最終仍然有限（這其實很可能），第一篇機制論文也仍然可以憑藉自己的理論與方法學價值成立；第二篇則能誠實提供：在更大規模驗證研究之前，哪一種 EEG 表示法最值得未來延伸。這正是一個 Phase 1–2 study 最應該交出的貢獻。

研究室筆記

Explorer

Claude