重新思考一個小樣本 EEG 失眠軌跡研究

你目前的框架,也就是以平均 beta 功率加上 BAI/BDI 去預測二元軌跡結果,再用 AUC 評估,已經被困在一個 n≈55 無法真正支撐的典範裡。 強勢的臨床 baseline 讓 EEG 只能去爭取邊際性的區辨增益,事後再切頻段會削弱可信度,而把 3 個時間點的設計硬切成二元 outcome,則丟掉了大量珍貴資訊。好消息是:有多種替代框架比你目前的限制條件更匹配,而且其中不少在失眠、憂鬱與睡眠醫學領域,已有與你相近樣本數的直接發表前例。這份建議會提出 10 種替代框架,依照可發表性與新穎性排序,並對前 3 名提供完整的落地藍圖。


真正的核心問題是研究典範,不是 pipeline

在談替代方案前,先看清楚為什麼你目前的做法表現不好。這裡其實有三個互相疊加的結構性問題。第一,把 3 個時間點的軌跡二分化,會丟掉變異量,還必須依賴一個任意切點;對本來就很小的樣本來說,這會直接減少統計檢定力。第二,平均 band power 把多個 EEG 片段的分布與時間結構,壓縮成每位受試者的一個數字,結果是把可能最有臨床訊號的受試者內變異整個消掉。第三,把研究寫成「用 AUC 來比 prediction」,等於把 EEG 拉進一場它在這種樣本數下註定會輸給 BAI/BDI 的競賽:臨床量表便宜、穩定,又反映了多年累積的精神病理負擔;相較之下,一次 5 分鐘的 resting EEG 本來就更 noisy。

解法不是用更花的正則化去勉強救 AUC。解法是:**改變你在問什麼、怎麼表示 EEG,以及你宣稱這篇研究貢獻的是什麼。**下面這 10 條路線,正是為了做到這件事,而且會從最保守排到最有新意。


十種替代框架,依可行性與企圖心排序

框架 1:過度喚起機制的中介模型

重新定義問題:「皮質過度喚起(EEG)是否中介了共病焦慮/憂鬱對治療軌跡的影響?」

這是最保守、也最穩的一種重構方式,因為它把強勢的 BAI/BDI baseline 變成理論模型的優勢,而不是競爭對手。Perlis(1997, 2001)與 Riemann(2010)的 hyperarousal model,本來就預測:認知情緒喚起(BAI/BDI)會驅動皮質喚起(beta EEG),而後者進一步影響治療結果。中介分析正好就是拿來檢驗這條因果鏈:BAI/BDI → beta power 或 delta/beta ratio → trajectory slope。就算結果只得到部分中介,甚至中介不成立,這仍然是在限制與檢驗 hyperarousal theory,本身就是可發表的。

**前例:**Wassing 等人(2016,PNAS)用 SEM 顯示,失眠與過度喚起之間有 62.4% 的關聯,是透過夜間情緒解決能力下降所中介,樣本數 n=65。Krystal 與 Edinger(2010,SLEEP,n=30)用標準回歸展示 EEG 頻譜可預測 CBT-I 反應。2026 年一篇發表於 Translational Psychiatry 的多中心研究(n=98)則把 delta/beta ratio 當作主要皮質過度喚起指標,並發現 CBT-I 會顯著提高這個指標(p=0.002)。

**實作方式:**在 R 中使用 lavaan 做 bootstrap mediation(5,000 次重抽樣)。把 trajectory 保持為連續變數(由 3 個時間點估出 slope)。模型可設為:BAI → frontal beta power → trajectory slope;BDI → frontal beta power → trajectory slope。報告 indirect effect 與 95% bootstrap CI。**可行性:極高。**對於中大型的 indirect effect,一個簡單的 mediation 在 n≈55 下是可做的。EEG predictor 最多放 3 個即可,例如 broad beta、delta/beta ratio,以及來自 FOOOF 的 aperiodic exponent。

**可發表性:★★★★★。**目標可放在 Journal of Sleep ResearchPsychophysiology。審稿人會立即理解這套理論邏輯,也沒有黑箱疑慮。


框架 2:FOOOF / specparam 的 aperiodic decomposition 重分析

重新定義問題:「將週期性振盪與 aperiodic broadband 成分拆開後,會發現失眠治療軌跡真正相關的是 excitation/inhibition balance,而不一定是 beta 振盪本身。」

這條路線正面處理了事後切頻段的問題。傳統 beta power 其實混合了真實 oscillation 與 aperiodic 1/f 背景。FOOOF / specparam 演算法(Donoghue 等,2020,Nature Neuroscience)會把 power spectrum 拆成 aperiodic exponent(可視為神經 excitation/inhibition balance 指標)與 periodic peaks(真正的 oscillatory peaks)。aperiodic exponent 比 broad beta 更簡約、更具生理意義,也更直接貼近皮質過度喚起的概念。

**前例:**Bai 等人(2025,Sleep Medicine)把 specparam 用在原發性失眠的 resting-state EEG,發現 更平坦的 aperiodic exponent,反映抑制功能下降,且與 PSQI 分數相關。2025 年一篇 European Journal of Neuroscience 的系統性回顧,整理了 38 種疾病、177 篇臨床報告中的 aperiodic 變化,涵蓋憂鬱、ADHD、OCD 等。Woronko 等人(2026,Psychophysiology)在青少年憂鬱研究中,樣本數 n=53,就發現明顯的 aperiodic 差異,幾乎和你一樣大。2024 年 Cerebral Cortex 研究(n=49)也顯示,眼閉 resting EEG 的 aperiodic exponent 具有不錯的 test-retest reliability(ICC > 0.70)。

**實作方式:**在 Python 中安裝 specparam。對每位受試者的 PSD(1–40 Hz,max_n_peaks=6peak_width_limits=[0.5, 15])進行擬合。每位受試者提取:aperiodic exponent、aperiodic offset,以及 beta 範圍內任何 periodic peak 的參數(中心頻率、相對於 aperiodic fit 的 peak amplitude)。以 R² > 0.95 做品質控管。再把這 3–5 個特徵放進框架 1 的 mediation model,或放進框架 5 的 incremental regression。**關鍵優勢:**你現在「broad beta 不夠好、upper beta 比較漂亮但又像事後切出來」的現象,很可能只是 aperiodic slope 差異偽裝成 beta power。FOOOF 可以把兩者乾淨分開;如果最後是 aperiodic exponent 在驅動效果,你就得到一個可預先登記、理論驅動的 feature。

**可發表性:★★★★★。**FOOOF 現在已經是領域內標準工具。若是第一次把它應用在失眠治療軌跡預測上,會很新。期刊可考慮 SleepClinical NeurophysiologyPsychophysiology


框架 3:EEG microstate dynamics 作為時空生物標記

重新定義問題:「區分失眠治療軌跡的,不是靜態功率,而是 resting-state 的腦狀態動態。」

Microstates 捕捉的是全腦拓樸圖短暫穩定狀態的時間序列動態,每一個狀態大約維持 60–120 ms。它能從同一段 resting EEG 中萃取出更豐富的時空特徵,例如狀態持續時間、出現頻率、覆蓋率、轉換機率,以及 microstate 序列的 entropy。這是一種完全不同於頻譜功率的表示方式,可見到 static power 完全看不到的 network dynamics。

**前例:**Weng 等人(2025,Sleep Medicine)使用 恰好 n=55 的失眠患者 加上 67 位控制組,結合線性與非線性 microstate 特徵,達到 82.8% 的分類準確率。Guo 等人(2024,BMJ/PMC)發現基線 microstate transition dynamics 可預測失眠的 rTMS 治療反應(n=60 + 40 controls),且還另有 90 位病人的驗證樣本。Brodbeck 等人(2018,Frontiers in Psychiatry)則指出,失眠患者的 microstate class C 與 D 動態改變,與 somatic awareness 上升一致。

**實作方式:**使用 Pycrostates 或 EEGLAB 的 microstate plugin。這條路需要多通道 EEG(至少 19 channels)。先在 GFP peak maps 上用 modified k-means 分出 4–7 個類別。每位受試者提取各 class 的 mean duration、occurrence、coverage,加上 transition probability matrix 與非線性特徵(例如 entropy rate、Lempel-Ziv complexity)。最後把特徵降到大約 10–15 個,可用 PCA 或理論導向篩選(例如聚焦在失眠最穩定異常的 class D 指標),再拿去預測 trajectory,可用 mixed-effects 或 penalized regression。

**可發表性:★★★★。**睡眠期刊對這類分析的接受度在上升,且你有一篇 n=55 的直接前例可援引。限制是你必須真的有足夠多通道的資料。期刊可考慮 Sleep MedicineFrontiers in Psychiatry


框架 4:從 segment-level EEG 中提取分布與變異性特徵

重新定義問題:「能預測治療軌跡的,不是平均喚起程度,而是皮質喚起在個體內的時間不穩定性。」

這條路線不是把多個 EEG segments 壓成一個平均,而是保留每位受試者在各 segment 之間的完整分布特性:標準差、變異係數、偏態、峰態、四分位距、entropy 等。核心假說是:皮質喚起的不穩定性可能比平均值更有臨床意義。也就是說,一個「不穩定且忽高忽低」的 hyperaroused brain,可能和「穩定偏高」的 hyperarousal 是不同 phenotype。

**前例:**Jaworska 等人(2018,NeuroImage: Clinicaln=36 MDD + 36 controls)指出,EEG 的 multiscale entropy(MSE) 能預測抗憂鬱治療反應,而傳統 spectral power 不行;responders 在 coarse scales 上有更高的 MSE。Garrett 等人(2022,NeuroImage)也顯示,EEG variability 與穩定的個體差異關聯,比與 task performance 的關聯更強。Richter 等人(2022,Scientific Reports)在自閉症研究中,即使樣本只有 16+19,也發現很大的 EEG variability effect size。Purcell 等人(2022,SLEEP)則指出,睡眠中的 transient oscillation dynamics 具有 trait-like,但同時高度異質的特性。

**實作方式:**這是最容易從你現有 pipeline 延伸的一條路,真的只需要 5–10 行程式。對每位受試者的 segment-level beta power,計算 mean、SD、CV、skewness、kurtosis、IQR、10th percentile、90th percentile。可再加 multiscale entropy(透過 antropymne-features 套件)。每個頻段會得到大約 8–12 個特徵。接著用 elastic net regression(R 的 glmnet),以連續 trajectory slope 為 outcome。**這條路線直接處理了你目前「舊拼接 vs 新的 per-segment」的爭議:**如果要計算 distributional features,你本來就必須保留 per-segment data,等於讓新版資料格式有了明確的分析優勢。

**可發表性:★★★★★。**非常容易解釋,例如「較高的 beta power variability 預測較差的結果」。方法完全標準,在睡眠或心理期刊都很好交代,審稿阻力很低。


框架 5:Bayesian incremental value 架構

重新定義問題:「在預測失眠軌跡時,究竟有多少證據支持 EEG 在 clinical scales 之外有額外價值?以 Bayesian 的方式來估計。」

這條框架不是單純看 ΔAUC,而是直接量化「支持 EEG 有幫助」與「支持 EEG 沒幫助」的證據強度。Bayes factor 與 LOO-CV 權重,在小樣本時比 frequentist ΔAUC 更合理,也更能誠實地表達不確定性。對 EEG 係數加上 horseshoe priors,則能把沒有資訊量的特徵往 0 強力收縮,但保留真正有訊號的變數。

**前例:**Piironen 與 Vehtari(2017,Electronic Journal of Statistics)提出 regularized horseshoe prior。Harra 與 Kaplan(2023)指出,horseshoe priors 在小樣本條件下能帶來「顯著較佳的 predictive performance」。R 的 brms 套件(Bürkner,2017;引用超過 9,000 次)使得這類方法變得很可實作。Yao 等人(2018,Bayesian Analysis)則提出 Bayesian stacking weights,可用於模型組合。Frank Harrell 的 adequacy index(LR_clinical / LR_combined)則提供一個單一數值,用來衡量 clinical model 已經解釋了多少變異。

**實作方式:**在 brms 中建立 3 個模型:

  • Model 1(clinical):trajectory_slope ~ BAI + BDI(弱資訊先驗)
  • Model 2(EEG):trajectory_slope ~ EEG_features(horseshoe prior,par_ratio=0.2
  • Model 3(combined):trajectory_slope ~ BAI + BDI + EEG_features(BAI/BDI 用文獻導出的 informative priors,EEG 用 horseshoe)

最後用 LOO-CV、Bayesian stacking weights 與 Bayes factors 比較。報告各係數的 posterior distribution、Bayesian R² 與 posterior predictive checks。**關鍵優勢:**若 EEG 沒有帶來額外價值,Bayes factor 會誠實告訴你;若 EEG 有價值,horseshoe 能避免那只是過度擬合的幻象。

**可發表性:★★★★。**Bayesian 在心理學界愈來愈被期待,brms 也很常見。期刊可考慮 PsychophysiologyPsychological Medicine。唯一的缺點是,有些睡眠醫學審稿人可能需要你在方法裡多解釋一點。


框架 6:以 EEG clustering 做失眠亞型探索

重新定義問題:「失眠是否存在不同的神經生理亞型,而這些亞型是否預測不同的治療軌跡?」

這條路線完全從 supervised prediction 轉成 unsupervised discovery。問題不再是強迫一個二元分類器去預測 outcome,而是先問資料本身是否有自然結構。失眠現在愈來愈被視為高度異質的疾病,領域也在積極尋找有生物學基礎的 subtypes。

**前例:**Blanken 等人(2019,Lancet Psychiatry,n=2,224)從問卷中分出 5 種失眠亞型,各自對治療反應不同,憂鬱風險可差到 5 倍,這篇幾乎重塑了整個領域。Kao 等人(2021,Scientific Reportsn=99 insomnia + 25 controls)用 PSG 與 EEG delta spectral power 的 cluster analysis 找出 3 個亞型:short-sleep delta-deficient、normal-sleep delta-deficient,以及 normal neurophysiology。Zhao 等人(2025,SLEEP)與 Bresser 等人(2025,Biological Psychiatry)後續又確認了 Blanken subtypes 在 ERP 與結構連結上的差異。

**實作方式:**每位受試者建立一個 feature vector,可整合 EEG 指標(FOOOF 參數、beta power、delta/beta ratio、variability features),也可以選擇加上 BAI/BDI。接著用 hierarchical clustering 與 k-means,設定 k=2–4,並用 silhouette、gap statistic 與 bootstrap stability analysis(R 的 fpc::clusterboot)驗證。最後用 mixed-effects ANOVA 比較各 subtype 的 treatment trajectory。以 n≈55 而言,2–3 個 subtype 是較現實的範圍(每群至少 18–27 人)。只要兩群也很有價值,只要它們對 trajectory 的分化是明顯的。

**可發表性:★★★★。**Blanken 框架目前是失眠研究的熱門方向。若是第一篇結合 EEG 與 trajectory 的 subtype 研究,會很新。目標可放 SLEEPJournal of Sleep Research。即使最後沒有明顯 cluster,作為限制 subtype 假說的結果也仍有價值。


框架 7:用 LCGA 分析治療軌跡的潛在類別

重新定義問題:「治療軌跡中究竟存在幾種不同的類別?EEG 特徵能否預測這些類別的歸屬?」

這條路不是先武斷定義好/壞 responder,而是用 latent class growth analysis(LCGA) 讓資料自己揭露有幾種 trajectory classes。對 3 個時間點來說,仍然可以估 linear growth(intercept + slope)並把它放進 latent class 裡。接著再用 3-step approach 問:EEG 是否能預測 class membership。

**前例:**LCGA/GMM 的方法本身已非常成熟(Jung & Wickrama,2008;Van de Schoot 等,2017)。2023 年一篇 Journal of Affective Disorders 研究,就用 growth mixture modeling 找出憂鬱 4 類、焦慮 3 類治療軌跡,並由基線嚴重度預測 class membership。

**實作方式:**使用 R 的 tidySEM 或 Mplus(透過 MplusAutomation)。依序 fit 1–4 classes,以 BIC、entropy 與 bootstrap likelihood ratio test 選最佳模型。之後使用 BCH 或 3-step method,在考慮 classification uncertainty 的前提下,檢驗 EEG 與 BAI/BDI 是否預測 class membership。對 n≈55 來說,兩類 幾乎是現實上限(每類至少 25 人),但其實這樣已足夠。只要兩群可以被解釋為「快速反應者」與「緩慢改善者」,而 EEG 又能分辨它們,就很有價值。

**可發表性:★★★★。**LCGA 在心理與精神醫學領域被充分接受。把它和 EEG predictor 結合到失眠題目上,算是相對新穎。期刊可考慮 Behaviour Research and TherapySleep Medicine


框架 8:個體 EEG 偏離常模的 normative modeling

重新定義問題:「每一位失眠患者的 EEG 究竟偏離正常神經生理常模多少?這些個體化偏離輪廓是否能預測治療結果?」

Normative modeling(Marquand 等,2019;Rutherford 等,2022)不是去找 group average 差異,而是先用健康控制組資料學出「正常 EEG 變異範圍」,再為每位患者計算 偏離 z-scores。這樣得到的是個體層級的神經生理異常輪廓,而不是平均後的群組差異。

**前例:**Jaramillo-Jimenez 等人(2025,npj Parkinson’s Disease)把 normative modeling 用在 EEG 上,資料規模為 499 healthy + 237 PD + 197 AD,發現約 30% 病人有明顯頻譜偏離,且不同病人之間 deviant features 的空間重疊不到 60%,顯示出 group analysis 看不到的異質性。2023 年一篇 medRxiv preprint 更直接指出,resting-state EEG connectivity 的 normative modeling 可預測 MDD 的抗憂鬱治療反應。Rutherford 等人(2023,eLife)也顯示,normative features 在 group difference 與 classification 上都優於 raw features。

**實作方式:**這條路需要一個外部 healthy control EEG dataset 作為 normative model 的訓練集,例如 Temple University Hospital EEG Corpus、HBN,或其他開放 resting EEG 資料。用 PCNtoolkit,或在 controls 上 fit GAMLSS 模型,根據年齡與性別預測 EEG features。之後為每位患者計算 across channels/features 的偏離 z-scores,再用這些輪廓,例如最大偏離值、異常特徵數量、異常的空間分布,去預測 trajectory。**主要限制:**你的資料與 normative dataset 在 montage 和 recording parameters 上必須相容。

**可發表性:★★★。**新穎性很高,若做成可能會是失眠 EEG 的前沿應用。但外部常模資料的需求也增加了執行複雜度與審稿風險。期刊可考慮 NeuroImage: ClinicalBiological Psychiatry: CNNI


框架 9:用 segment-level EEG 做 mixed-effects trajectory modeling

重新定義問題:「在階層模型裡利用所有可用的 EEG segments,去預測連續治療軌跡。」

這條框架會把所有 segment-level EEG observation 都放進 linear mixed-effects model,正確處理「segments nested within subjects」的資料結構。outcome 是連續 trajectory,而不是二元分類。這樣做同時避免了:一,把多個 segments 平均後造成的資訊損失;二,把 outcome 二分化造成的檢定力流失。

**前例:**Riha 等人(2020,Brain Topographyn=49 tinnitus patients)用 LMM 分析不同頻段與電極群 EEG power 與 psychometric predictors 的關聯,發現 57.8% 的 EEG 變異來自 subject-specific effect。lmeEEG 套件(Visalli 等,2023)也提供了較高效的 mass-univariate EEG LMM 實作。

**實作方式:**在 R 中用 lme4,或小樣本更建議用 brms

trajectory_score ~ timepoint * beta_power_segment + BAI + BDI + (1 + timepoint | subject)

這個模型直接估 segment-level beta power 如何與時間交互作用,去預測 trajectory,並為每位受試者建立 random intercept 與 random slope。假如你有 55 位受試者、每位大約 30 個 segments,等於有約 1,650 個觀測值,這會大幅改善 within-subject effect 的估計。最後報告 fixed effects、random effect variances、ICC,以及 marginal/conditional R²。

**可發表性:★★★★★。**Mixed-effects model 是心理學界的黃金標準,睡眠醫學審稿人也完全看得懂。任何睡眠或 psychophysiology 期刊都適合。


框架 10:方法比較型 benchmark paper

重新定義問題:「系統性比較不同 EEG 訊號表示方法,在失眠臨床預測中的表現。」

這條路把研究寫成方法學貢獻,而不是臨床 prediction paper。你可以 head-to-head 比較:傳統 band power、FOOOF 分解後特徵、distributional features、microstate dynamics、variability measures,全都去預測同一個 treatment outcome。研究本身關心的是:在你的情境下,哪一種 EEG 表示法最有資訊量。

前例:EEG-FM-Bench(2025)與 EEG-Bench(2024)已經建立了 EEG benchmarking 的典範。Gemein 等人(2020)也系統性比較過傳統 ML 與深度學習在 EEG 分類上的表現。你的樣本小反而變成優點:這就是一個真實臨床場景,而比較「哪些方法在這種受限條件下還能工作」,本來就是臨床 EEG 社群需要的資訊。

**實作方式:**把所有 feature extraction pipelines 套到同一批資料上,評估方式一律統一:repeated 5-fold CV、permutation testing、95% CI,再加 clinical-only baseline(BAI + BDI)。最後報 discrimination、calibration 與 decision curves。整篇論文就是一個 pipeline comparison,且附上 open code。

**可發表性:★★★★。**這條路對「negative result」的風險很低,因為比較本身就是貢獻。期刊可考慮 Clinical NeurophysiologyComputers in Biology and MedicineFrontiers in Neuroscience


所有框架的優先排序

排名框架保守 → 新穎可行性(n≈55)得到 negative result 的風險最適合的用途
1Hyperarousal mediation(#1)+ FOOOF(#2)最保守★★★★★第一篇、最穩妥
2Distributional features(#4)+ mixed-effects(#9)保守★★★★★最大化利用現有資料
3Bayesian incremental value(#5)中等★★★★★低(null 也能發)誠實量化證據
4Subtype discovery(#6)中等偏新★★★★低(有結構或沒結構都可解釋)高影響力 framing
5Latent trajectory classes(#7)中等★★★★中等拯救原本的 trajectory 問題
6Microstate dynamics(#3)中等偏新★★★★中等若有多通道 EEG 可用
7Methods benchmark(#10)中等★★★★很低若其他 framing 都不滿意
8Normative modeling(#8)最新穎★★★中等若想衝更高的新意

前三名框架的詳細落地藍圖

第一名:結合 FOOOF 分解的 hyperarousal mediation

這是把框架 1 與框架 2 合成一篇最有整體性的研究。它檢驗的是:由 EEG 的 aperiodic 成分所量到的皮質過度喚起,是否中介了焦慮/憂鬱與失眠治療軌跡之間的關係。

題目:「皮質 excitation/inhibition balance 中介焦慮與憂鬱對失眠治療軌跡的影響:一項以 aperiodic EEG 為核心的分析」

**要提取的特徵:**對 resting-state EEG 使用 specparam(1–40 Hz,knee mode off)。每位受試者提取:(1) aperiodic exponent(主特徵,反映 E/I balance),(2) aperiodic offset,(3) periodic beta peak amplitude(aaperiodic fit 之上的真實 beta oscillation),(4) periodic beta peak center frequency。可同時計算 frontal average(若有 F3、F4、Fz)與 whole-scalp average。

**主要模型:**在 lavaan 中做 path analysis:

  • Path a:BAI → frontal aperiodic exponent
  • Path b:frontal aperiodic exponent → trajectory slope(控制 BAI)
  • Path c’:BAI → trajectory slope(控制 aperiodic exponent 後的直接效果)
  • indirect effect(a × b),用 5,000 次 bootstrap 求 CI
  • 再以 BDI 當 predictor 重跑一次
  • 再以 periodic beta peak amplitude 當 mediator 作 secondary analysis

**主要結果表:**報告 total effect、direct effect、indirect effect 與 95% bootstrap CI,再加上 mediated proportion。同時比較:真正承載中介效果的是 aperiodic exponent,還是 periodic beta component。這會直接回答:文獻中的「beta power」究竟反映的是 oscillatory hyperarousal,還是 aperiodic 的 E/I imbalance。

**補充分析:**1. 比較傳統 beta power 中介模型與 FOOOF 分解模型,證明 decomposition 的價值。2. 用 brms 做 Bayesian mediation。3. 依 Imai 等人(2010)的 sequential ignorability bounds 做 unmeasured confounding 敏感度分析。

**對審稿人的賣點:**a. 這是在檢驗 hyperarousal model 一個具體且可預先註冊的預測,而不是事後資料挖掘。b. FOOOF 能解決失眠 beta 文獻長期存在的核心模糊點:到底反映 oscillatory beta 還是 aperiodic 成分。c. BAI/BDI 的強勢反而變成優點,因為現在真正問的是「症狀嚴重度如何影響神經生理」。d. 就算結果是不顯著中介,也是在限制理論。e. 样本數接近的直接前例是 Woronko 等人(2026,Psychophysiology,n=53)。


第二名:distributional EEG features 搭配 Bayesian 評估

這條路把框架 4 和框架 5 結合起來:先從你已經有的 segment-level 資料中挖出更豐富的特徵,再用 Bayesian 的方式誠實估計它是否真的帶來增量價值。

題目:「受試者內 EEG 變異性作為皮質喚起生物標記:一項對失眠增量預測價值的 Bayesian 評估」

**要提取的特徵:**從每位受試者的 segment-level beta power(也可選擇加入每段的 FOOOF aperiodic exponent)計算:mean、SD、CV、skewness、kurtosis、IQR、10th percentile、90th percentile、range,以及 multiscale entropy(1–15 scales,透過 antropy)。每種 spectral measure 大約得到 10–12 個 distributional features。之後可用 PCA 壓到 3–5 個成分,或以理論導向選擇 mean + CV + coarse-scale MSE 這三個當主特徵。

**主要模型:**在 brms 中進行 Bayesian regression:

  • Model A(clinical):trajectory_slope ~ BAI + BDI,先驗用弱資訊 Normal(0, 1)
  • Model B(EEG mean only):trajectory_slope ~ mean_beta,較寬鬆先驗
  • Model C(EEG distributional):trajectory_slope ~ mean_beta + CV_beta + MSE_coarse,EEG 係數用 horseshoe prior
  • Model D(combined):trajectory_slope ~ BAI + BDI + mean_beta + CV_beta + MSE_coarse,BAI/BDI 用文獻導出的 informative priors,EEG 用 horseshoe

**主要結果表:**四個模型的比較,報 LOO-ELPD difference、標準誤、stacking weights 與 Bayesian R²。核心問題是:Model D(combined)是否優於 Model A(clinical only)?如果有,真正驅動改善的是 mean,還是 variability?如果沒有,Bayes factor 本身就是有價值的 null evidence。

**補充分析:**1. 對 LOO performance differences 做 1,000 次 permutation test。2. 做 posterior predictive checks 檢驗 calibration。3. 用 decision curve analysis 比較 clinical-only 與 combined model 的 net benefit。4. 用 Riley 等人的 pmsampsize 正式論證樣本數所能支撐的 predictor 數量。

**對審稿人的賣點:**a. Distributional features 是最容易立即落地的升級,不需要任何新資料,只需要用你已經有的 per-segment 結構。b. Bayesian 架構能誠實地呈現 EEG 有無增量價值。c. 若 variability 比 mean 更重要,你會得到一個非常有趣、且具有機制意義的新發現:arousal instability 比 arousal level 更關鍵。d. 就算結果顯示 EEG 沒有帶來增量,Bayes factor 也會提供可發表的「缺乏證據支持增量」結果。e. 這整套流程完全透明,也能用標準 R 套件重現。


第三名:以 EEG 為核心的失眠亞型探索

這條路對應框架 6,核心是把 EEG 從 prediction feature 變成 subtype-defining signal。

題目:「失眠的神經生理亞型:一項以 EEG clustering 與差異性治療軌跡預測為核心的分析」

**用於分群的特徵:**可結合 aperiodic exponent(來自 FOOOF)、periodic beta amplitude、delta/beta ratio,以及 distributional features(如 beta power CV、MSE)。可做一版 EEG-only clustering,也做一版 EEG + BAI/BDI clustering,再比較兩者。所有特徵先標準化成 z-scores。

**分群方式:**1. Hierarchical clustering(Ward’s linkage),k=2–4。2. k-means,同樣跑 k=2–4。3. Consensus clustering(R 的 ConsensusClusterPlusdiceR),把不同方法與重抽樣結果整合起來。最後用 silhouette width、gap statistic 與 prediction strength 選最佳 k,並用 bootstrap (fpc::clusterboot,1,000 次) 驗證穩定性;若 cluster 在超過 75% 的重抽樣中被重現,即視為穩定。

**主要分析:**用 mixed-effects ANOVA 比較不同 subtype 的 treatment trajectory:trajectory_score ~ timepoint × subtype + (1 | subject)。畫出各 subtype 的 trajectory plots 與 95% CI。檢驗各 subtype 在 BAI/BDI、睡眠指標與人口學上的差異。如果 EEG-only subtype 只是映射到 BAI/BDI,代表 hyperarousal continuum;如果它抓到的是超越 BAI/BDI 的結構,就表示你找到了新的神經生理維度。

**補充分析:**1. 用 adjusted Rand index 比較 EEG-only clustering 與 EEG+clinical clustering 的一致性。2. 用 discriminant function analysis 看哪些特徵最能分開各 subtype。3. 用 t-SNE 或 UMAP 視覺化 subtype separation。4. 若你有足夠問卷題項,也可以檢驗 Blanken 等人的 subtype 是否和你的 EEG clusters 對應。

**對審稿人的賣點:**a. 這是在把 Blanken 等人(2019)的 landmark questionnaire subtype framework 直接擴展到 neurophysiology,是領域等待中的下一步。b. Kao 等人(2021,n=99)提供了 EEG-based insomnia subtyping 的直接前例。c. 無監督分析天然避開了小樣本 supervised prediction 最容易被批評的 overfitting 問題。d. 就算最後只有兩個 subtype,只要它們的 trajectory 有臨床意義,就是可行結果。e. 失眠領域現在非常需要 biologically grounded subtypes 來支撐 precision medicine。


不管選哪個框架,都必須守住的方法學底線

**一定要做正式的樣本數合理性說明。**用 Riley 等人的 pmsampsize R 套件,正式計算你的樣本最多能支撐多少 predictor。以 n≈55 且 outcome 為連續變數來看,任何單一模型大概都只能承受 3–5 個 predictor。若仍保留 binary outcome,可能還得更少。這一段務必要明確引用 Riley 等人(2019,Statistics in Medicine)。

**把研究定位成第 1–2 階段 biomarker validation。**GREENBEAN checklist(Ewen 等,2025,Clinical Neurophysiology)是在 IFCN 架構下提出的四階段驗證框架,概念類似藥物開發。n≈55 的研究,很明確就是 Phase 1–2(探索性/初步臨床驗證)。這樣 framing 之後,你的研究不再是「檢定力不足的 prediction study」,而是「檢定力與定位都符合早期 biomarker investigation」。

**盡量把 outcome 保持為連續。**只有 3 個時間點時,直接對每位受試者算 trajectory slope 是很自然的,而且能保留全部資訊。把它二分成「好/壞 responder」是你目前最承受不起的資訊損失。如果你還是需要 binary outcome 作為臨床轉譯,應把它放到 secondary analysis。

**誠實報告並遵循 TRIPOD。**使用 TRIPOD+AI(Collins 等,2015;2024 更新版)做透明報告。所有 performance metrics 都要報 confidence / credible intervals。任何 predictive performance 都應用 1,000 次以上的 permutation test 來確認是否顯著。也建議引用 Varoquaux(2018,NeuroImage)關於小樣本 cross-validation 不穩定性的討論,並明確說明你如何在設計上降低這個問題。

**務必預先註冊分析計畫。**由於可行框架與特徵太多,若不 pre-register,你的可信度會被大幅打折。建議在 OSF 或 AsPredicted 上註冊,明確指定 primary features、primary model 與 primary outcome。其餘分析全部歸類為「預先指定的 secondary」或「exploratory」。


最大化發表價值的整合策略

最佳發表策略,可能不是一篇 paper,而是用同一份資料做兩篇互補的文章,各自回答不同問題:

Paper 1(機制 / 驗證型):使用 hyperarousal mediation + FOOOF decomposition(框架 1 + 2)。這是一篇理論驅動、所需特徵極少、而且能精準補 literature gap 的論文。目標期刊可放 Journal of Sleep ResearchSLEEP。中介假說應預先註冊。這篇論文完全不依賴 predictive accuracy,因為它要檢驗的是機制路徑。

**Paper 2(方法 / 探索型):**使用 distributional features + Bayesian evaluation(框架 4 + 5),或 methods benchmark(框架 10)。這篇的重點是誠實評估:更豐富的 EEG 表示法,是否真的能在 clinical scales 之外提供額外預測價值。目標期刊可放 Clinical NeurophysiologyPsychophysiology。整篇 framing 成 GREENBEAN 所說的 early-phase biomarker validation。

這種兩篇式策略的最大優點是:即使 predictive gain 在 n≈55 下最終仍然有限(這其實很可能),第一篇機制論文也仍然可以憑藉自己的理論與方法學價值成立;第二篇則能誠實提供:在更大規模驗證研究之前,哪一種 EEG 表示法最值得未來延伸。這正是一個 Phase 1–2 study 最應該交出的貢獻。