小樣本失眠軌跡研究的替代計算框架地圖:從「苦撐 AUC」走向可發表的 EEG×臨床 paper 重構

研究問題為何卡在「苦撐 AUC」

你原本把研究問題鎖死在「在 BAI/BDI baseline 很強的前提下,再加一個 subject-level mean beta power,AUC 能不能再上升一點」。這個 framing 的核心問題不是技術細節,而是目標函數(ΔAUC)與你資料條件(n≈55、clinical baseline 已強、EEG effect 可能是 heterogenous/trait-like)本質不相容

第一,baseline model 越強,AUC 越難再被提高。臨床量表(如 BAI/BDI)已經抓到很大量的「共變異」時,新 marker(EEG)即使有真訊號,ΔAUC 也常常必然很小;要把 AUC 從 0.80 推到 0.85 需要「非常強」且相對獨立的新 predictor。這不是你做得不夠漂亮,而是 AUC 的幾何性質下的必然現象。

第二,n≈55 下 AUC(尤其是 ΔAUC)估計不穩定,且 CV 的方差/偏差問題會被放大。小樣本時 ROC/AUC 的估計誤差可以很大;若同時還做 feature selection、band 選擇或模型調參,誤差會再膨脹。

第三,睡眠 EEG 的「人」訊號往往比「病」訊號更大。最新的大樣本與跨夜資料顯示:睡眠 EEG spectral features 的分類表現常被「個體特徵(trait-like signatures)」主導;高頻活動(你關注的 beta/更快頻)甚至被指出更像個體指紋,而未必是 insomnia-specific pattern。這會直接解釋你看到的現象:EEG 可能有訊號,但放到 subject-level mean 再去「加成」強 baseline 時,增益會很有限。

第四,事後切頻段(例如 upper beta 22–29 Hz)在心理/睡眠期刊敘事上容易被視為「分析岔路太多」。即使你主觀上是「合理探索」,在統計可重現性語境裡仍屬典型 researcher degrees of freedom:當分析選擇高度依賴 data 時,即使只呈現一套結果,也可能在無意識下放大假陽性與可發表性偏誤。

因此,你「設錯」的不是 beta band,而是把 paper 成敗押在『強 baseline + 單一 band mean + ΔAUC』這條窄路上:它同時吃到(1)AUC 天花板效應、(2)小樣本不穩定、(3)睡眠 EEG 的 trait/heterogeneity 特性、(4)band 選擇的可辯護性問題。

研究設計的重新定位原則

如果目標不是再「修補」原框架,而是重構成可發 paper,你需要把研究問題從「多 0.01 的 AUC」換成心理/睡眠醫學更買單的三個關鍵詞:機制(mechanism)、不穩定(instability)、異質性(heterogeneity)

一,從「分類器」回到「病理模型」:失眠的核心理論之一是多領域 hyperarousal(生理/皮質/認知情緒),而睡眠與清醒 EEG 的高頻活動(包含 beta 及更快頻)常被用作皮質 hyperarousal 的客觀指標之一。你真正能做成 paper 的,不應該是「AUC 小幅上升」,而是「哪一種 EEG 表徵最貼近 hyperarousal/睡眠不穩定,且能解釋為何會走向某種軌跡」。

二,接受失眠是異質性的:文獻長期強調失眠存在不同 phenotype(例如 objective short sleep duration vs normal sleep duration、睡眠錯覺/主觀-客觀落差等),而「症狀軌跡(trajectory)」本身就是異質性的表徵。你應該把 EEG 的角色設定為:幫你把 trajectory 的異質性用生理訊號可解釋化,而不是硬當一個「再加一分 AUC 的 predictor」。

三,用能減少岔路的 EEG 表徵:固定 band power 容易混到 aperiodic(1/f)背景、個體差與頻帶定義任意性;相對地,periodic vs aperiodic 分解與**睡眠微結構/不穩定指標(如 CAP、microarousals)**是更「生理導向」且可辯護的特徵家族。

四,建模單位要跟訊號一致:你已經有 segment-level 版本,這是關鍵資產。睡眠生理很多重要訊號不是「平均值」,而是分佈、變異、間歇性與狀態切換;把 segment-level 資訊再壓成 subject mean,等於主動丟掉最適合用 EEG 講故事的部分。

替代框架地圖

下面列出 9 條「明顯不同於原本框架」的研究路線。每條都以你限制(n≈55、baseline 強、3TP 二元、期刊偏心理/睡眠醫學、方法不可太黑箱)為前提,並明確評估:方法上成立 / 你資料下可做 / 發表可能性與可接受度。

路線:Periodic vs aperiodic 分解,從「beta」改成「背景斜率/offset + peak」的機制指標
核心概念:用 SpecParam/FOOOF 類方法把 power spectrum 拆成 aperiodic(exponent/offset)與 periodic peaks(中心頻率、peak power、bandwidth),避免把「看起來像 beta」其實是 1/f 背景或頻移造成的假象。
為何適合 n≈55:你可以把特徵壓縮到少量、可解釋參數(每個 stage 幾個參數),大幅降低維度與後設選 band 的疑慮。
paper 機會:高。因為它把你的問題改成「hyperarousal 的哪個頻譜成分與軌跡相關」,而不是「AUC 能不能 +0.01」。insomnia 族群使用 aperiodic/periodic 分離的研究近年明顯增加。
期刊接受度:高(睡眠醫學、psychophysiology 皆可),因為它不是黑箱 DL,而是生理可解釋的頻譜參數化;但需要避免把 exponent 過度簡化成「E/I 的直接量測」,可引用文獻對其限制的討論。

路線:睡眠不穩定(sleep instability)作為主角:CAP / microarousals / arousal intensity 指標
核心概念:把 EEG 當作睡眠動態系統,主 outcome 不再是平均 beta,而是 NREM 的不穩定性(CAP、phasic events、microarousals)與其組成。CAP 被明確定位為 sleep instability 的 EEG marker。
為何適合 n≈55:這類指標生理與臨床語言高度一致(睡眠「穩不穩」),而且可用較少特徵就形成強敘事;此外 CAP/微覺醒是事件/比率型指標,天然適合做 risk stratification(例如高不穩定 vs 低不穩定),不用硬拚 AUC。
paper 機會:中高。CAP 與失眠、睡眠錯覺、藥物/治療反應都有可連結的文獻脈絡;你可以把 trajectory interpretation 直接對應到「睡眠保護機制 vs 侵入性喚醒」。
期刊接受度:高(睡眠醫學非常熟悉 CAP/microarousal 的概念),心理期刊也能接受,因為它在回答「失眠的主觀困擾與客觀睡眠動態」的橋接問題。

路線:把 EEG 表徵改成「分佈」:segment-level distribution features(分位數、偏態、尾端、熵)而非 mean
核心概念:同一個人整晚 EEG 不是固定值,而是分佈;尤其失眠的 hyperarousal 常被描述為持續或間歇性高頻活動與睡眠片段化。你可以把每人每 stage 的 beta/高頻或 aperiodic 指標,做成 median、IQR、90th percentile、skewness、極端尾端比例(例如 >個體基準 +1 SD 的 epochs 比例)等。
為何適合 n≈55:你用的是「每人萃取少量 summary」,維度可控、不黑箱,而且直接利用你已有的 segment-level 資料版本;同時把訊號從「平均值」改成「不穩定/尾端事件」,更符合睡眠生理。
paper 機會:中高。這條路線特別適合把主張改成:「trajectory 的差異不在平均功率,而在**尾端的高唤醒 epochs(intermittency)**或分佈形狀」。這也正好回應你不想後設切 upper beta 的疑慮:你可以先固定 broad band(保守),但把「訊號形狀」當創新點。
期刊接受度:中高。只要你用的統計/模型是透明的(例如少量 summary + logistic / Bayesian / permutation),心理與睡眠期刊會比對黑箱 DL 更友善。

路線:Burst / intermittency / state-switching:從連續功率改成事件(event-based)
核心概念:在許多領域,beta activity 被指出常由「短暫高振幅 bursts」主導而非持續振盪;類比到睡眠,你可以定義「高頻/β 指標的 burst events」,分析 burst rate、duration、time-in-burst、跨 stage 的 burst clustering,或與 microarousal 的時間共現。
為何適合 n≈55:事件特徵(每小時 burst 數、平均持續時間、burst 佔比)維度低且直觀;比「挑一段頻帶」更能辯護,因為你強調的是時間結構
paper 機會:中。睡眠領域直接談「beta bursts」的脈絡較少,但 microarousal/EEG activation 本來就有事件偵測傳統;你要把它寫成「高唤醒事件密度」會更貼近期刊語言。
期刊接受度:中。要避免過度借用運動系統 beta burst 理論;策略是把 burst 定義連結到 sleep arousal literature,而不是 motor control。

路線:Topographic pattern features:從單一 channel/平均改成空間圖樣(但用低維、可視化)
核心概念:失眠的高頻活動在頭皮分佈上可能呈現區域性;你可在 NREM 全夜或分段(前半夜/後半夜)做 topographic maps,再用少量可解釋成分(PCA component scores、ROI 比值如 frontal vs occipital)表徵「空間型 hyperarousal」。
為何適合 n≈55:你不需要高維深網路,反而可以把空間資訊壓到 1–3 個 pattern score;可視化強、心理/睡眠期刊容易理解。
paper 機會:中高。空間圖樣 + stage-specific + trajectory,有機會比「平均 beta」更像一篇生理表徵 paper。
期刊接受度:中高。關鍵在於你用的是可解釋降維、不是黑箱 end-to-end。

路線:Complexity / entropy / non-linear dynamics 指標,主打「睡眠深度不足/動態複雜度」
核心概念:用 wavelet entropy、permutation entropy 或其他 complexity 指標描述睡眠階段的動態結構差異;有研究指出 wavelet entropy 可反映失眠在不同睡眠期的複雜度變化。
為何適合 n≈55:你可以預先選定 2–4 個 complexity 指標(低維),不需切頻段;同時這類指標可被敘事成「睡眠保護機制/穩定性不足」而非純分類。
paper 機會:中。心理/睡眠期刊會問「臨床意義是什麼」:你要把它連回 microarousal/instability 與主觀睡眠感。
期刊接受度:中。只要你避免堆大量非線性指標造成多重比較,並用理論驅動預註冊/限制岔路,接受度會上升。

路線:Multi-view 融合改寫成「共享 vs 獨特成分」而不是單純 early/late fusion
核心概念:把臨床量表視為一個 view、EEG 指標視為另一個 view,用多區塊 latent 方法(例如 multi-block PLS、JIVE/linked component models、或簡化版 CCA)把「共同變異(shared)」與「EEG 獨特變異(unique)」拆開,再看哪一部分與 3TP/trajectory 對應。
為何適合 n≈55:這類方法的強項是降維與可視化,本質上更像心理學熟悉的因素/潛在變項框架,只是把 EEG 納入多區塊結構。
paper 機會:中高。它讓你可以把主張寫成:「BAI/BDI 捕捉到的 shared affective distress 與 EEG 指標的 unique neurophysiology,是兩條不同路徑指向 trajectory。」這是心理期刊很愛的敘事。
期刊接受度:高(若你用的是線性可解釋版本;避免 transformer/黑箱 fusion)。

路線:Normative modeling(偏 computational psychiatry 的精準個體偏離),把重點放在「偏離量」與異質性
核心概念:normative modeling 像「腦的生長曲線」,重點不是群體平均差,而是每個人的偏離(deviation score),用來研究異質性並連到臨床結局。它已被視為理解精神疾患異質性的重要框架。
為何適合 n≈55:你的樣本太小不適合重訓練大模型,但 normative modeling 的精髓是把個體放進參考分佈;你可以透過外部公開睡眠 EEG 資料建立參考(或用你手上的健康對照/較大資料庫若有),再把你 55 人映射為 deviation profiles。
paper 機會:中高(取決於你是否能取得/匹配外部 reference)。一旦做成,它天然就是「不是在苦撐 AUC」:你主打的是「同樣症狀的人,生理偏離模式不同,且偏離模式與 trajectory 相關」。
期刊接受度:中。心理/睡眠期刊會要求你清楚說明 reference 的可比性與偏離分數如何解釋;做得好反而很加分,因為它比黑箱 DL 更透明。

路線:Subtype / phenotype discovery(以穩健性為核心的探索性分群),主打「異質性可重現」
核心概念:用少量、理論導向的 EEG+臨床特徵做分群/潛在類別,並把重點放在 cluster stability、可解釋性與臨床意義,再檢驗 3TP/trajectory 與 cluster 的關聯。失眠異質性與多變項 subtyping 本來就是重要命題。
為何適合 n≈55:你必須把它做成「小而精」:限制特徵數、用穩健性驗證(bootstrap stability、consensus),避免過度宣稱。
paper 機會:中。若成功,它會是一篇 phenotype paper;但風險是 n=55 的分群很容易不穩定,需要你把「穩健性」當主結果之一。
期刊接受度:中(偏探索性;適合定位成 hypothesis-generating 或 Registered Report 走法)。

前三優先路線與具體落地版本

以下我用「可發表性 × 可行性 × 新意」幫你挑前三條,並依你要求標記:最保守但最能發 / 最有新意 / 最平衡。三條都刻意設計成:主論文不靠 ΔAUC 當賣點

優先路線:Periodic/aperiodic 分解的 hyperarousal 機制 paper(最保守但最能發)
你在此路線的主題不是「beta band」,而是:「失眠軌跡的 neurophysiology,究竟是 oscillatory peak、還是 aperiodic 背景改變?」這是一個心理/睡眠期刊能直接理解的機制問題。

資料版本怎麼選:用「新版逐 segment」或能追溯 epoch/stage 的版本;若你有 sleep stage scoring(N2/N3/REM/W),請分 stage 計算,避免把 stage composition 混進單一平均。

特徵/表示怎麼定義:

  • 每個 stage:aperiodic exponent、offset(或 intercept);再加少量 periodic peak 參數(例如 sigma peak power/center freq、alpha peak center freq、以及「參數化後」的 beta peak 或高頻 peak)。
  • 做「個體基準化」以減少 trait 差:例如用 wake 或 lights-off 前後的 baseline spectral slope 當參考,取 stage 的 deviation(文獻也有用 wake 做 slope adjustment 的思路)。
  • 重要:寫成「exponent 作為可能反映神經動力學的尺度參數」,並在方法端引用其可靠度與限制(避免過度宣稱 E/I)。

模型怎麼做:
主分析用透明的「臨床可讀」模型即可:

  • 以 3TP(二元)為 outcome:階層式或 Bayesian logistic(弱資訊先驗,等價於穩健 shrinkage,但敘事上更像心理/醫學統計),predictors 是少量 aperiodic/peak 特徵 + BAI_T1、BDI_T1(當 covariates)。
  • 把重點放在效果量與不確定性(OR、credible interval/CI),而不是 AUC。

主結果看什麼:

  • 「哪個頻譜參數(exponent/offset/peak)與 trajectory membership 相關,且在控制 BAI/BDI 後仍存在?」
  • 「傳統 band power(broad beta)在做 aperiodic 校正後是否縮水/消失?」這一段是你最強的論點之一:它把你從 band 切割的泥沼救出來,變成『過去大家用 beta 其實混了背景』的科學貢獻。

補充分析看什麼:

  • 重測或可靠度:若你沒有多夜,可以用分段(前半夜 vs 後半夜)當內部穩健性檢查;或用不同 PSD 估計法(Welch vs multitaper)做敏感度分析。
  • 若期刊要求預測:把 AUC 放在 supplement,並採用小樣本較穩健的評估策略(例如 repeated CV 或 bootstrap),但明確宣告「探索性」。

paper 賣點是什麼:

  • 跳脫任意 band:SpecParam/FOOOF 是被廣泛引用的頻譜參數化框架,能回應「後設切 upper beta」的可辯護性問題。
  • 把你的研究從「增量很小」改成「釐清機制成分」,心理/睡眠期刊會更買單。

優先路線:Sleep instability × 分佈特徵 × 層級建模(最平衡)
這條路線直接使用你手上最有價值的資產:segment-level EEG。你的主張會改成:「trajectory 的差異更像睡眠動態不穩定與間歇性唤醒,而不是平均 beta」。它同時扎根睡眠醫學(instability、microarousal、CAP)與心理學(主觀困擾、錯覺、負向情緒),而模型仍可保持透明。

資料版本怎麼選:以「新版逐 segment」為主;若你有 arousal scoring 或可偵測 microarousal,則把事件抽出(事件率/持續時間/聚集度)。若沒有事件標記,也能用分佈特徵作替代。

特徵/表示怎麼定義(建議只選 8–15 個,避免多重岔路):

  • 不穩定事件:CAP rate(或 proxy)、microarousal index、REM microarousal(若你研究錯覺或 REM 相關)。
  • 分佈特徵:對固定的 broad beta(或更保守地對「高頻總量 >16Hz」)、或對 aperiodic exponent,取 median、IQR、90th percentile、以及「高於個體基準」的 epochs 比例(intermittency)。
  • 變異/週期結構:例如 aperiodic slope 的時間序列做「fractal cycles」或 cycle irregularity 的簡化指標(每晚 cycle 長度的變異、峰谷幅度等),把「睡眠超晝律動態」納入。
  • complexity(可選一個):wavelet entropy 之類作為補充,連到「深睡不足/保護機制」。

模型怎麼做:

  • 主分析:以 subject 為單位的 logistic / Bayesian logistic,predictors 是上述低維特徵 + BAI/BDI(covariates)。
  • 或者(若你想真正改變建模單位):segment-level 的 hierarchical logistic(segments nested in subjects),用 random intercept(甚至 random slope)讓模型學到「同一人內」的變異,並避免把 segment 當獨立樣本。這會比 MIL/深網路更容易被期刊接受。

主結果看什麼:

  • 「不穩定性指標(例如 CAP rate / 高唤醒尾端比例)與 trajectory 的關聯效果量」,以及它是否在控制 BAI/BDI 後仍存在。
  • 你可以把結果寫成「同樣高 BAI/BDI 的人,若還有高不穩定/高尾端唤醒,較可能走向某 trajectory」——這是心理期刊最在乎的「增量意義」,但不必用 ΔAUC 來講。

補充分析看什麼:

  • 連結主觀睡眠(若你有):CAP/不穩定與主觀睡眠品質或錯覺的關係已有脈絡,做為 convergent validity。
  • 穩健性:對特徵萃取 pipeline 做小型 multiverse(例如 2 種 PSD、2 種 artifact 拒絕、2 種分佈指標定義),但把它當透明度工具而非 fishing

paper 賣點是什麼:

  • 直接把研究問題升級成「睡眠動態不穩定」與「間歇性 hyperarousal」,這是睡眠醫學語言;同時用分佈/尾端特徵避免後設切 upper beta。

優先路線:Normative modeling × EEG deviation profiles(最有新意)
這條路線的最強之處是:它從根本上把你從「AUC 增量」釋放,改用**個體偏離(deviation)**來講 trajectory 的異質性。這在 computational psychiatry 近年非常主流,也更符合你看到的「睡眠 EEG 很像個體指紋」:既然 trait 很強,那就不要硬做 group mean 差異,而是研究「偏離參考曲線」的型態。

資料版本怎麼選:

  • 你自己的 n=55 當 target cohort(含 3TP outcome)。
  • 你需要一個 reference:理想是外部大型 sleep EEG dataset(公開 PSG 或你可取得的健康樣本);你必須確保 montage、取樣率、stage scoring 與特徵萃取流程盡量一致,否則要在文中清楚討論可比性與限制。

特徵或表示怎麼定義:

  • 建議用最可比、最少岔路的特徵:aperiodic exponent/offset(分 stage)+ 少量 periodic peak 指標,或 CAP rate 這類明確臨床定義的指标。
  • 在 reference cohort 建立「特徵 = f(age, sex, stage, channel/region)」的 normative model,得到每個 target 個體的 deviation z-score(或其他偏離度量)。

模型怎麼做(主論文敘事):

  • 主 outcome 不是 AUC,而是:
    1. 「trajectory 組別是否呈現不同的 deviation 負荷(例如平均偏離、偏離的變異、偏離的空間分佈)」;
    2. 「是否存在不同 deviation profile 的子群,而這些 profile 與 3TP/trajectory 的關聯是否強於單純 mean power」。

主結果看什麼:

  • 你可以明確主張:即使平均功率差異不大(或 AUC 增量小),deviation profiles 仍能揭露 heterogeneity,這正是 normative modeling 被提出的價值之一。

補充分析看什麼:

  • reference 敏感度:用 2 個 reference(若可能)或做 harmonization 討論;把這當透明度而非追求顯著。
  • 若期刊需要預測:可以把 deviation score 當成 risk stratification 指標(例如高偏離群風險較高),這比硬拚 AUC 更能被臨床讀者理解。

paper 賣點是什麼:

  • 直接把你會遇到的「個體差 > 疾病差」問題,轉成論文的中心貢獻:用 precision brain health / deviation-based 的観點研究失眠軌跡。

期刊可接受的敘事與投稿策略

你要投心理學/睡眠醫學期刊而不是純 AI 期刊,關鍵不在於你用了多新的模型,而在於你能否把方法「翻譯」成臨床/理論語言,並對抗常見的審稿質疑(小樣本、overfitting、岔路、可重現性)。

把主論文目標改寫成「機制/異質性」:建議你的 paper 主旨用以下句型(擇一):

  • 「Sleep EEG markers of cortical hyperarousal and sleep instability differentiate insomnia symptom trajectories beyond baseline affective distress」——把 BAI/BDI 定位為 affective distress 的 shared 成分,EEG 定位為 neurophysiology。
  • 「Disentangling periodic and aperiodic EEG components clarifies the neurophysiology underlying insomnia trajectories」——把「不靠 band」寫成主要貢獻。

把預測指標降級為次要、並做透明呈現:若你仍需要呈現 prediction(不少期刊會期待),請把它放在 secondary aim 或 supplement,並遵循臨床預測模型透明度標準(例如 TRIPOD+AI 的精神):清楚交代資料分割/驗證、避免過度最佳化、報告不確定性。

正面處理「岔路」:你最怕的「事後切 upper beta」其實可以被你轉化成加分點——你可以在方法段落明確把「頻帶選擇岔路」寫成已知風險,並用事前定義、或 limited multiverse/sensitivity analysis 來顯示結論不依賴單一路徑。這能防守審稿人對可發表性的攻擊。

不要讓 paper 變成「小樣本 ML demo」:小樣本下若你把敘事押在 classifier performance,審稿會立刻把你拉進樣本量與 CV 偏差的戰場(而且你自己也已經厭倦)。把敘事押在機制/異質性,你反而可以引用小樣本下 AUC 不穩定與增量難解釋來合理化「為何我們不以 ΔAUC 作為核心」。

明確結論

你原本的研究問題「哪裡設錯」:
你把 EEG 的價值綁在「對一個已經很強的心理量表 baseline 做 ΔAUC 增量」,同時又用最容易稀釋訊號的表示(subject-level mean band power)。在 n≈55 的條件下,這個設定幾乎注定只能得到「理論上可能有訊號、但增量很小且不穩定」的結果。

哪些是「應該放棄的框架」:

  • 把 paper 主賣點寫成「BAI/BDI + mean beta → AUC 小幅提升」,以及任何把分析焦點推回「怎麼讓 AUC 講得更好聽」的路徑。
  • 以探索結果回頭定義主頻段(upper beta)當 confirmatory main story;除非你願意把它明確標示為 exploratory,或以 multiverse/預註冊方式處理岔路。
  • 在沒有外部驗證的前提下,把小樣本 classifier 表現當作主要貢獻(尤其是單次 CV 結果)。

如果是我,我會叫你停止做什麼:
停止把研究設計鎖在「單一 band mean + 增量 AUC」;停止把 upper beta 當成主文的核心頻段遊戲;停止用更多模型技巧去抵抗一個本質上不友善的 framing。

我會叫你立刻改做什麼:
立刻把主論文改成「機制/不穩定/異質性」導向,並優先實作兩件事:

  1. periodic/aperiodic 分解(SpecParam/FOOOF)做 stage-specific features,主打釐清 hyperarousal 的頻譜成分;
  2. 用 segment-level 版本抽取 sleep instability 與分佈/尾端特徵(CAP/microarousal 或其 proxy),把 trajectory 的差異說成「不穩定與間歇性唤醒」而非平均值。

哪條路才不是在「苦撐 AUC」:
最明確的答案是:Normative modeling(deviation profiles)sleep instability/分佈型表徵。它們把你的核心貢獻從「分類表現」移到「個體偏離與機制異質性」,這更貼近當代睡眠醫學與 computational psychiatry 對 biomarker 的期待。

你要我給的那句最直接判斷:
你現在最該拋棄的舊框架是:「把 paper 的成敗押在 BAI/BDI 已很強的前提下,用 subject-level mean beta power 去換一點點 ΔAUC。」