11月初的結果(數據更新之前):

  • 總人數68人(49:19)

  • 當時做的潛在樣本分析: 潛在樣本分析


12/30 統整後的結果:

300

  • 具有三次ISI數據ISI_T1, ISI_T2, ISI_T3300
  • 若加入條件,除了三次ISI數據ISI_T1, ISI_T2, ISI_T3,還需要有完整的HRV_SDNN_MS, HRV_LF_HF, HRV_LF, BDI_T1, BAI_T1
    • 500
    • 新增名單:
      • 失眠組 (3人):陳品蓉、黃宣云、羅方妤
      • 控制組 (3人):孟芝宇、吳姿靚、胡銘倫

大致ML結果:

  • 用新資料51人去跑,有做平衡(class_weight=balanced),失眠組的數字仍然上不去(紅色框框處,預測pos)

800

用12/31統整的資料給老師excel


將HRV做Log+標準化

2025.1.2

  • 預測Pos (失眠組),結果有提升 800

2026.1.2 跟學長討論結果

  • ISI跟PSQI應該要有正相關?!(越睡不著,睡眠狀況應該要越差) 👉目前樣本結果相反:
    • ISI:(HRV_SDNN_MS, HRV_LF_HF, HRV_LF, BDI_T1, BAI_T1
      • 3TP = 0 (健康組):35 人 (佔 68.6%)
      • 3TP = 1 (失眠組):16 人 (佔 31.4%)
    • PSQI:(HRV_SDNN_MS, HRV_LF_HF, HRV_LF, BDI_T1, BAI_T1
      • Good (5, 睡眠品質好):29 人 (24.8%)
      • Poor (>5, 睡眠品質差):88 人 (75.2%)

2026.1.7 重新用Transformer當EEG Filter 後,重新計算Lasso Regression

目前的Lasso Regression

/Users/yuchi/PycharmProjects/PsyMl_Data/.venv/bin/python /Users/yuchi/PycharmProjects/PsyMl_ISI/ML/tools/lasso_ranking.py 
[模式] 排除模式
[防洩漏] 移除 22 個 T2/T3 欄位

[資料] 來源=isi_raw_data_transformer_abs  目標=3TP  樣本=80  特徵=363
  已排除群組:['ACS', 'CDRISC', 'CPT', 'EEF', 'EF', 'ERQ', 'IGT']
  總缺值比例:37.33%

[CV結果](分數 = neg_log_loss,越大越好 → log_loss 越小)
  lambda_min:C = 0.135296  |  lambda = 7.39123
  lambda_1SE:C = 0.0316228  |  lambda = 31.6228

[選入變項(1SE)] 以 |係數| 排序(前 30)
  (無變項被選入;可放寬正則或檢查特徵)

[對照] lambda_min 非零變項數:2,lambda_1SE 非零變項數:0

[選入變項(lambda_min)] 以 |係數| 排序(前 30)
                  coef  abs_coef
EEG_BETA2_F3  0.169693  0.169693
EEG_ALPHA_O2 -0.085377  0.085377

[Top 10(路徑峰值)] 不綁定單一 C
SELF_EFFICACY_SCALE
             HRV_LF
       EEG_ALPHA_O2
                AGE
       EEG_DELTA_P3
       EEG_DELTA_T5
    WCST_PERS_ERR_T
      HRV_RESP_RATE
       EEG_ALPHA_P4
       EEG_DELTA_C4

目前找到的文獻雖然對「位置與頻段」有正相關,但是好像都是MDD的研究(順帶提到可能MDD影響睡眠)👉 所以雖然頻率位置很漂亮,但可能要用其他方法處理特徵
側偏化問題:
  • 有可能是Lasso Regression 會只抓一邊:
  • 用左右相關係數做計算(table=eeg_lr_corrs
  - corr(EEG_BETA2_F3, EEG_BETA2_F4) = **0.845483580166179** (n=269)
  - corr(EEG_ALPHA_O1, EEG_ALPHA_O2) = **0.646293406646129** (n=269)
  - corr(EEG_ALPHA_P3, EEG_ALPHA_P4) = **0.474380195853508** (n=269)
  - corr(EEG_DELTA_P3, EEG_DELTA_P4) = **0.282011457379088** (n=269)
  • 發現前額葉(F3, F4)的相關度高,高度懷疑是Lasso算法把另一邊(F4)壓成0

EEG特徵&原本HRV特徵比較關聯性:

  • HRV_EKG_HR有跑入,剩下都是EEG的天下

Users/yuchi/PycharmProjects/PsyMl_Data/.venv/bin/python /Users/yuchi/PycharmProjects/PsyMl_ISI/ML/tools/lasso_ranking.py 
[模式] 允許模式
[防洩漏] 移除 14 個 T2/T3 欄位

[資料] 來源=isi_raw_data_transformer_abs  目標=3TP  樣本=80  特徵=348
  已排除群組:['ACS', 'CDRISC', 'CPT', 'EEF', 'EF', 'ERQ', 'IGT', 'WCST']
  總缺值比例:38.66%

[CV結果](分數 = neg_log_loss,越大越好 → log_loss 越小)
  lambda_min:C = 0.142779  |  lambda = 7.00383
  lambda_1SE:C = 0.0316228  |  lambda = 31.6228

[選入變項(1SE)] 以 |係數| 排序(前 30)
  (無變項被選入;可放寬正則或檢查特徵)

[對照] lambda_min 非零變項數:3,lambda_1SE 非零變項數:0

[選入變項(lambda_min)] 以 |係數| 排序(前 30)
                  coef  abs_coef
EEG_BETA2_F3  0.186152  0.186152
EEG_ALPHA_O2 -0.107496  0.107496
EEG_DELTA_O1 -0.010816  0.010816

[Top 10(路徑峰值)] 不綁定單一 C
      EEG_DELTA_P3
      EEG_ALPHA_O2
      EEG_DELTA_C4
        HRV_EKG_HR
      EEG_THETA_P3
EEG_DELTA_F3F4_AVG
      EEG_ALPHA_P4
      EEG_DELTA_T5
     EEG_ALPHA2_PZ
     EEG_HGAMMA_C3

EEG_ALPHA_O1,EEG_ALPHA_O2,EEG_BETA2_F3,EEG_BETA2_F4 加上BAI_D1, BDI_T1跑ML(未加權)

  • AUC目前最高
  • F1_pos:多模型可以跑0.7UP (目前最高)