NDCLab
diff --git a/‎code/preprocessing-eeg/64ch_bv_montage_csd.csd‎
Lines changed: 66 additions & 0 deletions b/‎code/preprocessing-eeg/64ch_bv_montage_csd.csd‎
Lines changed: 66 additions & 0 deletions
diff --git a/‎code/preprocessing-eeg/compute_erp_means.py‎
Lines changed: 117 additions & 0 deletions b/‎code/preprocessing-eeg/compute_erp_means.py‎
Lines changed: 117 additions & 0 deletions
diff --git a/‎code/preprocessing-eeg/compute_means_ICPS.py‎
Lines changed: 156 additions & 0 deletions b/‎code/preprocessing-eeg/compute_means_ICPS.py‎
Lines changed: 156 additions & 0 deletions
@@ -0,0 +1,66 @@
+// MatLab   Sphere coordinates [degrees]         Cartesian coordinates
+// Label       Theta       Phi    Radius         X         Y         Z       off sphere surface
+       1      90.000      73.000       1.000    0.0000    0.2924    0.9563   0.00000000000000000
+       2     120.000      56.000       1.000   -0.2796    0.4843    0.8290   0.00000000000000000
+       3     180.000      56.000       1.000   -0.5592    0.0000    0.8290   0.00000000000000000
+       4     146.000      39.000       1.000   -0.6443    0.4346    0.6293  -0.00000000000000022
+       5     102.000      39.000       1.000   -0.1616    0.7602    0.6293   0.00000000000000000
+       6     126.000      22.000       1.000   -0.5450    0.7501    0.3746   0.00000000000000000
+       7     162.000      22.000       1.000   -0.8818    0.2865    0.3746   0.00000000000000000
+       8     168.000       5.000       1.000   -0.9744    0.2071    0.0872   0.00000000000000000
+       9     134.000       5.000       1.000   -0.6920    0.7166    0.0872   0.00000000000000000
+      10      99.000       5.000       1.000   -0.1558    0.9839    0.0872   0.00000000000000000
+      11     122.000     -10.000       1.000   -0.5219    0.8352   -0.1736  -0.00000000000000011
+      12     154.000     -12.000       1.000   -0.8792    0.4288   -0.2079   0.00000000000000000
+      13     170.000     -29.000       1.000   -0.8613    0.1519   -0.4848  -0.00000000000000022
+      14     136.000     -29.000       1.000   -0.6291    0.6076   -0.4848  -0.00000000000000011
+      15     144.000     -46.000       1.000   -0.5620    0.4083   -0.7193   0.00000000000000000
+      16     110.000     -61.000       1.000   -0.1658    0.4556   -0.8746   0.00000000000000000
+      17     -90.000      73.000       1.000    0.0000   -0.2924    0.9563   0.00000000000000000
+      18     240.000      56.000       1.000   -0.2796   -0.4843    0.8290   0.00000000000000000
+      19     258.000      39.000       1.000   -0.1616   -0.7602    0.6293   0.00000000000000000
+      20     214.000      39.000       1.000   -0.6443   -0.4346    0.6293   0.00000000000000000
+      21     198.000      22.000       1.000   -0.8818   -0.2865    0.3746   0.00000000000000022
+      22     234.000      22.000       1.000   -0.5450   -0.7501    0.3746   0.00000000000000000
+      23     -90.000      22.000       1.000    0.0000   -0.9272    0.3746   0.00000000000000000
+      24     236.000       5.000       1.000   -0.5571   -0.8259    0.0872   0.00000000000000000
+      25     202.000       5.000       1.000   -0.9237   -0.3732    0.0872   0.00000000000000000
+      26     190.000     -12.000       1.000   -0.9633   -0.1699   -0.2079   0.00000000000000000
+      27     222.000     -12.000       1.000   -0.7269   -0.6545   -0.2079   0.00000000000000022
+      28     254.000     -12.000       1.000   -0.2696   -0.9403   -0.2079   0.00000000000000000
+      29     238.000     -29.000       1.000   -0.4635   -0.7417   -0.4848  -0.00000000000000011
+      30     206.000     -29.000       1.000   -0.7861   -0.3834   -0.4848  -0.00000000000000011
+      31     191.000     -46.000       1.000   -0.6819   -0.1325   -0.7193   0.00000000000000000
+      32     251.000     -46.000       1.000   -0.2262   -0.6568   -0.7193   0.00000000000000000
+      33       0.000      90.000       1.000    0.0000    0.0000    1.0000   0.00000000000000000
+      34      60.000      56.000       1.000    0.2796    0.4843    0.8290   0.00000000000000000
+      35       0.000      56.000       1.000    0.5592    0.0000    0.8290   0.00000000000000000
+      36      34.000      39.000       1.000    0.6443    0.4346    0.6293  -0.00000000000000022
+      37      79.000      39.000       1.000    0.1483    0.7629    0.6293   0.00000000000000000
+      38      90.000      22.000       1.000    0.0000    0.9272    0.3746   0.00000000000000000
+      39      54.000      22.000       1.000    0.5450    0.7501    0.3746   0.00000000000000000
+      40      18.000      22.000       1.000    0.8818    0.2865    0.3746   0.00000000000000000
+      41      12.000       5.000       1.000    0.9744    0.2071    0.0872   0.00000000000000000
+      42      46.000       5.000       1.000    0.6920    0.7166    0.0872  -0.00000000000000011
+      43      81.000       5.000       1.000    0.1558    0.9839    0.0872   0.00000000000000000
+      44      58.000     -10.000       1.000    0.5219    0.8352   -0.1736   0.00000000000000000
+      45      26.000     -12.000       1.000    0.8792    0.4288   -0.2079   0.00000000000000022
+      46      10.000     -29.000       1.000    0.8613    0.1519   -0.4848  -0.00000000000000022
+      47      44.000     -29.000       1.000    0.6291    0.6076   -0.4848  -0.00000000000000011
+      48      36.000     -46.000       1.000    0.5620    0.4083   -0.7193   0.00000000000000000
+      49     -60.000      56.000       1.000    0.2796   -0.4843    0.8290   0.00000000000000000
+      50     -78.000      39.000       1.000    0.1616   -0.7602    0.6293   0.00000000000000000
+      51     -34.000      39.000       1.000    0.6443   -0.4346    0.6293  -0.00000000000000022
+      52     -18.000      22.000       1.000    0.8818   -0.2865    0.3746   0.00000000000000000
+      53     -54.000      22.000       1.000    0.5450   -0.7501    0.3746   0.00000000000000000
+      54     -90.000       5.000       1.000    0.0000   -0.9962    0.0872   0.00000000000000000
+      55     -56.000       5.000       1.000    0.5571   -0.8259    0.0872   0.00000000000000022
+      56     -22.000       5.000       1.000    0.9237   -0.3732    0.0872   0.00000000000000000
+      57     -10.000     -12.000       1.000    0.9633   -0.1699   -0.2079  -0.00000000000000011
+      58     -42.000     -12.000       1.000    0.7269   -0.6545   -0.2079   0.00000000000000022
+      59     -74.000     -12.000       1.000    0.2696   -0.9403   -0.2079   0.00000000000000022
+      60     -90.000     -29.000       1.000    0.0000   -0.8746   -0.4848  -0.00000000000000011
+      61     -58.000     -29.000       1.000    0.4635   -0.7417   -0.4848  -0.00000000000000011
+      62     -26.000     -29.000       1.000    0.7861   -0.3834   -0.4848  -0.00000000000000011
+      63     -11.000     -46.000       1.000    0.6819   -0.1325   -0.7193   0.00000000000000000
+      64     -71.000     -46.000       1.000    0.2262   -0.6568   -0.7193   0.00000000000000000
@@ -0,0 +1,117 @@
+import mne
+import io
+import numpy as np
+import scipy.io
+import pandas as pd
+from glob import glob
+import datetime
+import time
+import h5py
+
+session = "s2_r1"
+laplacian = False
+
+dataset_path = "/home/data/NDClab/datasets/thrive-dataset/"
+analysis_path = "/home/data/NDClab/analyses/thrive-theta-ddm/"
+
+outputHeader = [
+    'id',
+    'ERN_soc', 'CRN_soc', 'ERN_nonsoc', 'CRN_nonsoc',
+    'ERN_min_CRN_diff_soc', 'ERN_min_CRN_diff_nonsoc',
+    # 'PE_error_soc', 'PE_corr_soc', 'PE_error_nonsoc', 'PE_corr_nonsoc',
+    # 'PE_err_min_corr_diff_soc', 'PE_err_min_corr_diff_nonsoc'
+]
+
+output_data = pd.DataFrame()
+
+clustCell= [
+    [i-1 for i in [1, 2, 33, 34]],
+    # [i-1 for i in [17, 49, 50, 19, 18]],
+]
+
+timeCell = [
+    [0, 100], # ERN cluster
+    # [300, 500], # PE cluster
+]
+
+if laplacian:
+    path_to_mat = glob(f"{analysis_path}/derivatives/preprocessed/erp_check/{session}/thrive_Resp_erps_csd_min_6t_*2025*.mat")[0]
+else:
+    path_to_mat = glob(f"{analysis_path}/derivatives/preprocessed/erp_check/{session}/thrive_Resp_erps_min_6t_*2025*.mat")[0]
+    #path_to_mat = glob(f"{analysis_path}/derivatives/preprocessed/erp_check/{session}/thrive_Resp_erps_min_6t_02_11_2025_15_17_33.mat")[0]
+
+path_to_eeg = glob(f"{dataset_path}/derivatives/preprocessed/sub-3000001/{session}/eeg/sub-3000001_all_eeg_processed_data_{session}_e1.set")[0]
+
+mat = scipy.io.loadmat(path_to_mat)
+allData = mat['erpDat_data']
+
+# take IDs from EEG (all people > 6 trials)
+sub_from_eeg = [int(mat["erpDat_subIds"][i].item()[0]) for i in range(len(mat["erpDat_subIds"]))] 
+
+EEG = mne.io.read_epochs_eeglab(path_to_eeg, verbose=False)
+
+EEG_times = EEG.times * 1000
+startTime = -400
+endTime = -200
+
+startIdx = np.argmin(np.abs(EEG_times-startTime)) # get start index for baseline
+endIdx = np.argmin(np.abs(EEG_times-endTime)) # get end index for baseline
+
+allBase = np.squeeze(np.mean(allData[:, :, :, startIdx:endIdx+1], 3))
+allBase = np.mean(allData[:, :, :, startIdx:endIdx+1], 3)
+newData = np.zeros_like(allData)
+
+for i in range(allData.shape[3]):
+    newData[:, :, :, i] = allData[:, :, :, i] - allBase # baseline correction
+
+# %round EEG.times to nearest whole ms to make easier to work with
+# EEG.times = round(EEG.times);
+
+output_data[outputHeader[0]] = sub_from_eeg
+
+# initialize index var at 1 because i=0 is the column for subject ids
+i = 1
+for comp in range(len(clustCell)):
+
+    cluster= clustCell[comp]
+    times = timeCell[comp]
+
+    compStartTime = times[0] # in ms
+    compEndTime = times[1] # in ms
+
+    compStartIdx = np.argmin(np.abs(EEG_times-compStartTime))
+    compEndIdx = np.argmin(np.abs(EEG_times-compEndTime))
+
+    s_resp_incon_error_avgTime = np.mean(newData[:, 0:1, :, compStartIdx:compEndIdx+1], 3)
+    s_resp_incon_corr_avgTime = np.mean(newData[:, 1:2, :, compStartIdx:compEndIdx+1], 3)
+    ns_resp_incon_error_avgTime = np.mean(newData[:, 2:3, :, compStartIdx:compEndIdx+1], 3)
+    ns_resp_incon_corr_avgTime = np.mean(newData[:, 3:4, :, compStartIdx:compEndIdx+1], 3)
+
+    # average cluster of interest
+    s_resp_incon_error_avgTimeClust = np.mean(s_resp_incon_error_avgTime[:, :, cluster], 2)
+    s_resp_incon_corr_avgTimeClust = np.mean(s_resp_incon_corr_avgTime[:, :, cluster], 2)
+    ns_resp_incon_error_avgTimeClust = np.mean(ns_resp_incon_error_avgTime[:, :, cluster], 2)
+    ns_resp_incon_corr_avgTimeClust = np.mean(ns_resp_incon_corr_avgTime[:, :, cluster], 2)
+
+    # compute difference scores
+    s_resp_incon_error_avgTimeClust_diff = s_resp_incon_error_avgTimeClust - s_resp_incon_corr_avgTimeClust
+    ns_resp_incon_error_avgTimeClust_diff = ns_resp_incon_error_avgTimeClust - ns_resp_incon_corr_avgTimeClust
+
+    output_data[outputHeader[i]] = s_resp_incon_error_avgTimeClust
+    output_data[outputHeader[i+1]] = s_resp_incon_corr_avgTimeClust
+    output_data[outputHeader[i+2]] = ns_resp_incon_error_avgTimeClust
+    output_data[outputHeader[i+3]] = ns_resp_incon_corr_avgTimeClust
+    output_data[outputHeader[i+4]] = s_resp_incon_error_avgTimeClust_diff
+    output_data[outputHeader[i+5]] = ns_resp_incon_error_avgTimeClust_diff
+    i+=6
+
+output_data
+output_data = output_data.iloc[:, :5]
+if laplacian:
+    output_data.columns = [i + "_laplacian" if i != "id" else i for i in output_data.columns]
+output_data = output_data.rename({"id": "sub"}, axis=1)
+
+if laplacian:
+    output_data.to_csv("{analysis_path}/derivatives/csv/{session}/thrive_erp_laplacian.csv", index=False)
+else:
+    output_data.to_csv(f"{analysis_path}/derivatives/csv/{session}/thrive_erp.csv", index=False)
@@ -0,0 +1,156 @@
+import io
+import numpy as np
+import matplotlib.pyplot as plt
+import scipy.io
+import pandas as pd
+from glob import glob
+import datetime
+import time
+import re
+import h5py
+
+
+session = "s2_r1"
+dataset_path = "/home/data/NDClab/analyses/thrive-theta-ddm/"
+
+arr_path = f"{dataset_path}/derivatives/preprocessed/TF_arrays/{session}/"
+helper_data = h5py.File(
+    glob(f"{dataset_path}/derivatives/preprocessed/TF_outputs/{session}/resp/seed_1/TF/sub-*.mat")[0]
+)
+
+freqs = helper_data['frequency'][:]
+times = helper_data['ds_time'][:]
+ch_locs = [str(i) for i in range(1, 65)]
+
+
+# NOT DIFFERENCE ICPS
+
+thrive_data = pd.read_csv(f"{dataset_path}/derivatives/behavior/{session}/summary.csv")["sub"].to_frame()
+
+measures = [
+    "ICPS",
+]
+conditions = [
+    "resp_s_i_0",
+    "resp_s_i_1",
+    # "resp_s_c_1",
+    "resp_ns_i_0",
+    "resp_ns_i_1",
+    # "resp_ns_c_1",
+            ]
+
+for m in measures:
+    for c in conditions:
+        for band in [
+            "theta",
+             # "delta"
+                    ]:
+            for window in [
+                "early",
+                "late"
+            ]:
+                for cluster in [
+                    "DLPFC_L",
+                    "DLPFC_R",
+                    "OCC_L",
+                    "OCC_R",
+                    "MOTOR_L",
+                    "MOTOR_R",
+                    #"CENTRAL"
+                ]:
+                    if cluster == "DLPFC_L":
+                        ch = ['6', '9']
+                    elif cluster == "DLPFC_R":
+                        ch = ['39', '42']
+                    if cluster == "OCC_L":
+                        ch = ['22', '24']
+                    elif cluster == "OCC_R":
+                        ch = ['53', '55']
+                    elif cluster == "MOTOR_L":
+                        ch = ['3', '7']
+                    elif cluster == "MOTOR_R":
+                        ch = ['35', '40']
+                    elif cluster == "CENTRAL":
+                        ch = ['19', '50']
+                        
+                    if band == "theta":
+                        fmin = 4
+                        fmax = 7
+                    elif band == "delta":
+                        fmin = 1
+                        fmax = 3
+    
+                    if window == "early":
+                        tmin = 0
+                        tmax = 250
+                    elif window == "late":
+                        tmin = 256
+                        tmax = 504
+                        
+                    fmin_idx = np.argmin(np.abs(freqs-fmin))
+                    assert freqs[fmin_idx] == fmin, "Check your freqs!"
+                    fmax_idx = np.argmin(np.abs(freqs-fmax))
+                    assert freqs[fmax_idx] == fmax, "Check your freqs!"
+                    
+                    tmin_idx = np.argmin(np.abs(times-tmin))
+                    # assert times[tmin_idx] == tmin, "Check your times!"
+                    tmax_idx = np.argmin(np.abs(times-tmax))
+                    # assert times[tmax_idx] == tmax, "Check your times!"
+                    
+                    ch_idx = []
+                    for channel in ch:
+                        if channel in ch_locs:
+                            ch_idx.append(ch_locs.index(channel))
+                    
+                    # sub_idx = scipy.io.loadmat(f"{arr_path}/idx_{c}.mat")["sub_idx"][0]-1 # make it 0-based again
+                    tf_df = pd.DataFrame(columns = ["sub", f"{m}_{c}_{band}_{window}_{cluster}"])
+                    tf_arr = scipy.io.loadmat(f"{arr_path}/{m}_{c}.mat")
+                    sub_ids = tf_arr['subjects']
+                    pattern = r'sub-(\d+)'
+                    sub_ids = [int(re.search(pattern, i).group(1)) for i in sub_ids]
+                    tf_data = tf_arr[f"{m}_{c}"]
+                    assert tf_data.shape[1:] == (64, 375, 59), f"Check your {m} data!"
+                    
+                    # for sub_id in sub_idx:
+                    for sub_id in range(tf_data.shape[0]):
+                        # sub_avg = np.mean(tf_data[sub_id, :, :, :], 0)
+                        sub_avg = tf_data[sub_id, :, :, :]
+                        assert sub_avg.shape == (64, 375, 59), f"Check your {m} data!"
+                        
+                        ch_avg = np.mean(sub_avg[ch_idx, :, :], 0)
+                        assert ch_avg.shape == (375, 59), f"Check your {m} data!"
+                        
+                        time_avg = np.mean(ch_avg[tmin_idx:tmax_idx+1, :], 0)
+                        assert len(time_avg) == 59 and time_avg.ndim == 1, f"Check your {m} data!"
+                        freq_avg = np.mean(time_avg[fmin_idx:fmax_idx+1], 0)
+                    
+                        tf_df.loc[sub_id, "sub"] = sub_ids[sub_id]
+                        tf_df.loc[sub_id, f"{m}_{c}_{band}_{window}_{cluster}"] = freq_avg
+                    
+                    thrive_data = thrive_data.merge(tf_df, on="sub", how="left")
+
+thrive_data = thrive_data[
+[i for i in thrive_data.columns if ("delta" not in i or i == "sub")]
+]
+
+colnames = list(thrive_data.columns)
+for i, c in enumerate(colnames[1:]):
+    i+=1
+    splitted_list = c.split("_")
+    if splitted_list[2] == "s":
+        splitted_list[2] = "soc"
+    elif splitted_list[2] == "ns":
+        splitted_list[2] = "nonsoc"
+    if splitted_list[4] == "0":
+        splitted_list[4] = "err"
+    elif splitted_list[4] == "1":
+        splitted_list[4] = "corr"
+    splitted_list[1] = ""
+    splitted_list[5] = ""
+    splitted_list[3] = ""
+    splitted_list = [i for i in splitted_list if i!=""]
+    colnames[i] = "_".join(splitted_list)
+
+thrive_data.columns = colnames
+
+thrive_data.to_csv(f"{dataset_path}/derivatives/csv/{session}/thrive_icps.csv", index=False)