added

zabir-nabil · zabir-nabil · commit 8a990bb7a437 · 2020-10-17T00:47:22.000+06:00
diff --git a/README.md b/README.md
@@ -26,3 +26,6 @@
 2. Slope Prediction
    * To train **slopes model** run `python train_slopes.py`
    * trained model weights and results will be saved inside `hyp.results_dir`
+3. Quantile Regression
+   * To train **qreg model** run `python train_qreg.py`
+   * trained model weights and results will be saved inside `hyp.results_dir`
diff --git a/config.py b/config.py
@@ -26,15 +26,17 @@ def __init__(self, model_type):
             self.data_folder = 'data_download'
             self.ct_tab_feature_csv = 'train_data_ct_tab.csv' # some extra features
             self.strip_ct = .15 # strip this amount of ct slices before randomly choosing
-            self.n_tab = 4 # number of tabular features used
+            self.n_tab = 7 # number of tabular features used
 
             # select which models to train
-            self.train_models = ['resnet18', 'resnet34', 'resnet50', 'resnet101', 'resnet152', 'resnext50', 'resnext101', 'efnb0', 'efnb1', 'efnb2', 'efnb3', 'efnb4', 'efnb5', 'efnb6', 'efnb7'] 
+            self.train_models = ['resnet18' , 'resnet34', 'resnet50', 'resnet101', 'resnet152', 'resnext50', 'resnext101', 'efnb0', 'efnb1', 'efnb2', 'efnb3', 'efnb4', 'efnb5', 'efnb6', 'efnb7'] 
 
             self.gpu_index = 0
             self.results_dir = "results_qreg"
             self.nfold = 5
             self.n_epochs = 40
-            self.batch_size = 16
+            self.batch_size = 8
             self.final_lr = 0.0002
-            self.loss_weight = 0.8
+            self.loss_weight = 0.7
+            self.dummy_training = False
+            self.dummy_train_rows = 400
diff --git a/data_download/kaggle.json b/data_download/kaggle.json
@@ -1 +1 @@
-{"username":"","key":""}
+{"username":"furcifer","key":"a73ac16faa29a969df960d96ae52a411"}
diff --git a/train_qreg.py b/train_qreg.py
@@ -94,10 +94,13 @@ def get_base_Percent(data):
 train_data = get_base_FVC(train_data)
 
 
+
+
 # tabular feature generation
 
 def get_tab(df):
-    vector = [(df.Age.values[0] - train.Age.values.mean()) /  train.Age.values.std()] # df.Age.values[0].mean(), df.Age.values[0].std()
+    # print(df)
+    vector = [(df.Age.values[0] - train_data.Age.values.mean()) /  train_data.Age.values.std()] # df.Age.values[0].mean(), df.Age.values[0].std()
     
     if df.Sex.values[0] == 'Male':
         vector.append(0)
@@ -113,7 +116,12 @@ def get_tab(df):
     else:
         vector.extend([1,0]) # this is useless
         
-    vector.append((df.Volume.values[0] - train.Volume.values.mean()) /  train.Volume.values.std())
+    vector.append((df.Volume.values[0] - train_data.Volume.values.mean()) /  train_data.Volume.values.std())
+    
+    vector.append((df.baseline_week.values[0] - train_data.baseline_week.values.mean()) /  train_data.baseline_week.values.std())
+    
+    vector.append((df.base_FVC.values[0] - train_data.base_FVC.values.mean()) /  train_data.base_FVC.values.std())
+    
     return np.array(vector) 
 
 
@@ -148,11 +156,13 @@ def __getitem__(self, idx):
         pid = all_features[0]
         fvc = []
         fvc.append(all_features[2])
+        # print(self.train_df.iloc[[idx]])
+        feature_set = get_tab(self.train_df.iloc[[idx]])
         try:
             i = np.random.choice(self.train_data[pid], size=1)[0]
             img = get_img(f'{root_path}/train/{pid}/{i}')
             x.append(img)
-            tab.append(all_features[1:5])
+            tab.append(feature_set)
         except Exception as e:
             print(e)
             print('error')
@@ -405,11 +415,12 @@ def hyb_loss(outputs,target,l):
 # need to edit from here
 
 # cut data
-train_data = train_data.iloc[range(100)]
+if hyp.dummy_training:
+    train_data = train_data.iloc[range(hyp.dummy_train_rows)]
 
 for model in train_models:
     log = open(f"{result_dir}/{model}.txt", "a+")
-    kfold =KFold(n_splits=nfold)
+    kfold = KFold(n_splits=nfold)
     
     ifold = 0
     for train_index, test_index in kfold.split(train_data):  
@@ -582,4 +593,5 @@ def hyb_loss(outputs,target,l):
 
 
 # ref: https://www.kaggle.com/miklgr500/linear-decay-based-on-resnet-cnn
+# https://www.kaggle.com/furcifer/q-regression-with-ct-tabular-features-pytorch
 # https://pytorch.org/docs/stable/index.html

Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-{"username":"","key":""}`
	`1`	`+{"username":"furcifer","key":"a73ac16faa29a969df960d96ae52a411"}`