commit-live-students · tracedence · Jan 31, 2019 · Jan 31, 2019 · Jan 31, 2019
diff --git a/__pycache__/__init__.cpython-36.pyc b/__pycache__/__init__.cpython-36.pyc
diff --git a/q01_load_data/__pycache__/__init__.cpython-36.pyc b/q01_load_data/__pycache__/__init__.cpython-36.pyc
diff --git a/q01_load_data/__pycache__/build.cpython-36.pyc b/q01_load_data/__pycache__/build.cpython-36.pyc
diff --git a/q01_load_data/build.py b/q01_load_data/build.py
@@ -1,4 +1,13 @@
+# %load q01_load_data/build.py
 import pandas as pd
 
 # Write your code below
-
+def load_data(path):
+    df = pd.read_csv(path, sep=';',)
+    return df
+
+
+path = 'data/student-mat.csv'
+load_data(path)
+
+
diff --git a/q01_load_data/tests/__pycache__/__init__.cpython-36.pyc b/q01_load_data/tests/__pycache__/__init__.cpython-36.pyc
diff --git a/q01_load_data/tests/__pycache__/test.cpython-36.pyc b/q01_load_data/tests/__pycache__/test.cpython-36.pyc
diff --git a/q02_data_split/__pycache__/__init__.cpython-36.pyc b/q02_data_split/__pycache__/__init__.cpython-36.pyc
diff --git a/q02_data_split/__pycache__/build.cpython-36.pyc b/q02_data_split/__pycache__/build.cpython-36.pyc
diff --git a/q02_data_split/build.py b/q02_data_split/build.py
@@ -1,8 +1,20 @@
+# %load q02_data_split/build.py
 from greyatomlib.multivariate_regression_project.q01_load_data.build import load_data
 from sklearn.model_selection import train_test_split
 import pandas as pd
 df = load_data('data/student-mat.csv')
 
 # Write your code below
+def split_dataset(df):
 
+    X = df.iloc[:,:-1]
+    y = df.iloc[:,-1]
+    X_train, X_test, y_train, y_test = train_test_split(X,y, test_size = 0.20)
 
+    return X_train, X_test, y_train, y_test
+
+X_train, X_test, y_train, y_test= split_dataset(df)
+print('shape: ', X_train.shape)
+X_train.head()
+X_test.head()
+
diff --git a/q02_data_split/tests/__pycache__/__init__.cpython-36.pyc b/q02_data_split/tests/__pycache__/__init__.cpython-36.pyc
diff --git a/q02_data_split/tests/__pycache__/test.cpython-36.pyc b/q02_data_split/tests/__pycache__/test.cpython-36.pyc
diff --git a/q03_data_encoding/__pycache__/__init__.cpython-36.pyc b/q03_data_encoding/__pycache__/__init__.cpython-36.pyc
diff --git a/q03_data_encoding/__pycache__/build.cpython-36.pyc b/q03_data_encoding/__pycache__/build.cpython-36.pyc
diff --git a/q03_data_encoding/build.py b/q03_data_encoding/build.py
@@ -1,3 +1,4 @@
+# %load q03_data_encoding/build.py
 from greyatomlib.multivariate_regression_project.q01_load_data.build import load_data
 from greyatomlib.multivariate_regression_project.q02_data_split.build import split_dataset
 from sklearn.preprocessing import LabelEncoder
@@ -8,7 +9,18 @@
 x_train, x_test, y_train, y_test =  split_dataset(df)
 
 # Write your code below
+def label_encode(X_train, X_test):
+    label = LabelEncoder()
+    for col in x_train.columns:
+        X_train[col] = label.fit_transform(X_train[col])
+        X_test[col] = label.fit_transform(X_test[col])
 
+    X_train_transform = X_train
+    X_test_transform = X_test
+    return X_train_transform, X_test_transform
 
 
 
+
+
+
diff --git a/q03_data_encoding/tests/__pycache__/__init__.cpython-36.pyc b/q03_data_encoding/tests/__pycache__/__init__.cpython-36.pyc
diff --git a/q03_data_encoding/tests/__pycache__/test.cpython-36.pyc b/q03_data_encoding/tests/__pycache__/test.cpython-36.pyc