Skip to content

Dudas PCA - Train_test_split -Normalizacion #102

Open
@FernandoSMG

Description

@FernandoSMG

Hola, al realizar la reducción de dimensionalidad usando PCA , que resulta exactamente en ambas columnas? no logro entender bien el resultado, encuentro un set de puntos pero no logro diferenciarlos.

Por otro lado, tengo una duda al realizar la separación entre el test de entrenamiento y test. Al revisar la documentación de Scikit Learn encontré el metodo GridSearchCV que tiene como parametros el modelo a "tunear" y la cantidad de folds utilizados utilizados ya que usa Stratified K Fold para encontrar los parametros optimos. Luego este se ajusta al modelo de entrenamiento.
Esta situacion va relacionada a la normalizacion de columnas. En otra Issue se comenta que al normalizar se debe tener cuidado con normalizar los set de validacion y testeo usando informacion del set de entrenamiento, se normaliza cada Fold por separado. En este sentido, la pregunta es si defino previamente los set de training y test usando KFold en la separacion de datos es correcto utilizar Grid Search CV.

Muchas gracias de antemano

Metadata

Metadata

Assignees

No one assigned

    Labels

    Lab/ActDudas de laboratorios o actividades

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions