-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathsupermarket.R
72 lines (56 loc) · 2.13 KB
/
supermarket.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
# Tratamiento de datos
# ==============================================================================
library(dplyr)
library(tidyr)
library(skimr)
library(ISLR)
# Gráficos
# ==============================================================================
library(ggplot2)
library(ggpubr)
library(rpart)
library(rpart.plot)
library(dlookr)
library(plotly)
library(hrbrthemes) # temas/colores de ggplot2
library(gridExtra) # crear composiciones de imágenes con ggplot2
library(grid) # poner textos dentro de la composición de plots
# Correlación
library(Hmisc)
library(GGally) # matrix plot por grupos
library(ggstatsplot) # graficos para publicaciones
# Modelos estadísticos:
library(MASS)
library(glmulti)
# Machine learning supervisado
library(caret)
# Pintar arboles de decision
library(rattle)
#Leemos los datos:
supermarket <- read.csv("Curso Analisis de Datos/KAGGLE/supermarket_sales.csv")
datos = supermarket
#Nombres de las columnas y filas:
colnames(supermarket)
row.names(supermarket)
#Letura de las diez primeras y últimas filas:
head(supermarket, 10)
tail(supermarket, 10)
# Tipos de varibales. Construimos un data frame con el nombre de las variables y la columnas que corresponde:
aux = as.data.frame(t(t(sapply(supermarket, class))))
colnames(aux) <- "Tipo de Variable"
aux$Numero_Columna = seq(nrow(aux))
aux
# Ejemplo de cambiar numerica a factor = cualitativa
supermarket$Sucursal <- as.factor(supermarket$Sucursal)
supermarket$Tipo_Cliente <- as.factor(supermarket$Tipo_Cliente)
supermarket$Forma_Pago <- as.factor(supermarket$Forma_Pago)
supermarket$Fecha <- as.character(supermarket$Fecha)
supermarket$Genero <- as.factor(supermarket$Genero)
# Ordenar los niveles dentro de un factor
supermarket$Sucursal <- factor(supermarket$Sucursal, levels = c("A", "B","C"))
supermarket$Tipo_Cliente <- factor(supermarket$Tipo_Cliente, levels = c("Member", "Normal"))
supermarket$Forma_Pago <- factor(supermarket$Forma_Pago, levels = c("Cash", "Ewallet","Credit card"))
supermarket$Genero <- factor(supermarket$Genero, levels = c("Male", "Female"))
skim(supermarket)
# Explorar los tipos de variables y valores perdidos:
plot(overview_na(supermarket))