-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathanalise_cluster.R
40 lines (30 loc) · 1.03 KB
/
analise_cluster.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
# Análise de Cluster (Análise de Agrupamentos)
##Descrição: Utiliza algoritmos de clustering (como K-means) para agrupar indivíduos com base em características semelhantes.
##Vantagens: Identifica grupos naturais na população.
##Desvantagens: Requer software estatístico e pode ser complexo.
#Carregamento dos dados
data("dados")
df=scale(dados)
head(df, n=3)
# Número ótimo de clusters
library(factoextra)
fviz_nbclust(df, kmeans, method = "wss")+
geom_vline(xintercept = 4, linetype = 2)
# Clusterização k-means
set.seed(123)
km.res=kmeans(df, 4, nstart=25)
print(km.res)
aggregate(dados, by=list(cluster=km.res$cluster), mean)
mtcars2=cbind(dados, cluster=km.res$cluster)
head(dados)
km.res$centers
# Vizualizando os clusters
library(ggplot2)
library(factoextra)
fviz_cluster(km.res, data=dados,
palette = c("#2E9FDF", "#00AFBB", "#E7B800", "#FC4E07"),
ellipse.type="euclid",
star.plot=TRUE,
repel=TRUE,
ggtheme=theme_minimal()
)