Skip to content

Sistema de recomendação de filmes em R, utilizando a biblioteca recommenderlab. Compara diferentes algoritmos de Filtragem Colaborativa (UBCF, IBCF) e Fatoração de Matrizes (SVD, LIBMF) nos datasets MovieLens e TMDB (ou similar)

Notifications You must be signed in to change notification settings

BayesTheory/R-Movie-Recommender-System

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Sistema de Recomendação de Filmes em R com recommenderlab

Este repositório contém scripts em R para construir, analisar e comparar diferentes algoritmos de sistemas de recomendação de filmes, utilizando principalmente a biblioteca recommenderlab. As análises são realizadas sobre dois datasets populares: MovieLens e um dataset derivado do TMDB.

Objetivo

O objetivo principal é explorar e avaliar a performance de vários métodos de recomendação, incluindo:

  • Filtragem Colaborativa Baseada no Usuário (UBCF): Recomenda itens com base em usuários com gostos similares .
  • Filtragem Colaborativa Baseada no Item (IBCF): Recomenda itens similares àqueles que o usuário já gostou .
  • Fatoração de Matrizes (SVD, LIBMF, ALS): Métodos que decompõem a matriz usuário-item para encontrar fatores latentes e prever avaliações .

A comparação é feita utilizando métricas como Curvas ROC e Precisão/Recall.

Datasets Utilizados

Este projeto utiliza dois conjuntos de dados (incluídos como arquivos .csv no repositório):

  1. MovieLens: Um dataset clássico para pesquisa em sistemas de recomendação (provavelmente uma versão como 100k ou similar).
    • movies.csv
    • ratings.csv
  2. TMDB (The Movie Database) - Derivado: Um dataset maior com informações de filmes e avaliações.
    • movies2.csv
    • ratings2.csv

Metodologia

Ambos os scripts seguem passos similares:

  1. Carregamento de Bibliotecas: Importa as bibliotecas necessárias em R.
  2. Carregamento e Limpeza dos Dados: Lê os arquivos CSV, trata valores ausentes (NA).
  3. Análise Exploratória de Dados (EDA): Visualiza a distribuição das notas, contagem de votos, gêneros, datas de lançamento, etc., usando ggplot2.
  4. Pré-processamento para recommenderlab: Converte os dataframes de avaliações para o formato realRatingMatrix, normaliza as notas e filtra usuários/itens com poucas avaliações.
  5. Cálculo de Similaridade: Explora similaridade entre usuários e itens usando cosseno e Pearson.
  6. Construção e Treinamento dos Modelos: Define um esquema de avaliação (evaluationScheme) e treina múltiplos modelos (Recommender) como UBCF, IBCF, SVD, LIBMF, ALS.
  7. Avaliação dos Modelos: Utiliza a função evaluate para comparar os modelos com base em métricas como ROC e Precisão/Recall, gerando gráficos comparativos.

About

Sistema de recomendação de filmes em R, utilizando a biblioteca recommenderlab. Compara diferentes algoritmos de Filtragem Colaborativa (UBCF, IBCF) e Fatoração de Matrizes (SVD, LIBMF) nos datasets MovieLens e TMDB (ou similar)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages