Preferra

Preferra is a full-stack recommender system built to provide personalized and content-based recommendations. It supports two main modes of recommendation:

User → Movie (personalized)
Movie → Movie (similar items)

Current domain: Movies (MovieLens 100k). Designed to extend to Books and Learning.

Features

Hybrid strategy: UserCF → ItemCF → LightFM fallback
Fast inference via preprocessed artifacts in data/processed/
Clean API (FastAPI) with CORS enabled
Modern React + TypeScript frontend (Vite + shadcn/ui)
Reproducible notebooks documenting the pipeline

Tech Stack

Backend: Python 3.11, FastAPI, Uvicorn, NumPy, Pandas, scikit‑learn, LightFM
Frontend: React 18, TypeScript, Vite, Tailwind, shadcn/ui, React Router, TanStack Query
Data: MovieLens 100k (data/ml-100k/), processed artifacts (data/processed/)

Repository Structure

app/ — FastAPI and engines
- main.py (API routes)
- recommender.py (hybrid logic)
- cf_engines.py (UserCF, ItemCF)
- lightfm_engine.py (LightFM model, item embeddings)
- utils.py (load CSV/Pickle artifacts, similarity)
frontend/ — React app (Vite, TS, shadcn/ui)
- src/App.tsx, src/pages/ (Movies, Books, Learning, Settings)
- src/components/ (UI), src/hooks/, src/lib/
- package.json, bun.lockb, vite.config.ts
data/
- ml-100k/ (raw)
- processed/ (artifacts: movies_processed.csv, ratings_processed.csv, item_cf_top10.csv, maps & matrices)
notebooks/ — numbered pipeline (01…09)
requirements.txt, .venv/, unzip.py

Workflow

flowchart TD
  A[User] --> B["Frontend React_TS"]
  B --> C["API FastAPI"]

  C -->|User_to_Movie| D1[UserCF]
  C -->|User_to_Movie_few| D2[ItemCF]
  C -->|Coldstart| D3[LightFM]

  subgraph Data
    E1[(data/ml-100k)]
    E2[(data/processed)]
  end

  D1 <-- read --> E2
  D2 <-- read --> E2
  D3 <-- read --> E2
  F["Notebooks 01-09"] --> E2
  F <-- read --> E1

  C --> B --> A

Decision logic (app/recommender.py):

If user rated ≥ min_rated_user (default 5): UserCF
Else if user rated ≥ min_rated_item (default 2): ItemCF
Else: LightFM

API (app/main.py)

GET /recommend/user/{user_id}?top_n=10
- Returns: list of { movie_idx, title }
GET /recommend/movie/?movie_name=...&top_n=5
- Returns: list of { movie_idx, title } or { error }

CORS: allows http://localhost:8081 (adjust for your frontend dev URL).

Backend: Run

Create venv and install

python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

Ensure artifacts exist in data/processed/
Start API

uvicorn app.main:app --reload --host 0.0.0.0 --port 8000

Frontend: Run

Using npm (package.json scripts):

cd frontend
npm install
npm run dev

(Or Bun if preferred: bun install && bun dev)

Notebooks (Pipeline)

01_data_loader.ipynb — load + EDA
02_sparse_matrix.ipynb — sparse UI matrix, indexing
03_baseline_popularity.ipynb
04_baseline_user_cf.ipynb
05_baseline_item_cf.ipynb
06_evaluation_comparision.ipynb
07_inference_engine.ipynb
08_lightfm_engine.ipynb
09_hybrid_final_inference.ipynb

Outputs saved to data/processed/:

CSV: movies_processed.csv, ratings_processed.csv, item_cf_top10.csv, top_100_popular.csv
Pickle: user_item_matrix.pkl, user_id_map.pkl, movie_id_map.pkl

Frontend Routes (`src/App.tsx`)

/ — Index
/movies — Movies recommender UI
/books — Books (placeholder for future)
/learning — Learning (placeholder for future)
/settings — Settings

Troubleshooting

CORS: update allow_origins in app/main.py to match frontend URL (e.g., http://localhost:5173).
Missing artifacts: re-run notebooks or copy required files to data/processed/.
Import errors: run with uvicorn app.main:app from repo root; ensure .venv active.

Roadmap

Books recommender (authors/genres content features)
Learning recommender (course metadata + engagement signals)
API: search endpoint and richer schemas (genres/year/score)
Caching and pagination for large responses

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.ipynb_checkpoints		.ipynb_checkpoints
anaconda_projects/db		anaconda_projects/db
app		app
data		data
frontend		frontend
notebooks		notebooks
src		src
._README.md		._README.md
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
Untitled.ipynb		Untitled.ipynb
requirements.txt		requirements.txt
unzip.py		unzip.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Preferra

Features

Tech Stack

Repository Structure

Workflow

API (app/main.py)

Backend: Run

Frontend: Run

Notebooks (Pipeline)

Frontend Routes (`src/App.tsx`)

Troubleshooting

Roadmap

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Preferra

Features

Tech Stack

Repository Structure

Workflow

API (app/main.py)

Backend: Run

Frontend: Run

Notebooks (Pipeline)

Frontend Routes (src/App.tsx)

Troubleshooting

Roadmap

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Frontend Routes (`src/App.tsx`)

Packages