Projeto criado com o intuito de aplicar orientação a objetos a um processo de ETL, com objetivo de desenvolver 3 Classes usando a linguagem de programação Python, o banco de dados MySQL, Jupyter Notebook, Git e Github.
Desafio consiste em extrair um arquivo csv de músicas populares do Spotify, efetuar um tratamento de dados e disponibilidar os dados em um banco de dados MySQL utilizando as 3 Classes em Python. São elas:
Extract: responsável por extrair os dados do arquivo CSV de origem e criar um DataFrame com a biblioteca pandas.
Transform: responsável por efetuar o tratamento das colunas, reitirando caracters especias.
Load: responsável por utilizar o SqlAlchemy para efetuar o inserção dos dados no banco de dados MySQL.
- 1 – POP OS: sistema operacional que utiliza kernel Linux, baseado no Ubuntu Linux da Canonicol
- 2 – Python: linguagem de programação
- 3 – Git: software para gerenciamento de versões
- 4 – GitHub: plataforma de hospedagem de código
- 5 – MySQL: banco de dados relacional
- 7 – Visual Studio Code: Editor de código
O projeto foi bem simples, mas auxiliou no estudo para relembrar e aprender os seguintes conceitos:
- 1 – Programação Orientação a Objetos
- 2 – Controle de verões de bibliotecas no Python
- 3 – Porque utilizar orientação a objetos na Engenharia de dados
