Этот проект представляет собой анализ реального набора данных о поездках на такси в Нью-Йорке. Датасет включает информацию о времени поездок, погодных условиях и праздниках, что позволяет исследовать зависимости между спросом на такси и внешними факторами.
Каждая строка в датасете содержит агрегированные данные о поездках за один час в одном из районов Нью-Йорка.
- pickup_dt – период (точность до часа)
- pickup_month – месяц
- borough – район Нью-Йорка (5 районов + аэропорт)
- pickups – число поездок за период (час)
- hday – является ли день праздничным/выходным (Y/N)
- spd – скорость ветра (мили/час)
- vsb – видимость
- temp – температура (℉)
- dewp – точка росы (℉)
- slp – давление
- pcp_01 – осадки за 1 час
- pcp_06 – осадки за 6 часов
- pcp_24 – осадки за 24 часа
- sd – глубина снега (дюймы)
- Загрузка и первичная обработка данных с использованием pandas
- Исследование распределения поездок по времени и районам
- Анализ влияния погодных условий на количество поездок
- Определение зависимости между праздничными днями и спросом на такси
- Визуализация данных для нахождения инсайтов
- Работа с pandas (загрузка, обработка и анализ данных)
- Визуализация данных с помощью matplotlib и seaborn
- Работа с временными рядами
- Исследовательский анализ данных (EDA)
- Python (pandas, numpy, matplotlib, seaborn)
- Jupyter Notebook
В ходе проекта проводится исследовательский анализ данных (EDA), позволяющий выявить закономерности и факторы, влияющие на спрос на такси в Нью-Йорке.