Skip to content
This repository was archived by the owner on Nov 25, 2024. It is now read-only.

drovosekovanton/Skillfactory_game

Repository files navigation

Skillfactory_game

Репозиторий является рабочими файлами задания на самостоятельную работу в рамках учёбы на курсе "Python для работы" (платформа Skillfactory).

Задание представляет собой вариант проведения аналитических работ по конкретному датасету.

Получившийся ноутбук документирован, текст исследования и соответствующий код расположены вместе.

Исходные файлы:

Предоставлен датасет с kaggle.com: Smart meters in London.

Требуется:

Выбрать из предложенного для работы датасета те файлы, которые планируется анализировать, извлечь из них нужную информацию и предоставить её в виде отчёта о факторах, влияющих на уровень потребления электрической энергии.

Файлы репозитория:

Skillfactory_game.ipynb - ноутбук для запуска в Google Colab. С минимальными изменениями кода раздела "Импорт используемых библиотек" он также может работать и как локальный Jupyter notebook. Является предпочтительным способом просмотра результатов выполнения задания.

Relations diagram.pdf - схема взаимосвязей отдельных файлов датасета.

Skillfactory_report - печатная версия ноутбука (pdf|html).

Актуальный набор данных для работы

В процессе работы датасет дополнялся и изменялся.

Произведённые изменения:

  • файлы в папках halfhourly_dataset и daily_dataset.csv были запакованы в zip-архивы для уменьшения места на диске и увеличения скорости работы с ними;
  • папка daily_dataset.csv переименована в daily_dataset
  • вручную очищен uk_bank_holidays.csv, убрана лишняя текстовая информация о переносе праздников и произведена корректировка неверного отображения апострофов.

Созданные файлы:

  • файлы из папки halfhourly_dataset были преобразованы к часовым отсчётам (суммированием потреблённой энергии по каждому счётчику) и размещены в папке hourly_dataset. Названия файлов сохранены без изменения;
  • добавлен файл hourly_energy_use.csv с суммарным почасовым потреблением электроэнергии всеми домохозяйствами;
  • добавлены файлы std_hour_energy.csv и tou_hour_energy.csv с почасовыми средними значениями потребления электроэнергии всех домохозяйств с соответствующим типом учёта потребления (стандарт или повременной).

Созданные файлы с данными можно получить, раскомментировав и запустив соответствующий код из ноутбука.

Репозиторий архивирован 25.11.2024, убраны ссылки на Google Drive.

About

Skillfactory's "Python for work" additional task

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published