Skip to content

PyotrAndreev/youtube-insight-2025

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📊 youtube-insight-2025

Анализ трендов на YouTube для бизнеса: находите популярные темы, создавайте востребованный контент и эффективно продвигайте продукцию или услуги.


🎯 Основные возможности

📈 Анализ трендов
  • Инструменты мониторинга: YouTube Trends, Analytics 🔍
  • Google Trends: сезонность, долгосрочные тренды 📅
  • Сторонние сервисы: VidIQ, TubeBuddy, Social Blade 💡
📈 Рейтинг вовлечённости

Можем анализировать рейтинг вовлечённости:

  • по годам (добавить: разбивку по видео от времени создания колонками в график по годам)
  • отдельно по видео
🤝 Инфлюенсер-маркетинг
  • Поиск и фильтрация каналов по ключевым словам и подписчикам 🎥
  • Извлечение контактов: email, соцссылки 📧
  • Сохранение данных в PostgreSQL, кеширование processed_ids.txt 🗄️
👍 YouTube Likes Tracker

Скрипт для периодического сбора числа лайков через API returnyoutubedislikeapi.com, сохранения истории в SQLite и уведомлений при превышении порога.

Возможности:

  • Запрос текущего числа лайков по списку видео
  • Сохранение истории в базе SQLite + логирование
  • Оповещения при достижении порога

Сфера применения:

  • уведомление автора при наборе определенного количества лайков, как следствие лучшее взаимодействие с аудиторией

Требования:

  • Python 3.7+
  • Библиотеки: requests, sqlite3, logging
🔍 YouTube Scraper

Скрипт для поиска YouTube-каналов по запросам, фильтрации по подписчикам, извлечения контактной информации и сохранения в PostgreSQL.

Основное:

  • Автопереключение API-ключей при превышении квоты
  • Поиск каналов по ключевым словам и сортировка по просмотрам
  • Фильтрация по минимуму подписчиков
  • Извлечение email и соцссылок из описания
  • Сохранение в таблицу bloggers, кеширование processed_ids.txt, логирование

Требования:

  • Python ≥ 3.8
  • Библиотеки: google-api-python-client, python-dotenv, psycopg2-binary
  • Запущенный PostgreSQL
🛠 YouTube Shorts creator
  • Загрузка видео: yt-dlp ⬇️
  • Нарезка: MoviePy + FFmpeg ✂️
  • Анализ аудио: Librosa + SpeechEmotionRecognition_Realtime 🎵
  • Генерация шортсов/превью: Ollama 🤖

Основная идея:

  • увеличение скорости нарезки видео на shorts для развития и набора подписчиков канала

Проблемы:

  • скорость нарезки средняя
  • при нарезки длинного видео может быть долгая обработка и нарезка
  • могут быть не найдены самые вирусные моменты
  • риски теневого бана
💬 Анализ комментариев под видео

Основная идея:

Идея заключается в анализе комментариев под видео на YouTube с целью кластеризации их по темам, тонам и интересам. Это позволяет выделить ключевые темы, понять предпочтения аудитории и выявить улучшения для контента.

Чем может быть полезно:

  • Понимание интересов аудитории: какие темы и форматы нравятся зрителям 🎯
  • Улучшение контента: адаптация будущих видео под запросы аудитории 🎨
  • Увеличение вовлеченности: релевантный контент повышает лайки и просмотры 📈
  • Выявление проблем: устранение негативных моментов и критики ⚠️
  • Идеи для новых видео: подсказки по темам и направлениям 💡

Какой результат:

  • Кластеризированные темы: группы комментариев (похвалы, критика, запросы, вопросы)
  • Рекомендации: конкретные шаги для улучшения ("больше видео про X", "улучшить звук")
  • Список запросов: топ упоминаемых тем для новых роликов
  • Анализ тональности: процент положительных, нейтральных и отрицательных комментариев 😊😐😞

Описание графика

Качество кластеризации довольно низкое. Названия кластеров неинформативны.

Описание графика

📊 Анализ видео у конкурентов

Основная идея:

Анализ видео других блогеров по заданной теме: просмотры, лайки, комментарии и другие метрики. Помогает выявить успешные форматы и подходы, а также избегать ошибок.

Чем может быть полезно:

  • Понимание трендов: какие аспекты темы популярны у аудитории 🔥
  • Оценка конкуренции: кто уже в нише и как показали себя их видео 🏅
  • Идеи для улучшения: форматы, длина, стиль подачи, графика 🎥
  • Избежание ошибок: учёт неудачных примеров ❌
  • Оптимизация стратегии: незанятые подниши и новые подходы 🚀

Какой результат:

  • Список блогеров: авторы по теме, подписчики, каналы

  • Анализ метрик: таблицы/графики с просмотрами, лайками, комментариями

  • Рейтинг успешности: вовлечённость (лайки+комментарии)/просмотры 🏆

  • Выводы по форматам: обзор лучших типов контента (обзоры, инструкции и т.д.)

  • Рекомендации: советы по созданию на основе успешных и неудачных примеров

    Описание графика

Полезные ссылки:

На данном сайте можно посмотреть, как изменялось количество подписчиков на канале: https://socialblade.com/youtube

🔧 Техническая часть
comments_clustering.py

Функционал: очистка текста, лемматизация, векторизация SentenceTransformer, K-Means + t-SNE, анализ центров кластеров.

Результат: диаграмма кластеров, топ‑3 комментария к каждому, метрики Silhouette, Calinski‑Harabasz, Davies‑Bouldin.

comments_summary.py

Использует Ollama (модель Llama3) для суммаризации списка комментариев.

diagrams_connected_with_comments.py
  • Столбчатая диаграмма средней длины комментариев по каналам
  • График зависимости числа комментариев от длины комментария
  • График зависимости числа комментариев от длительности видео
engagement.py
  • Сортировка каналов по вовлечённости (лайки+комментарии)/просмотры
  • Отдельные графики: лайки и комментарии в разных категориях
clustering.py

Аналогично comments_clustering, для других типов данных.

correlation.py

Сбор метаданных через VideoRepository, создание DataFrame, матрица корреляций и тепловая карта.

diagrams.py
  • Точечный и линейный графики зависимости длительности видео от просмотров.
parsing_find_channel_id.py

Парсинг HTML, поиск Channel ID, сохранение новых каналов в БД.

update_video_channel_id.py

Установка поля channel_id: перебор каналов и их видео, обновление записей, где channel_id пуст.

update_new_columns.py
  • get_channel_stats(): статистика канала через API YouTube
  • print_channel_info(): обновление данных каналов в БД
search_for_similar_videos.py

Косинусная схожесть эмбеддингов, фильтрация по лайкам, топ‑3 похожих видео с метриками вовлечённости.

helper.py
  • get_video_info_by_category(): статистика по категориям (просмотры, лайки, комментарии)
  • get_video_info_by_channel(): агрегирует по каналам (фильтрация по category_id)
  • get_video_info_by_manual_category(): анализ по пользовательским тематикам
Продукты-понкуренты
  • Cуммаризация ютуб-видео с Gemini и деплой с Google Cloud Run: tutorial, GitHub
  • viewstats

🚀 Установка и запуск

# Клонировать репозиторий
git clone https://github.com/your-org/youtube-insight-2025.git
cd youtube-insight-2025

# Установить зависимости
pip install -r requirements.txt

📚 Использование

# Анализ трендов и генерация отчётов
python search_for_similar_videos.py
python diagrams.py
python correlation.py
python clustering.py
python comments_clustering.py


# Обработка видео и создание шортсов
python video_processor.py https://www.youtube.com/watch?v=VIDEO_ID

🔗 Контакты и обратная связь

  • 💬 Telegram:
    • Артур (@Mariavbgh) - Backend-разработка, аналитика данных, интеграции API
    • Алиса (@alice6_6) - Анализ данных, интеграция API, кластеризация данных
    • Пётр Андреев (@PyotrAndreev) - Ментор, наставник

Спасибо за использование youtube-insight-2025! 🙏

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •