Skip to content

Latest commit

 

History

History
166 lines (124 loc) · 3.82 KB

File metadata and controls

166 lines (124 loc) · 3.82 KB

YouTube 视频处理测试报告

测试日期

2026-01-03

测试视频

https://www.youtube.com/watch?v=HRNkFK9g2-8

测试方案

方案 1: YouTube Transcript MCP

  • 工具: @kimtaeyoon83/mcp-server-youtube-transcript
  • 配置位置: ~/.claude/mcp_config.json
  • 状态: ✅ 已安装并配置

方案 2: video-processor Skill

  • 来源: iamzhihuix/happy-claude-skills
  • 配置位置: ~/.claude/settings.json
  • 状态: ✅ 已安装并启用
  • 依赖: yt-dlp, ffmpeg, openai-whisper ✅ 已安装

测试结果

问题:YouTube 反机器人保护

两个方案都遇到了相同的问题:

ERROR: [youtube] HRNkFK9g2-8: Sign in to confirm you're not a bot.
Use --cookies-from-browser or --cookies for the authentication.

原因

  • YouTube 检测到自动化访问
  • 需要浏览器 cookies 来绕过验证
  • 这是 YouTube 的标准反爬虫机制

解决方案

方案 A: 使用浏览器 Cookies(推荐)

1. 导出浏览器 Cookies

Chrome/Edge:

# 安装 cookies 导出工具
pip install browser-cookie3

# 或使用 Chrome 扩展
# Get cookies.txt LOCALLY (https://chrome.google.com/webstore/detail/get-cookiestxt-locally/cclelndahbckbenkjhflpdbgdldlbecc)

手动导出:

  1. 在浏览器中登录 YouTube
  2. 打开开发者工具 (F12)
  3. 进入 Application → Cookies → youtube.com
  4. 复制所有 cookies

2. 配置 yt-dlp 使用 Cookies

方法 1: 使用浏览器 cookies

# 修改 video_processor.py 脚本,添加 cookies 参数
yt-dlp --cookies-from-browser chrome "https://youtube.com/..."

方法 2: 使用 cookies 文件

# 创建 cookies.txt 文件
yt-dlp --cookies cookies.txt "https://youtube.com/..."

方案 B: 使用第三方 API

1. YouTube Data API v3

  • 需要 Google Cloud API Key
  • 可以获取视频元数据和字幕
  • 免费配额:每天 10,000 单位

2. 第三方字幕服务

  • downsub.com
  • youtubetranscript.com
  • 需要手动操作或付费 API

方案 C: 使用代理或 VPN

# 使用代理
yt-dlp --proxy socks5://127.0.0.1:1080 "https://youtube.com/..."

修复步骤

快速修复(推荐)

  1. 安装 Chrome 扩展

    • 安装 "Get cookies.txt LOCALLY"
    • 访问 YouTube 并登录
    • 导出 cookies.txt
  2. 修改 video_processor.py

    # 在 download 函数中添加
    ydl_opts = {
        'cookiefile': '/path/to/cookies.txt',
        # ... 其他选项
    }
  3. 重新测试

    uv run video_processor.py download "https://youtube.com/..." --info

长期解决方案

创建一个配置文件 ~/.config/yt-dlp/config:

--cookies-from-browser chrome
--no-check-certificate

当前状态

✅ 已完成

  • YouTube Transcript MCP 安装和配置
  • video-processor skill 安装和配置
  • 所有依赖安装(yt-dlp, ffmpeg, whisper)
  • 问题诊断和解决方案文档

⏸️ 待完成

  • 配置浏览器 cookies
  • 重新测试两个方案
  • 验证视频下载和转录功能

替代测试方案

如果无法解决 YouTube 验证问题,可以:

  1. 测试本地视频文件

    # 使用 video-processor 处理本地视频
    uv run video_processor.py transcribe local_video.mp4 output.txt
  2. 使用其他视频平台

    • Vimeo
    • Dailymotion
    • 直接视频 URL
  3. 手动下载后处理

    • 手动从 YouTube 下载视频
    • 使用 video-processor 进行转录

结论

两个方案的技术实现都是正确的,问题在于 YouTube 的反机器人保护。需要配置浏览器 cookies 才能正常使用。

推荐方案

  1. 使用 Chrome 扩展导出 cookies
  2. 配置 yt-dlp 使用 cookies
  3. 重新测试两个方案

备选方案

  • 使用 YouTube Data API v3
  • 手动下载视频后使用 video-processor 转录
  • 使用第三方字幕服务