Skip to content

erikzhuang55/Bilitato

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

33 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Bilitato 快速入门

Bilitato是一款利用AI大模型帮助你高效观看Bilibili视频的免费开源浏览器插件。支持一键下载音视频、自动解析字幕、无字幕视频转录、总结内容、划分章节、广告识别,内容验真,还可以直接向AI提问视频内容。支持自定义API、模型和Prompt。

插件介绍

Summary Ad Chat Real Download

用Figma顺手做的,如果觉得不好看请见谅..

支持的浏览器

Bilitato是一个基于Chromium内核开发的浏览器插件,理论上适配所有Chromium内核主流浏览器(例如Chrome、Edge、Opera、夸克、QQ浏览器等),不支持Safari。如果你不确定自己的浏览器是否是Chromium内核,你也可以下载试试能否正常安装,很大概率是可以的。

安装Bilitato

Bilitato已经在Google插件商店上架啦!插件地址:https://chromewebstore.google.com/detail/bilitato-ai%E9%99%AA%E4%BD%A0%E7%9C%8Bb%E7%AB%99/ggddcgdafeeoijoaohcffinbefcbpcga

你可以直接在Google浏览器插件商店中搜索并加载在浏览器里,Bilitato会自动嵌入B站页面中,无需任何额外操作。你也可以在github直接下载插件文件,在Google或其他浏览器插件页面加载文件夹即可。 image

工作原理

Bilitato和很多AI总结插件一样,并不直接解析视频画面,也无法读取视频内嵌的字幕,而是抓取B站官方自带的AI字幕,并根据字幕内容实现总结、分段等功能。AI生成的字幕质量会因Up主发音、语速而异,也可能无法正确识别某些专有名词。Bilitato已经针对这种问题进行了专门的Prompt优化,字幕的偶发错误不会影响最终生成的总结、分段等AI功能的质量。

如何判断是否有AI字幕:

image

5分钟使用指南(懒人版):选平台->填Key->填模型名

Bilitato本身不是AI大模型!它只是一个搬运工,把视频内容搬运给AI大模型,再把AI大模型生成的内容搬到你面前。每次你打算和AI对话,就好像在点外卖,需要选一个外卖平台,选一个店铺,那Bilitato就是个不要配送费的骑手。(Bilitato相对于其他大部分AI总结插件的一大特点就是,不强制收取配送费)

API平台就是外卖平台,里面有各种各样可以调用的模型。虽然Bilitato不要配送费,但是商家要餐费,这个餐费就是你每次调用API的花费。

不过好在有很多API平台提供慷慨的免费额度,就好像外卖平台发的免单优惠券。所以,薅各种平台的免费额度就是Bilitato最推荐的打开方式。

Bilitato强烈推荐ModelScope作为API平台(并非恰饭,也希望ModelScope看到能打广告费)。ModelScope每天提供2000次免费模型调用次数,足以胜任日常所需。下面以ModelScope为例,展示如何获取API Key和模型名:

1.注册ModelScope API平台(1分钟)

注册网址:https://modelscope.cn/my/access/token

2初次注册需要进行阿里云绑定(2分钟)

image

3. 点击左侧访问控制->新建访问令牌->复制得到的Key(30秒)

image

4.在Bilitato的设置中选择Provider为ModelScope,将Key填入。(30秒)

image

5.在模型库中选择模型(20秒)

image

每个模型有不同的每日调用额度(可能随ModelScope政策而调整)。例如:

  • Kimi-K2.5(50次/天)
  • MiniMax-M2.5(100次/天)
  • Deepseek-R1/V3(20次/天)
  • Qwen3/3.5系列(500次/天)
  • GLM-4.5/4.7/5系列(50次/天) 建议选择图中红框模型,带闪电标志的为支持调用的模型。如果不知道选啥,就填moonshotai/Kimi-K2.5就行。

6.将模型名复制进设置中(注意斜杠前的也要)(30秒)

image

一定要写moonshotai/Kimi-K2.5,而不是Kimi-K2.5,区分大小写。

image

7.开用!

除此之外,也有其他提供免费额度的API平台,例如阿里百炼注册免费赠送100w token(覆盖Qwen系列等)、火山方舟免费赠送50w token(覆盖豆包等)、硅基流动、智谱的GLM-4.7-Flash免费无限次使用(当然有请求次数和速度限制)等等..只要你想,总能找到免费的API额度。你在某书和Github上也能找到各自免费API平台推荐。使用方法也是大差不差,选平台、填Key、填模型名。

音频转录API Key获取(需要魔法上网)

Bilitato支持对无AI字幕的视频进行分析,具体原理是调用ASR大模型(默认使用Groq平台的whisper-large-v3-turbo模型)对视频音频进行转录。Bilitato推荐使用提供免费ASR模型额度的Groq平台,每天免费提供2000次whisper-large-v3/whisper-large-v3-turbo的调用。 注册网址:https://console.groq.com/keys

image

方法还是一样的。注册->获取API Key->填入即可。

image

主要功能

  1. 一键下载 Bilitato支持一键按分辨率和解码格式下载视频(最高支持4k)、音频、字幕(srt格式)。

  2. 自动解析AI字幕 Bilitato会自动读取B站AI字幕并在播放器侧边显示。字幕会跟随视频播放自动滚动,可任意搜索并点击跳转,轻松跟上视频节奏。

  3. 无AI字幕视频读取* 没有AI字幕?照样分析!Bilitato可以调用ASR大模型自动生成AI字幕,总结、分段、提问、验真,一个不落。(需配置Groq Key)

  4. AI 视频总结 Bilitato可以根据字幕内容帮你快速概括主要观点和关键信息,一小时视频一分钟抓住重点。

  5. AI 视频分段&广告识别 Bilitato可以按章节智能分段视频,支持点击章节跳转,只看你想看的。Bilitato还能识别视频中的口播广告,精准空降,减少干扰。

  6. AI 提问视频内容 干货视频里某个地方没听懂?想知道视频片段出处?直接找Bilitato!随心所问。

  7. AI验真(Beta) Bilitato可以智能识别视频中的关键陈述,并给出简单的真实性分析,不被虚假营销号洗脑。

  8. 自动缓存 Bilitato生成过的总结和分段会自动保存在本地,下次打开同一个视频时可以直接查看,不需要重新生成。

9.自定义大模型API和Prompt

⚙️ 设置项说明

主模型配置

设置项 说明 示例
Provider AI 服务提供商。内置多个平台可选,也支持自定义。选择后会自动填入对应的 Base URL ModelScope、OpenAI、DeepSeek 等
API Key 所选平台的 API 密钥,用于鉴权调用 AI 服务 sk-xxxxx
Model 指定调用的模型名称。留空则使用该平台默认模型 gpt-4o-mini / deepseek-chat / glm-4-flash
自定义地址协议 仅在 Provider 选择「自定义」时显示。选择接口协议类型 OpenAI 协议 / Claude 协议
Base URL 仅在 Provider 选择「自定义」时显示。填入自定义服务的 API 地址 https://api.example.com/v1

ASR(音频识别)模型配置

设置项 说明 示例
Groq API Key Groq 平台的 API 密钥。用于对无字幕视频进行音频转录,生成字幕后再进行 AI 分析 gsk_xxxxx
Groq 模型 指定 Groq 使用的语音识别模型。留空则使用默认模型 whisper-large-v3-turbo

调用与显示模式

设置项 说明
调用模式 质量模式:总结和分段分两次独立请求,模型专注单一任务,结果更稳定准确,但单次任务 Token 与调用次数显著提高。
节流模式:总结和分段合并为一次请求,节省 API 调用次数,速度略快,但分段准确率不如质量模式。
默认开屏页 打开插件时的默认显示页面。可选:字幕 / 总结 / 聊天 / 验真

个性化

设置项 说明
修改模式 简单模式:通过滑块调整 AI 输出的语言风格和详略程度,适合大多数用户。
专业模式:直接编辑总结、分段、验真三个功能的完整 Prompt,适合有提示词调优经验的用户。
语言风格 仅简单模式下显示。控制 AI 输出的措辞风格。

轻松:苹果这次更新挺有意思的!相机升级很明显,拍照更好看了,续航也长了不少,日常用完全够用~

平衡:本期视频介绍了 iPhone 新机型的三项主要升级:主摄像素提升至 4800 万、续航增加约 2 小时、新增卫星通话功能。整体来看性能提升明显,适合有换机需求的用户参考。

专业:该机型搭载第三代 3nm 制程芯片,主摄传感器像素密度较上代提升 33%,实测低光环境 SNR 改善显著。电池容量扩容至 4422mAh,配合系统级能效优化,续航时长提升约 18%。

以上示例仅供参考
详略程度 仅简单模式下显示。控制 AI 输出的信息密度。

简略:新 iPhone 主要升级了相机、续航和卫星通话三个方面,适合考虑换机的用户关注。

标准:本期视频介绍了 iPhone 新机型的三项主要升级:主摄像素提升至 4800 万、续航增加约 2 小时、新增卫星通话功能。整体来看性能提升明显,适合有换机需求的用户参考。

详实:本期视频详细评测了新 iPhone 的多项升级。相机方面,主摄从 1200 万升级至 4800 万像素,夜景和人像表现明显提升,视频支持 4K 120fps 录制。续航方面,实测日常使用可达 1.5 天,较上代延长约 2 小时。此外新增了卫星紧急通话功能,无信号环境下仍可拨打求救电话。博主认为此次升级幅度较大,尤其推荐相机需求强的用户考虑换机。

以上示例仅供参考
总结 / 分段 / 验真 Prompt 仅专业模式下显示。最多 1000 字符,直接控制 AI 的行为指令

一些碎碎念

有关作者

我叫Erik,一个在几年前的历史高位入门学商科的二年级研究生,目前正在被AI浪潮和即将到来的求职季裹挟着。在交换学习狠狠逃避现实压力四个月后,我还是意识到不得不面对实习、暑期乃至秋招的风暴。

尽管我之前出于兴趣或课程零散地学过C、Python、H5等语言,但如今早已遗忘干净,也还没有系统性地写出过一款实用的软件,也希望推出一款实用的AI工具,作为我的入门投名状。这是我的第一个我做出的个人觉得比较实用的工具,也是我的第一个Github项目。

灵感来源

我对AI一直很感兴趣,实习也想尝试这个方向。奈何一直没有好的机会深入接触,之前投递的AI产品经理的简历也无人问津。那我开始向内反思:是否是我的知识储备过于单薄?简历过于平庸?遂决定上B站大学学点AI相关的知识,希望先有个腹有诗书气自华的面试buff。B站以中长视频为主,十几二十分钟的视频太碎,不成体系,转头就忘;几小时的视频又太冗长,看不下去,昏昏欲睡。况且AI发展一天一个样,如果我还是从每个up的自我介绍起手,那么我将始终慢人一步搭上AI的快车,还如何做AI的主人?

既然我如此急功近利,热切地希望摒弃一切废话,迅速吃进AI发展的最新动态和原理, 那么是否有款好用的AI+B站视频总结软件,能让我忽略噪音,一眼知道视频内容,自己只需填上少量心得、细节和备注,从而在学习效率上冯虚御风?我搜索了不少方法:AI浏览器要么无法爬取B站视频内容,要么无法读取无字幕视频。 而一些已有的B站总结插件,能用的不多,好用的基本要收费。这触动了我作为一个穷酸学生非必要不支付的逆鳞。我开动脑筋,现有的免费大模型API遍地都是,如果我自己尝试提取B站的视频字幕或是音频数据,再用免费的API和大模型对话,问题将迎刃而解。因此,Bilitato就在这个想法下初具雏形。

有关Bilitato

名字由来

为什么叫这个名字?我也想过叫BiliGPT、BiliMind等一眼拥抱AI的高大上名称,但是我觉得这些名字被用的太泛滥了,而且有种高高在上的感觉。相反我很欣赏豆包这种非常家常的名称,因为任何AI工具只有最终走进千家万户,成为一个所有人日用而不知的必需品,才算是一个成功的AI工具。那么从名字上,豆包这样贴近生活的名称就已经赢了太多。因而,我选择土豆(Potato)这一伟大的食物作为起点,给它取名为Bilitato,中文译名(暂定)B站土豆助手,达到先在取名的格局上和豆包平起平坐的效果。

这个logo是我从家过完年回到学校的动车上随手画的,不难看出我没有任何美术功底,但我觉得它不需要太精致完美,就像这个插件本身一定也是不完美的。但是,它只要容易辨识,足够好用,那就够了。

开发历程

借着Vibecoding的春风,Bilitato是我用了两个多礼拜的时间,爆了小黄鱼买的3000w Claude token(我严重怀疑虚标)和三个Trae账号的Pro额度,从0写出来的,全程基本都是自然语言沟通,用的模型以CodeX 5.3为主,以Gemini 3、Claude Sonnet 为辅。

实话说,我觉得有经验的老手一个礼拜甚至更短的时间就能把我的插件复现出来,我在刚开始写这个插件的时候也很自信地认为我能在三天的时间里搞定一切,但很不幸我兜兜转转到现在才推出。

复盘之后,才发现其实现在这个版本的插件已经经过了三版大迭代和无数次小更新。第一版是界面是和现在一样的内嵌UI,但我寻思,这样全屏播放时用户就看不到插件了。于是第二版用了侧边栏+悬浮窗的UI,这样全屏的时候不会被挡住了,但是又引发了新的问题:用户同时开了很多个视频Tab,侧边栏要显示哪个?一通优化之后,发现侧边栏在用户切换tab的时候,由于B站的静态更新机制,插件始终有这样那样的BUG(当然决定性和的原因是因为我菜);遂重新转回内嵌UI..在布局上我就纠结了很久,更不提一些零零散散的BUG修复和功能更新了。

我认为主要问题在于我一开始并没有对整个插件架构做出太清晰的定义,只确定了几个基本的功能:提取字幕、总结、分段。 至于UI怎么布局、Prompt怎么设计等细节一概没有明确,所以AI跑出来的前端总是有点不合我意。加之我脑子里老是有新的想法,所以很大部分时间我都觉得出来的demo哪哪布局不好看,哪哪交互效果有问题,哪哪是不是可以再加一个新功能…就这样反复让AI在我给定的解空间里修修补补,耽误了很多时间。再由于我一直在追求能让我极致省钱的vibecoding模型和平台(从最开始的免费网页版本Gemini/Claude,再到小黄鱼里买Claude Sonnet的API,最后再到Trae Pro的GPT5.3 Codex),而各种平台的API质量参差不齐,各种模型的风格也统一,最后初版插件的代码堆成了一个shit山,有着各种冗余的函数和弃用的接口,导致我不得不忍痛重新再从0生成一遍。

但好在,Bilitato还是做出来了。它一定会有这样那样的问题,还希望用过的各位能够不吝提交意见或建议,帮助我和Bilitato成长。

后续是否收费?

可以很肯定地说,允许用户自行填写API的方式会一直保留,也就是大家还是可以使用各平台免费的API额度继续使用我的插件。

如果还有实在不愿折腾的用户,我可能会推出订阅的服务。但等我未来把功能再扩充地完整一些,代码再优化地更好一些再说吧,目前能吸引大家用上我的插件,就已经比收到订阅费更让我在屏幕前高兴了。

未来预计上线

1.云端共享。视频的总结和分段将会支持保存到云端,这样第二个观看的人就不需要重复费token再跑一遍总结和分段了。让我们一起找回式微的互联网精神。

2.验真功能正式版。我还在整合高质量又免费的搜索API能让AI调用,未来将把这个功能集成到插件里,让联网搜索赋能的AI帮助大家击碎视频谣言。

3.其他大家提出的建议和意见。

欢迎使用。

About

b站 AI浏览器插件丨视频音频下载丨字幕提取丨总结分段丨广告识别丨一键验真丨向AI提问视频内容 ,支持Groq转录无字幕视频,自定义API和Prompt!BYOK,免费使用。

Topics

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors