Skip to content

Latest commit

 

History

History
320 lines (232 loc) · 24.2 KB

CHANGELOG.zh.md

File metadata and controls

320 lines (232 loc) · 24.2 KB

更新日志

显著提高性能、原生块状引用和语法高亮(v2.4.0)

重大变更

  • 取消对 Python 3.7 和 3.8 的支持:最低的 Python 版本要求现在是 3.9。

亮点

性能增强

  • SSL 上下文重用:像 aiohttp 那样重用 SSL 上下文。这将提高性能(将平均负载降低约 40%)并减少内存使用量。
  • 懒惰 CookieJar:懒惰创建 CookieJar,直到真正有 Cookie。这将提高性能(将平均负载降低约 15%)并减少内存使用量。

新增功能

  • 原生块状引用<blockquote> 现在被渲染为原生的 Telegram 块状引用,取代用横线包裹的文本块。
  • 语法高亮显示:只要在 class 属性中指定了语言,<pre> 现在会呈现为带有语法高亮的 Telegram 原生代码块。

增强

  • 可感知自定义标题的 OPML:在导入和导出 OPML 时,bot 会尝试判断订阅源是否具有自定义标题,如果是,则会保留它。
  • /lang/test 作为“远程”命令/lang/test 现在被认定为“远程”命令,这意味着您可以在私聊中使用它们,但使操作实际应用于您在命令中指定的频道/群组。注意:/test 仅适用于 bot 管理员。
  • /user_info UX 增强/user_info 现在有了更好的 UX。注意:/user_info 仅对 bot 管理员有效。
  • 次要的增强: Docker 映像现在基于 Debian bookworm。

Bug 修复

  • 意外迁移订阅源:修复一个导致 bot 意外将订阅源迁移到新 URL 的错误。更具体地说,bot 现在只会在重定向被视为永久性(HTTP 状态码为 301 或 308)的情况下迁移订阅源。
  • 以错误的色彩空间发送 WEBP:修复导致 WEBP 图像以错误色彩空间发送的错误。
  • 不正确的 OPML 格式:修正不正确的 OPML 格式,这导致某些 RSS 阅读器无法导入 bot 导出的 OPML 文件。
  • 错误的看门狗饲喂时序:修复导致看门狗在不正确的时间被饲喂的错误。
  • 未捕获的错误:修复一些导致消息发送失败的未捕获错误。

改进的性能、订阅数量限制等 (v2.3.0)

这是一个期待已久的版本。很高兴在变更日志中再次相遇!这是支持 Python 3.7 的最后一个版本,v2.3.x 系列不会有任何补丁版本。任何修复都将只应用于下一个版本,且下一个版本将使 Python 的最低版本要求提高到 3.9。

性能增强

  • 对 Python 3.11 的支持:Python 3.11 于 2022-10-24 发布,速度比 Python 3.10 快 10-60% (平均 25%)。RSStT 现在支持 Python 3.11,官方 Docker 镜像也基于 Python 3.11。
  • CPU:将平均负载降低约 30%(取决于使用场景)。这要归功于将依赖 fuzzwuzz (纯 Python) 迁移到 rapidfuzz (C 扩展) 以及大量的性能调校。
  • 内存:(仅适用于 Docker 镜像)采用 jemalloc 降低内存消耗,提高内存分配性能。
  • 多核 CPU:如果环境变量 MULTIPROCESSING 设置为 1,将启动多个进程。进程的数量将等于 CPU 核心数,但最大值为 3。一个是主进程,其它进程(如果有的话)用于解析 RSS 提要等。请注意,只有当有 1 个以上的 CPU 核心时,该选项才有效,否则将只启动 1 个进程(主进程)。它可能有助于在多核 CPU 上提升性能,但会消耗更多内存。通常你不需要启用它。但是,如果有大量订阅,或者您的 VPS 有多个核心,但每个核心的性能都很差,您可能需要启用此功能。
  • 带宽使用:变通解决上游(uvloop)的 bug,这导致 bot 使用过多的带宽。与之前的版本相比,当启用 uvloop 时,可以减少高达 75% 的带宽使用。
  • 启动时间:通过增加启动时的并发性,将一些不重要的启动任务放到后台,来减少启动时间。
  • 小的功能增强:一些内部功能已进行了优化,以提高性能。

新特性

亮点

  • 订阅数量限制:现在可以配置每个用户的最大订阅数量(默认值:无限制)。通过使用 /set_option 命令,可以设置 user_sub_limit (普通用户的订阅数量限制) 和 channel_or_group_sub_limit (频道或群组的订阅数量限制)。要为特定用户/频道/群组检查或设置订阅数量限制,请使用 /user_info 命令。
  • 监视器看门狗:已经实现了一个看门狗来检查订阅源监视器是否正常运行。如果没有,看门狗将使 bot 退出。Docker、Railway 或 Heroku 将自动重新启动它。

其他新特性

  • 如果被封禁,则离开聊天:如果 bot 没有在频道/群组中发送消息的权限,它将离开聊天。
  • <q> 标签转换为引号: <q> 标签现在会被转换为引号(<q>I am a quote,</q> said Q. -> “I am a quote,” said Q.)。
  • 新的本地化:添加了多个翻译。

增强和 bug 修复

  • 接受 4 个字符的用户名:现在可以在 “远程” 命令中使用 4 个字符的用户名来指定频道/群组。
  • 忽略命令中的 inline query header:先前,如果 bot 没有被正确设置为 inline bot,命令会带着 inline query header (@bot_username) 发送,导致 bot 没有响应。现在, bot 将忽略 inline query header 并正确响应命令。
  • 如果正等待速率控制,则跳过监控任务:如果 bot 由于速率限制而无法向订阅源的所有订阅者发送消息,则会跳过该订阅源的监控任务一次。
  • 优雅地退出:如果 bot 接受到 SIGINT 或 SIGTERM,它将通过首先关闭数据库连接来优雅地退出。先前,未关闭的数据库连接会阻止 bot 退出。
  • 编码检测:修复导致某些订阅源的编码检测不正确的错误。
  • 删除 sr-only 元素:从 RSS 源中删除 sr_only 元素。它们仅用于屏幕阅读器,不应被渲染。
  • 修复错误的命令正则表达式:修复一些错误的命令正则表达式,它们使 bot 无法正确响应命令。

次要的 bug 修复和更改

更多未提及的小 bug 已在该版本被修复。变更日志不包括所有变更。有关更多详细信息,请参阅比较视图

发布至 PyPI、HTML 表格转换器和更多 (v2.2.1)

新特性

亮点

  • 发布至 PyPI: RSStT 现在可从 PyPI 中获取。可通过 pip install rsstt 来安装。详细信息请参阅部署指南.
  • HTML 表格转换器: 实现了一个 HTML 表格转换器,可以将 HTML 表格转换为图片。需要将环境变量 TABLE_TO_IMAGE 设置为 1,并且需要安装 CJK 字体。请注意,转换器不是完美的,不能处理富文本格式,可能无法处理所有的 HTML 表格,并可能会导致更高的性能成本和更长的处理时间。

其他新特性

  • 新的本地化: 增加了印度尼西亚语 (id, Bahasa Indonesia) 的翻译。
  • 增加 .env.sample: 增加了范例 .env 文件。

增强

  • 自然排序: 从旧到新推送文章。
  • 定时 GC: 每 10 分钟执行一次 GC (垃圾回收) 以清理内存。
  • 本地化更新: 更新了土耳其语 (tr, Türkçe) 的翻译。
  • 安全: 在 shell 之外执行 git
  • 次要的增强

Bug 修复

  • 监视任务启动失败: 增加了 misfire_grace_time 至 10s 以避免监视任务由于高负载未能启动。
  • 依赖更新: 修复了一个阻止用户在使用 PostgreSQL 的实例上重置所有订阅到用户的默认设置的上游 bug。
  • 次要的 bug 修复

频道远程管理、更多格式化选项和更多 (v2.2.0)

新特性

亮点

  • 频道/群组远程管理: 现在你可以在和 bot 的私聊里管理你的频道/群组的订阅。支持使用大部分命令。只需以类似于 /sub @username https://exmaple.com/sub -10010000000000 https://exmaple.com 的格式发送命令。(@username 是频道/群组的用户名, @ 是不可缺少的; -10010000000000 是频道/群组的 ID, 必须以 -100 开头)
  • 更多格式化选项:
    • 媒体: 你可以选择让 Telegram 消息不带任何媒体 (只有文字)。也可以选择让 Telegram 消息只带有媒体和元数据 (没有内容);只有当有媒体附加到文章时才可如此,否则,它们仍会带有内容。
    • 链接预览: 现在你可以强制关闭 Telegram 消息的链接预览。
    • 来源: 更多来源格式化选项。阅读 格式设置指南 以获取详细信息。
  • 部署到 Heroku: Bot 现在可以部署到 Heroku。阅读 部署指南 以获取详细信息。
  • 用户权限管理: Bot 管理员现在可以使用 /user_info 命令来管理 bot 用户 (用户/频道/群组) 的权限。这样管理员就可以设置谁可以使用 bot,即使禁用了多用户模式。

其他新特性

  • 单列表格支持: 先前,所有 HTML 表格都被丢弃。现在,只含有单列的表格将被渲染为多行文本。请注意,多列表格仍会被丢弃。
  • 适用于 lizhi.fm 的音频回落: 如果高音质音频超出了文件大小限制,自动回落到更低音质的音频。仅适用于 lizhi.fm

增强

  • Telegraph 文章美化: Telegraph 文章的格式美化。除此之外,所有图片和视频都使用媒体中继服务器来规避防盗链。
  • 非 HTTP 超链接: Telegram 不支持非 HTTP 超链接。Bot 会自动将它们转换为裸 URL。
  • Enclosure 清理: 如果一个附件包含非 HTTP URL 且文章中的链接已包含它,它将被移除。
  • 懒惰的媒体验证器: 媒体验证器现在是懒惰的。它只有在一篇文章可能作为 Telegram 消息发送时才会运行。这将减少 CPU 使用量和网络流量。
  • 增强的图片尺寸提取: 图片尺寸提取现在更快速和灵活。如果提取失败,bot 会尝试使用 images.weserv.nl 来提取。
  • 本地化更新: 土耳其语 (Türkçe) 本地化文件已更新。 (英语 / English 、简体中文 、繁体中文 / 正體中文 和 粤语 / 廣東話 永远是最新的。)
  • 改进的 Docker 构建缓存: 如果依赖未改变,无需再重新拉取完整的 Docker 镜像。只需使用缓存的依赖并拉取最新的源码。
  • 从 Railway.app 的环境变量中提取 git 信息: Railway.app 上的部署现在可以识别 git 信息。
  • 次要的增强

Bug 修复

  • Python 3.7 兼容性: 上一个版本破坏了与 Python 3.8 的兼容性,现在已经修复了。请注意,仅支持 x86 和 amd64 架构。对于 arm64,最小的 Python 版本要求是 3.8。
  • EntitiesTooLongError: 含有大量文本超链接的文章可引起 Telegram API 抛出这个错误。现在 bot 会尝试通过更激进的文章分割来修复这个错误。
  • <div>: Bot 现在会确保每个 <div> 标签都占据一整行。
  • 不必要的图片回落: 如果至少有一张图片需要作为文件发送,bot 不再会将所有图片都回落成文件。
  • 网络重试: 增加了一个需要进行重试的异常。
  • 网页解码错误: cchardet 并不足够健壮以处理所有源。现在 bot 会尝试从 XML 编码声明中探测网页编码。同时,如果 cchardet 返回了不支持的编码,bot 会尝试使用 UTF-8 来解码网页。任何无法被解码的字符都会被替换为
  • 从 Exif 缩略图中提取图片尺寸: 一些图片在 Exif 数据中含有缩略图。Bot 现在会避免从缩略图中提取尺寸。
  • 次要的 bug 修复

自定义格式、新本地化、改进的媒体回落和更多 (v2.1.0)

官方的公开 bot @RSStT_Bot 一直使用 dev 分支。如果你正在使用它,你可能已经注意到新功能了。由于添加了新的命令,请使用 /lang 命令再一次选择你的语言,让 bot 更新你的命令列表。

重大变更

  • 由于加入了新的自定义设置,现在需要启用 inline 模式。请到 @BotFather ,发送 /setinline,选择你的 bot,并回复一个你喜欢的 inline 占位符。例如,@RSStT_Bot 使用的是 Please input a command to continue...

新特性

亮点

  • 更多自定义格式化选项: /set 命令可以发挥它的全部威力了。你可以控制媒体或者任何元数据是否显示,还可以添加自定义 hashtag 和设置自定义订阅标题。但这些都需要启用 inline 模式。请阅读 格式设置指南 了解格式设置的详细信息。
  • 用户默认格式化设置: 使用 /set_default 命令来设置你的默认格式化设置。这将应用到你的所有新订阅,如果你喜欢,你也可以让现有订阅也使用它。如果你想给大多数你的订阅应用相似的设置,这是非常有用的。 img.png
  • 新本地化: 意大利语 (Italiano)、土耳其语 (Türkçe)、加泰罗尼亚语 (Català) 和法语 (français)。想要添加你的语言吗?请在这里阅读翻译指南。
  • RSS 源嗅探器: 如果你尝试订阅一个网页而不是 RSS 源,bot 将尝试从网页中提取 RSS 源。(注意:这仅在网页中包含 RSS 源链接时有效。)
  • Enclosure 支持: Bot 现在可以从文章的 enclosure 中提取附件。来享受听音频节目,或者下载附件吧!
  • <audio> 支持: Bot 现在可以从文章中提取音频。来享受听音频节目吧!
  • 长图作为文件发送: Bot 现在可以将长图作为文件发送,防止 Telegram 将它压缩得不可读。
  • 导入含自定义标题的 OPML 文件: 你现在可以从 OPML 文件导入订阅,而不会丢失你的自定义标题。Bot 将会询问你是否应该使用 OPML 文件中的自定义标题。
  • 导出含自定义标题的 OPML 文件: 你现在可以将你的订阅导出到 OPML 文件,而不会丢失你的自定义标题。

其他新特性

  • 合法化更多图片格式: Bot 现在可以判断非 JPEG 图片的合法性,并在不合法时回落到替代图片 (如果有)。
  • 图片回落 (srcset): Bot 现在可以在图片不合法时回落到替代图片 (<img srcset="...">,如果有)。
  • pixiv 图片回落: Bot 现在可以在 pixiv 图片不合法时回落到其他尺寸 (如果有)。 (#41)
  • 为所有图片设计的图片回落: Bot 现在会使用 images.weserv.nl 来将不合法的图片回落成对于 Telegram API 合法的图片。
  • 视频回落: Bot 现在可以在视频不合法时回落到替代视频 (<video><source>...</video>,如果有) 或它的封面 (<video poster="...">,如果有)。
  • WEBP 和 SVG 支持: Bot 现在会使用 images.weserv.nl 来将 WEBP 和 SVG 转换成 PNG,使它们兼容于 Telegram API。
  • 媒体上传器: Bot 现在使用基本的 MTProto API 调用来上传媒体,而不是使用 telethon 提供的便捷方法。这有助于避免不必要的媒体回落和提升性能。

增强

  • 页码: 当命令需要分页时,bot 会显示当前页码。
  • /unsub_all 确认: 当你退订所有订阅时,bot 会向你确认并发送备份。
  • 取消: 一些命令可通过点击 取消 按钮取消。
  • 自定义监视间隔: 你现在有了更多的监视间隔可选。如果你想的话,也可以设置任何你喜欢的监视间隔 (需要启用 inline 模式,注意 bot 管理员可以禁止普通用户设置太短的监视间隔)
  • 停用原因: 当订阅由于出错太多次而被停用时,bot 会告知原因。
  • 丢弃更多图标: 一些文章有烦人的图标,bot 现在可以检测并丢弃更多。
  • 监视任务顺序随机化: 监视任务的顺序会被随机化。
  • 发生 Telegram 内部错误时重试: 当发生 Telegram 内部错误时,bot 会重试发送消息。
  • 重写的文章解析器: 文章解析器被重写,以使其更灵活,并获得支持自定义格式的能力。
  • 重写的富文本分割器: 富文本分割器被重写,以使其更灵活,并获得支持自定义格式的能力。这同样避免了它过早地分割文本。
  • 命令加速: 一些命令现在更快了。
  • /test 格式化: /test 命令现在会使用用户的默认格式化设置或者订阅的格式化设置 (如果已被订阅)。 (注: 只有 bot 管理员可以使用这个命令。)
  • 次要的增强

Bug 修复

  • RSS 源标题未更新: 当 RSS 源更新了它的标题时,bot 现在会更新在数据库里的标题并在发送消息时使用新标题。
  • 内容太长: 可能包含太长的内容的命令现在会被缩减或分页。如果还是太长,bot 会提示你。
  • 太多 entity: Bot 现在会确保消息中格式化 entity 的数量不多于 100 个 (Telegram API 限制),否则就进行分割。这有助于避免消息丢失格式化。
  • 潜在的死锁: 一个潜在的死锁问题被修复。
  • 不正确的空格和换行策略: Bot 现在会避免在消息中出现非预期的空格和换行,特别针对怪异的 RSS 源。这同样应用到 RSS 源/文章的标题和文章作者之上。
  • 次要的 bug 修复

多用户、国际化、改进的用户友好性和更多 (v2.0.0)

官方的公开 bot: @RSStT_Bot

这是一个重大的发布。它引入了一些重大变更,因此迁移至新版本需要手动完成。
更新前请务必阅读迁移指南

重大变更

  • 重写用户及订阅管理。Bot 现在可以被多个用户同时使用,且各个订阅都可以独立设置监视间隔。因此,环境变量 CHATIDDELAY 已经被弃用且不再有效。
    • 默认情况下,bot 将作为多用户机器人运行。如果你仍然希望限制 bot 仅为你服务,请按照迁移指南进行设置。
  • 不再支持 Redis,仅支持 SQLite 和 PostgreSQL。

新特性

亮点

  • 多用户: 任何用户都可以使用 bot,也可以在频道和群组中使用(除非环境变量 MULTIUSER 设置为 0)。
  • 国际化: Bot 现在支持多语言。目前,英语 (English, en), 简体中文 (zh-Hans)粤语 (廣東話, yue) 已被支持。你可以参考 翻译指南,通过将 bot 翻译为你的语言,为项目作出贡献。
  • 用户友好: 你可以交互式地使用大部分命令,而不需要记住他们的语法。
  • HTTP 缓存: Bot 已经实现了 RFC7234 中的必要部分,以“缓存”订阅源。这可以帮助 bot 所在的服务器和订阅源所在的服务器降低负载。

其他新特性

  • 自定义订阅: 订阅可被自定义。目前,只有下面列出的设置可被自定义。其他设置正在开发中。
    • 暂停订阅: 你可以暂停订阅。这样的话,你就可以让 bot 暂停发送订阅更新。
    • 静音订阅: 你可以静音订阅。这样的话,当 bot 发送更新时,会发送静音消息。(你仍然会收到通知,但不会有声音)
    • 监视间隔: 你可以更改订阅的监视间隔。
  • 文档: Bot 现在有了文档。请查阅 docs

增强

  • 更好的订阅源历史管理: 订阅源中的所有文章都会经过散列并储存,这样你就可以订阅几乎任何订阅源而不必担心遗漏文章。
  • 更好的错误处理: Bot 现在能更好地处理错误,它将会尝试恢复并重试。
  • 更好的日志: Bot 现在能更好地记录日志。
  • 更佳的性能: Bot 现在有着更佳的性能。
  • 依赖更新: 依赖已被更新至最新版本。潜在的漏洞已被修复。
  • 代理绕过: 如果设置了环境变量 PROXY_BYPASS_PRIVATE ,bot 会为私有网络绕过代理。在环境变量 PROXY_BYPASS_DOMAINS 中列出的域名也会被绕过。
  • Bug 修复: 修复了一些 bug。

修复登录的仓促发布 (v1.6.1)

这是一个仓促的发布。它将依赖 telethon 升级到了最新版本。请立即升级到这个版本以免由于依赖过时而无法登录。

机器人正在 multiuser 分支上被活跃开发,但尚未被合并回来,以免过早引入重大变更。如果你想要尝试多用户版本,这里有一个公开的 demo @RSStT_Bot

新特性

  • .env 文件支持 (仅在手动执行时支持,不支持 docker)
  • 反转义受到 HTML 转义的文章标题
  • 当文章内容不含有文本时,将标题作为文章的内容

增强

  • 一些小的错误修复
  • 引入了一些变通解决方案以免频繁受到泛洪控制
  • 引入了一些依赖以加速 HTTP 请求

切换到 MTProto、OPML 支持和更多 (v1.6.0)

重大变更

  • 与 Telegram 交互的库由使用 HTTP Bot API 的同步库 python-telegram-bot 改为使用 MTProto Bot API 的异步库 telethon
    • 这引入了 API key 的需求,程序已经内置了 7 个公开的 API key,通常情况下不应无法登入。如果无法登入,可以自己申请 API key (详见 docker-compose.yml.sample 中的说明)

新特性

  • 由于 Telegram bot 库的替换,bot 可以直接连接到 bot 所属的 DC,不需绕经 HTTP Bot API;也不需轮询获得消息更新,它在接收及发送消息方面都更为迅速,资源占用也更低; 即使 HTTP Bot API 宕机,bot 也可以正常工作 (详见 Advantages of MTProto over Bot APIMTProto vs HTTP Bot API)
  • 支持更多元素的解析
    • <iframe>
    • <video><source><source>...</video>
    • <code>
    • <pre>
  • 支持 OPML 导入导出
  • 支持超长文章通过 Telegraph 发送 (必须先设置 TELEGRAPH_TOKEN 环境变量)
  • 支持使用 redis 作为数据库
    • 注意:这是为了在 railway.app 上部署而设计的变通解决方案,未来很可能丢弃
  • 支持 arm64 (docker 构建)
  • 支持在由于 Telegram 服务器不稳定或 Telegram 服务器与媒体服务器之间的网络连接不稳定而导致 Telegram 无法发出带有媒体的消息时,使用媒体反代服务器重新发送。
  • 支持日志着色
  • docker-compose.yml.sample
  • 用于检查 bot 版本的 /version 命令
  • 如果设置了全局代理 (环境变量 SOCKS_PROXY/HTTP_PROXY),会使用它们

增强

  • 将 feed 监视任务分配到每分钟,而不是每次 DELAY 一次性全部执行
    • 因此,环境变量 DELAY 将只能被设置为 60~3600
    • 注意:环境变量 DELAY 未来将被弃用
  • 使用 guid/id 来辨识一个 post,而不是 link
  • 简化了 /list 的输出
  • 升级为 Python 3.9 (docker 构建)
  • 次要的修复

完全重写的文章解码 (v1.5.0)

  • 文章解码完全重写,更加稳定及更加忠实还原原有格式
    • 针对大量短动态类 RSS 源进行了测试
    • 即使是长文 RSS 源,也可以正确处理
  • 支持 GIF
  • 消息多于 10 张媒体时支持分条发送
  • 支持视频与图片任意混合于同一条消息
  • 超限媒体不再直接丢弃,而是作为链接附加到消息末尾
  • 自动判断 RSS 源的标题是否为自动填充,并自动选择是否略去标题
  • 自动显示作者名
  • 自动替换 emoji shortcodes 为 emoji
  • 自动替换满足某些特征的表情图片为 emoji 或其描述文本
  • 因 telegram api 不稳定而无法发出图片时,自动更换图床服务器重发
    • 仅限微博图源,非微博图源自动将所有媒体转为链接附加到消息末尾
  • 改进文本长度计数方式,不再因为链接 url 过长而导致消息被提前分割
  • 更改 user-agent,规避某些网站屏蔽 requests UA 的问题
  • 改进的日志记录

初始发布 (v1.0.0)

第一个公开发布