awesome-ai-api/scripts/generate_leaderboard.py at master · Claws-ZH/awesome-ai-api · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
#!/usr/bin/env python3
"""Generate gateways.json, leaderboard sections, and history snapshot from validated.json.

- Reads data/validated.json
- Produces:
    data/gateways.json           (structured, current state)
    data/history/YYYY-MM-DD.json (daily snapshot, append-only)
    data/_leaderboard.md         (markdown fragment used by README build)
    data/_leaderboard.zh.md      (Chinese fragment)

The READMEs use BEGIN/END markers so we can overwrite the fragment in place
without touching the rest of the file.
"""
from __future__ import annotations

import json
import re
from datetime import datetime, timezone, timedelta
from pathlib import Path
from typing import Any

ROOT = Path(__file__).resolve().parent.parent
DATA = ROOT / "data"
HISTORY = DATA / "history"
HISTORY.mkdir(exist_ok=True)

# Singapore time (GMT+8)
SGT = timezone(timedelta(hours=8))

BEGIN_EN = "<!-- LEADERBOARD:BEGIN -->"
END_EN = "<!-- LEADERBOARD:END -->"
BEGIN_ZH = "<!-- LEADERBOARD_ZH:BEGIN -->"
END_ZH = "<!-- LEADERBOARD_ZH:END -->"


def slugify(url: str) -> str:
    s = re.sub(r"^https?://(www\.)?", "", url).rstrip("/")
    s = s.replace("/", "-").replace(".", "-")
    return s.lower()


def region_of(title: str, body_hints: list[str]) -> str:
    title_l = title.lower() if title else ""
    zh_hints = any(h for h in body_hints if any(ord(c) > 127 for c in h))
    if zh_hints or any(k in title for k in ["中转", "聚合", "国内"]):
        return "cn"
    if "github.com" in title_l or "self-host" in title_l:
        return "self-hosted"
    return "global"


def score_of(entry: dict[str, Any], uptime: dict | None = None) -> float:
    # Scoring: reachability + API endpoint confirmation + keyword density + uptime.
    base = 6.0
    if entry["verdict"] == "likely_relay":
        base += 1.5
    elif entry["verdict"] == "probable_relay":
        base += 0.8
    # Huge bonus for a real /v1/models endpoint — this is the ground truth signal.
    if entry.get("has_api"):
        base += 1.5
    # Bonus for lots of real models returned (not just keyword matches)
    real_model_count = len(entry.get("real_models") or [])
    if real_model_count >= 50:
        base += 0.4
    elif real_model_count >= 10:
        base += 0.2
    coverage = len(entry.get("model_keywords", []))
    base += min(coverage * 0.1, 0.5)
    if entry.get("payment_hints"):
        base += 0.2
    # Penalise extremely slow sites (> 3s)
    took = entry.get("took_ms") or 0
    if took > 3000:
        base -= 0.3
    # Uptime bonus (if we have >= 3 days of history)
    if uptime and uptime.get("samples") and uptime["samples"] >= 3:
        pct = uptime.get("uptime_pct") or 0
        if pct >= 99:
            base += 0.5
        elif pct >= 95:
            base += 0.3
        elif pct < 80:
            base -= 0.4
    return round(min(base, 9.9), 1)


def build_entries(validated: list[dict[str, Any]], uptime: dict[str, dict] | None = None) -> list[dict[str, Any]]:
    uptime = uptime or {}
    out: list[dict[str, Any]] = []
    for v in validated:
        # Skip unreachable + directory-only sites
        if v["verdict"] in ("unreachable", "directory", "hidden"):
            continue
        url = v["url"]
        slug = slugify(url)
        # Prefer the human-curated name from sites.yaml; fall back to parsed <title>.
        raw = v.get("title", "") or ""
        name = raw.split("|")[0].split(" - ")[0].strip() or slug
        if len(name) > 60:
            name = name[:60].rstrip()
        # Reject obviously garbage titles (HTML entity left overs, extremely short, etc.)
        if "&" in name and ";" not in name:
            name = slug
        # Generic titles are useless — prefer the domain slug.
        generic = {
            "new api", "new-api", "newapi", "首页", "主页", "网站首页",
            "one-api", "one api", "oneapi",
            "home", "api", "api中转站", "api中转",
            "v-api", "vapi", "v api",           # new-api fork default
            "chat", "dify", "lobe chat", "librechat",
        }
        if name.strip().lower() in generic:
            from urllib.parse import urlparse as _urlparse
            host = _urlparse(url).netloc.removeprefix("www.")
            # Special case: github repos — use owner/repo, not the host.
            if host == "github.com":
                parts = _urlparse(url).path.strip("/").split("/")
                if len(parts) >= 2:
                    name = f"{parts[0]}/{parts[1]}"
                else:
                    name = host
            else:
                name = host
        region = v.get("override_region") or region_of(v.get("title", ""), v.get("zh_keywords", []))
        up = uptime.get(url) or {}
        out.append(
            {
                "slug": slug,
                "name": name,
                "url": url,
                "final_url": v.get("final_url"),
                "region": region,
                "payment": v.get("payment_hints", []),
                "models_signaled": v.get("model_keywords", []),
                "real_models_count": len(v.get("real_models") or []),
                "real_models_sample": (v.get("real_models") or [])[:8],
                "engine": v.get("engine"),
                "reachable": True,
                "http_status": v.get("status"),
                "took_ms": v.get("took_ms"),
                "has_api": bool(v.get("has_api")),
                "probe": {
                    "status": v.get("probe_status"),
                    "path": v.get("probe_path"),
                    "hint": v.get("probe_hint"),
                },
                "uptime": {
                    "window_days": up.get("window_days"),
                    "samples": up.get("samples"),
                    "uptime_pct": up.get("uptime_pct"),
                    "streak_days": up.get("streak_days"),
                },
                "upstream": v.get("upstream"),
                "note": v.get("note"),
                "score": score_of(v, up),
                "verdict": v["verdict"],
                "last_verified": datetime.now(SGT).strftime("%Y-%m-%d"),
            }
        )
    # Sort by: has_api desc, score desc, latency asc, name
    out.sort(key=lambda x: (not x["has_api"], -x["score"], x["took_ms"] or 9999, x["name"].lower()))

    # De-dup duplicate names by appending the domain in parens.
    # This catches cases like 4 different sites all self-titled "V-API" or "New API"
    # that slipped past the `generic` set above (e.g. "V-API Pro", "V-API 中转").
    from collections import Counter
    from urllib.parse import urlparse as _urlparse
    name_counts = Counter(e["name"] for e in out)
    for e in out:
        if name_counts[e["name"]] > 1:
            host = _urlparse(e["url"]).netloc.removeprefix("www.")
            # For GitHub, use owner/repo for disambiguation (not the host,
            # which is the same for every repo).
            if host == "github.com":
                parts = _urlparse(e["url"]).path.strip("/").split("/")
                suffix = f"{parts[0]}/{parts[1]}" if len(parts) >= 2 else host
            else:
                suffix = host
            e["name"] = f"{e['name']} ({suffix})"

    return out


TIER_LABELS_EN = {
    "likely_relay": "🟢 Verified",
    "probable_relay": "🟡 Probable",
    "open_source_tool": "🧰 OSS Tool",
    "needs_review": "🔍 Needs review",
}
TIER_LABELS_ZH = {
    "likely_relay": "🟢 已验证",
    "probable_relay": "🟡 疑似",
    "open_source_tool": "🧰 开源工具",
    "needs_review": "🔍 待复核",
}


def render_table(entries: list[dict[str, Any]], lang: str, limit: int | None = None) -> str:
    if lang == "zh":
        header = (
            "| # | 中转站 | 地区 | API | 模型 | 引擎 | 支付 | 评分 | 响应 | 分类 |\n"
            "|---|--------|------|-----|------|------|------|------|------|------|\n"
        )
    else:
        header = (
            "| # | Gateway | Region | API | Models | Engine | Payment | Score | Latency | Tier |\n"
            "|---|---------|--------|-----|--------|--------|---------|-------|---------|------|\n"
        )
    rows = []
    shown = entries if limit is None else entries[:limit]
    tier_labels = TIER_LABELS_ZH if lang == "zh" else TIER_LABELS_EN
    for i, e in enumerate(shown, start=1):
        # Prefer real model count when available
        real_n = e.get("real_models_count") or 0
        if real_n:
            models = f"**{real_n} models**"
        else:
            models = ", ".join(e["models_signaled"][:3]) or "—"
        payment = ", ".join(e["payment"]) or "—"
        medal = {1: "🥇", 2: "🥈", 3: "🥉"}.get(i, str(i))
        api_badge = "🔌" if e.get("has_api") else "·"
        latency = f"{e['took_ms']} ms"
        name = f"[{e['name']}]({e['url']})"
        tier = tier_labels.get(e.get("verdict", ""), e.get("verdict", ""))
        engine = e.get("engine") or "—"
        rows.append(
            f"| {medal} | {name} | {e['region']} | {api_badge} | {models} | {engine} | {payment} | {e['score']} | {latency} | {tier} |"
        )
    return header + "\n".join(rows) + "\n"


def splice_readme(path: Path, marker_begin: str, marker_end: str, body: str, stamp: str) -> None:
    text = path.read_text(encoding="utf-8")
    wrapper = f"{marker_begin}\n_Last updated: {stamp} (SGT)_\n\n{body}\n{marker_end}"
    if marker_begin in text and marker_end in text:
        new = re.sub(
            re.escape(marker_begin) + r".*?" + re.escape(marker_end),
            wrapper,
            text,
            count=1,
            flags=re.DOTALL,
        )
    else:
        # Append at bottom if markers missing
        new = text.rstrip() + "\n\n" + wrapper + "\n"
    path.write_text(new, encoding="utf-8")


def _update_stats_badges(path: Path, total: int, api_count: int, lang: str) -> None:
    """Rewrite the shields.io badges between <!-- STATS:BEGIN --> and STATS:END."""
    text = path.read_text(encoding="utf-8")
    if lang == "zh":
        begin, end = "<!-- STATS_ZH:BEGIN -->", "<!-- STATS_ZH:END -->"
        body = (
            f'<img src="https://img.shields.io/badge/%E4%B8%AD%E8%BD%AC%E7%AB%99-{total}-blue" alt="中转站总数">\n'
            f'  <img src="https://img.shields.io/badge/API%E5%B7%B2%E9%AA%8C%E8%AF%81-{api_count}-success" alt="API已验证">\n'
            f'  <img src="https://img.shields.io/badge/%E6%9B%B4%E6%96%B0-%E6%AF%8F%E6%97%A510%3A00_SGT-orange" alt="每日更新">'
        )
    else:
        begin, end = "<!-- STATS:BEGIN -->", "<!-- STATS:END -->"
        body = (
            f'<img src="https://img.shields.io/badge/Gateways-{total}-blue" alt="Total">\n'
            f'  <img src="https://img.shields.io/badge/API_verified-{api_count}-success" alt="API verified">\n'
            f'  <img src="https://img.shields.io/badge/Updated-daily_10:00_SGT-orange" alt="Updated">'
        )
    wrapper = f"{begin}\n  {body}\n  {end}"
    if begin in text and end in text:
        new = re.sub(
            re.escape(begin) + r".*?" + re.escape(end),
            wrapper,
            text,
            count=1,
            flags=re.DOTALL,
        )
        path.write_text(new, encoding="utf-8")


def main() -> int:
    validated = json.loads((DATA / "validated.json").read_text(encoding="utf-8"))
    # Load uptime stats if available
    uptime_path = DATA / "uptime.json"
    uptime = {}
    if uptime_path.exists():
        try:
            uptime = json.loads(uptime_path.read_text(encoding="utf-8")).get("gateways", {})
        except Exception:
            uptime = {}
    entries = build_entries(validated, uptime=uptime)
    stamp = datetime.now(SGT).strftime("%Y-%m-%d %H:%M")
    today = datetime.now(SGT).strftime("%Y-%m-%d")

    # Current state
    current = {
        "$schema": "./gateways.schema.json",
        "updated": today,
        "updated_at": stamp + " SGT",
        "total": len(entries),
        "gateways": entries,
    }
    (DATA / "gateways.json").write_text(
        json.dumps(current, ensure_ascii=False, indent=2), encoding="utf-8"
    )

    # History snapshot (one per day, last run wins)
    (HISTORY / f"{today}.json").write_text(
        json.dumps(current, ensure_ascii=False, indent=2), encoding="utf-8"
    )

    # Tier summary
    from collections import Counter
    tier_counts = Counter(e["verdict"] for e in entries)
    api_count = sum(1 for e in entries if e.get("has_api"))
    engine_counts = Counter(e["engine"] for e in entries if e.get("engine"))
    top_engines = engine_counts.most_common(5)
    engine_str_en = " · ".join(f"`{k}` × {v}" for k, v in top_engines) or "—"
    engine_str_zh = " · ".join(f"`{k}` × {v}" for k, v in top_engines) or "—"
    summary_en = (
        f"**Total: {len(entries)} gateways** · "
        f"🔌 **{api_count} with confirmed `/v1/models` endpoint** · "
        f"🟢 {tier_counts.get('likely_relay', 0)} Verified · "
        f"🟡 {tier_counts.get('probable_relay', 0)} Probable · "
        f"🧰 {tier_counts.get('open_source_tool', 0)} OSS · "
        f"🔍 {tier_counts.get('needs_review', 0)} Needs review\n\n"
        f"**Top engines detected:** {engine_str_en}\n\n"
    )
    summary_zh = (
        f"**合计 {len(entries)} 个中转站** · "
        f"🔌 **{api_count} 个已确认 `/v1/models` 端点** · "
        f"🟢 已验证 {tier_counts.get('likely_relay', 0)} · "
        f"🟡 疑似 {tier_counts.get('probable_relay', 0)} · "
        f"🧰 开源 {tier_counts.get('open_source_tool', 0)} · "
        f"🔍 待复核 {tier_counts.get('needs_review', 0)}\n\n"
        f"**主流引擎分布：** {engine_str_zh}\n\n"
    )

    # Markdown fragments — full list in data/, top 50 in README
    table_en_full = render_table(entries, "en")
    table_zh_full = render_table(entries, "zh")
    (DATA / "_leaderboard.md").write_text(summary_en + table_en_full, encoding="utf-8")
    (DATA / "_leaderboard.zh.md").write_text(summary_zh + table_zh_full, encoding="utf-8")

    table_en = summary_en + render_table(entries, "en", limit=50) + (
        f"\n> Top 50 shown. See [`data/_leaderboard.md`](data/_leaderboard.md) for the full list of {len(entries)} gateways.\n"
        if len(entries) > 50 else "\n"
    )
    table_zh = summary_zh + render_table(entries, "zh", limit=50) + (
        f"\n> 仅展示 Top 50。完整 {len(entries)} 个榜单见 [`data/_leaderboard.zh.md`](data/_leaderboard.zh.md)。\n"
        if len(entries) > 50 else "\n"
    )

    # Splice into READMEs
    splice_readme(ROOT / "README.md", BEGIN_EN, END_EN, table_en, stamp)
    splice_readme(ROOT / "README.zh-CN.md", BEGIN_ZH, END_ZH, table_zh, stamp)

    # Refresh the dynamic STATS badges in both READMEs
    _update_stats_badges(ROOT / "README.md", len(entries), api_count, lang="en")
    _update_stats_badges(ROOT / "README.zh-CN.md", len(entries), api_count, lang="zh")

    print(f"[ok] {len(entries)} gateways → gateways.json + history/{today}.json")
    return 0


if __name__ == "__main__":
    raise SystemExit(main())