Skip to content

Commit 2a10138

Browse files
dshkolclaude
andcommitted
Update: About pages with skills-based LLM description
- Concise description of the system architecture - Links to blog post and GitHub repo - Bilingual (EN/FR) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
1 parent 9599ac0 commit 2a10138

2 files changed

Lines changed: 22 additions & 140 deletions

File tree

docs/en/about/index.md

Lines changed: 11 additions & 70 deletions
Original file line numberDiff line numberDiff line change
@@ -5,83 +5,24 @@ toc: false
55

66
# About The D-AI-LY
77

8-
The D-AI-LY is an experimental project that generates statistical news bulletins using artificial intelligence. It draws inspiration from Statistics Canada's official publication, [The Daily](https://www.statcan.gc.ca/en/dai/dai), which has been Canada's first release of new statistical data since 1932.
8+
The D-AI-LY generates statistical bulletins from Statistics Canada's CANSIM database using a Skills-based LLM harness. It was built with Claude Code but should work with any agentic CLI tool that can invoke SKILL.MD files. It is not affiliated with Statistics Canada in any way.
99

10-
## What We Do
10+
## Process
1111

12-
Every day, The D-AI-LY:
12+
1. Fetch metadata from CANSIM/NDM tables via the [cansim R package](https://mountainmath.github.io/cansim/) to autonomously identify new and interesting data and retreive structured data objects.
13+
2. Generate bilingual articles (EN/FR) using an LLM model following specific guidance on narrative, voice, tone, and visual style.
14+
3. Publish and build a static site using the Observable.js framework.
1315

14-
1. **Scans** Statistics Canada's CANSIM database for recently updated tables
15-
2. **Selects** newsworthy topics based on recency, public interest, and sector diversity
16-
3. **Fetches** the latest data using the official Statistics Canada API
17-
4. **Generates** bilingual articles (English and French) explaining the key findings
18-
5. **Publishes** the articles to this website
16+
Each article cites its source table, documents R code for reproducibility, and links to official Statistics Canada data.
1917

20-
All data comes directly from Statistics Canada. The articles are generated by AI and reviewed for accuracy.
18+
## Limitations
2119

22-
## How It Works
20+
LLM-generated content goes through automated reviews but may very well still contain errors. Do not use for any official purposes and verify statistics by consulting the [official Statistics Canada source](https://www.statcan.gc.ca/)
2321

24-
```
25-
┌─────────────────────────────────────────┐
26-
│ Daily Automation (8am) │
27-
└─────────────────┬───────────────────────┘
28-
29-
┌─────────────▼─────────────┐
30-
│ Topic Discovery (AI) │ What's newsworthy today?
31-
└─────────────┬─────────────┘
32-
33-
┌─────────────▼─────────────┐
34-
│ Data Fetch (R/cansim) │ Get real StatCan data
35-
└─────────────┬─────────────┘
36-
37-
┌─────────────▼─────────────┐
38-
│ Article Generation (AI) │ Write EN + FR articles
39-
└─────────────┬─────────────┘
40-
41-
┌─────────────▼─────────────┐
42-
│ Publish to Website │ Build and deploy
43-
└───────────────────────────┘
44-
```
22+
## More Information
4523

46-
## Data Sources
47-
48-
All statistical data is sourced from **Statistics Canada's CANSIM database** (now called the New Dissemination Model). We use the [cansim R package](https://mountainmath.github.io/cansim/) to access official data tables.
49-
50-
Each article includes:
51-
- The specific CANSIM table number
52-
- A direct link to the source data
53-
- The reference period for the statistics
54-
55-
## AI Transparency
56-
57-
This project uses AI (Claude by Anthropic) for two purposes:
58-
59-
1. **Topic Selection**: Identifying which statistical releases are most newsworthy
60-
2. **Article Writing**: Generating the text of each article based on the data
61-
62-
The AI follows strict guidelines to maintain the neutral, clinical voice of statistical reporting. It does not editorialize or make predictions—it simply reports the numbers.
63-
64-
**Important**: While we strive for accuracy, AI-generated content may contain errors. Always verify important statistics by consulting the [official Statistics Canada source](https://www.statcan.gc.ca/).
65-
66-
## The Daily Voice
67-
68-
Articles follow the style of Statistics Canada's The Daily:
69-
70-
- **Neutral and clinical** — no emotional language
71-
- **Inverted pyramid** — most important facts first
72-
- **Plain language** — accessible to general audiences
73-
- Headlines lead with the key number
74-
- Always compare to previous period AND year-over-year
75-
76-
## Open Source
77-
78-
The D-AI-LY is an open source project. You can view the code, report issues, or contribute on GitHub:
79-
80-
**[github.com/mountainmath/the-daily](https://github.com/mountainmath/the-daily)**
81-
82-
## Disclaimer
83-
84-
The D-AI-LY is not affiliated with Statistics Canada. This is an independent experimental project that uses publicly available data. For official statistics, please visit [statcan.gc.ca](https://www.statcan.gc.ca/).
24+
- [How The D-AI-LY Works](https://www.dshkol.com/post/the-daily/) — This is a blog post that goes into much more detail on how this system works, what each skill does, and how the skills were assembled.
25+
- [GitHub Repository](https://github.com/dshkol/thedaily) — I've published this project as an open-source repo. All content including custom SKILL.MD files is available in the repo here.
8526

8627
---
8728

docs/fr/about/index.md

Lines changed: 11 additions & 70 deletions
Original file line numberDiff line numberDiff line change
@@ -5,83 +5,24 @@ toc: false
55

66
# À propos du D-AI-LY
77

8-
Le D-AI-LY est un projet expérimental qui génère des bulletins statistiques à l'aide de l'intelligence artificielle. Il s'inspire de la publication officielle de Statistique Canada, [Le Quotidien](https://www.statcan.gc.ca/fr/quo/quo), qui constitue la première source de diffusion de nouvelles données statistiques au Canada depuis 1932.
8+
Le D-AI-LY génère des bulletins statistiques à partir de la base de données CANSIM de Statistique Canada en utilisant un système LLM basé sur des Skills. Il a été construit avec Claude Code mais devrait fonctionner avec tout outil CLI agentique capable d'invoquer des fichiers SKILL.MD. Il n'est aucunement affilié à Statistique Canada.
99

10-
## Ce que nous faisons
10+
## Processus
1111

12-
Chaque jour, Le D-AI-LY :
12+
1. Récupérer les métadonnées des tableaux CANSIM/NDM via le [progiciel R cansim](https://mountainmath.github.io/cansim/) pour identifier de manière autonome des données nouvelles et intéressantes et récupérer des objets de données structurées.
13+
2. Générer des articles bilingues (FR/EN) à l'aide d'un modèle LLM suivant des directives spécifiques sur le narratif, la voix, le ton et le style visuel.
14+
3. Publier et compiler un site statique en utilisant le cadre Observable.js.
1315

14-
1. **Analyse** la base de données CANSIM de Statistique Canada pour repérer les tableaux récemment mis à jour
15-
2. **Sélectionne** les sujets dignes d'intérêt selon leur actualité, l'intérêt public et la diversité sectorielle
16-
3. **Récupère** les données les plus récentes à l'aide de l'API officielle de Statistique Canada
17-
4. **Génère** des articles bilingues (français et anglais) expliquant les principales conclusions
18-
5. **Publie** les articles sur ce site Web
16+
Chaque article cite son tableau source, documente le code R pour la reproductibilité et renvoie aux données officielles de Statistique Canada.
1917

20-
Toutes les données proviennent directement de Statistique Canada. Les articles sont générés par l'IA et vérifiés pour leur exactitude.
18+
## Limitations
2119

22-
## Fonctionnement
20+
Le contenu généré par LLM passe par des revues automatisées mais peut très bien contenir des erreurs. Ne pas utiliser à des fins officielles et vérifier les statistiques en consultant la [source officielle de Statistique Canada](https://www.statcan.gc.ca/).
2321

24-
```
25-
┌─────────────────────────────────────────┐
26-
│ Automatisation quotidienne (8 h) │
27-
└─────────────────┬───────────────────────┘
28-
29-
┌─────────────▼─────────────┐
30-
│ Découverte de sujets (IA)│ Quoi de neuf aujourd'hui?
31-
└─────────────┬─────────────┘
32-
33-
┌─────────────▼─────────────┐
34-
│ Récupération (R/cansim) │ Obtenir les données StatCan
35-
└─────────────┬─────────────┘
36-
37-
┌─────────────▼─────────────┐
38-
│ Génération d'articles (IA)│ Rédiger en FR + EN
39-
└─────────────┬─────────────┘
40-
41-
┌─────────────▼─────────────┐
42-
│ Publication sur le site │ Compiler et déployer
43-
└───────────────────────────┘
44-
```
22+
## Plus d'information
4523

46-
## Sources des données
47-
48-
Toutes les données statistiques proviennent de la **base de données CANSIM de Statistique Canada** (maintenant appelée le Nouveau modèle de diffusion). Nous utilisons le [progiciel R cansim](https://mountainmath.github.io/cansim/) pour accéder aux tableaux officiels.
49-
50-
Chaque article comprend :
51-
- Le numéro du tableau CANSIM
52-
- Un lien direct vers les données sources
53-
- La période de référence des statistiques
54-
55-
## Transparence sur l'IA
56-
57-
Ce projet utilise l'IA (Claude d'Anthropic) à deux fins :
58-
59-
1. **Sélection des sujets** : Identifier les diffusions statistiques les plus dignes d'intérêt
60-
2. **Rédaction des articles** : Générer le texte de chaque article à partir des données
61-
62-
L'IA suit des directives strictes pour maintenir le ton neutre et clinique du reportage statistique. Elle n'éditorialise pas et ne fait pas de prédictions — elle rapporte simplement les chiffres.
63-
64-
**Important** : Bien que nous visions l'exactitude, le contenu généré par l'IA peut contenir des erreurs. Veuillez toujours vérifier les statistiques importantes en consultant la [source officielle de Statistique Canada](https://www.statcan.gc.ca/).
65-
66-
## Le style du Quotidien
67-
68-
Les articles suivent le style du Quotidien de Statistique Canada :
69-
70-
- **Neutre et clinique** — pas de langage émotionnel
71-
- **Pyramide inversée** — les faits les plus importants en premier
72-
- **Langage simple** — accessible au grand public
73-
- Les titres mettent en avant le chiffre clé
74-
- Toujours comparer à la période précédente ET à l'année précédente
75-
76-
## Code source ouvert
77-
78-
Le D-AI-LY est un projet à code source ouvert. Vous pouvez consulter le code, signaler des problèmes ou contribuer sur GitHub :
79-
80-
**[github.com/mountainmath/the-daily](https://github.com/mountainmath/the-daily)**
81-
82-
## Avertissement
83-
84-
Le D-AI-LY n'est pas affilié à Statistique Canada. Il s'agit d'un projet expérimental indépendant qui utilise des données accessibles au public. Pour les statistiques officielles, veuillez consulter [statcan.gc.ca](https://www.statcan.gc.ca/).
24+
- [Comment fonctionne Le D-AI-LY](https://www.dshkol.com/post/the-daily/) — Article de blogue qui explique en détail le fonctionnement de ce système, ce que fait chaque skill et comment les skills ont été assemblés.
25+
- [Dépôt GitHub](https://github.com/dshkol/thedaily) — Ce projet est publié en tant que dépôt open-source. Tout le contenu, y compris les fichiers SKILL.MD personnalisés, est disponible dans le dépôt.
8526

8627
---
8728

0 commit comments

Comments
 (0)