Skip to content

Commit 6b9f825

Browse files
authored
Merge branch 'main' into fixes-for-pristine-install
2 parents f0a69ff + 0065bd4 commit 6b9f825

26 files changed

+3263
-2442
lines changed

.github/workflows/pre-commit-tests.yaml

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -37,4 +37,4 @@ jobs:
3737
poetry run pytest -v
3838
- name: Verify tests results
3939
if: ${{ failure() }}
40-
run: exit 1
40+
run: exit 1

datasources.yaml

Lines changed: 37 additions & 35 deletions
Original file line numberDiff line numberDiff line change
@@ -269,7 +269,7 @@ domains:
269269
API: GEO.api.gouv.fr
270270
description: Référentiel géographique GEO - niveau commune
271271
type: JsonExtractor
272-
endpoint: /communes?fields=code,nom,population,departement,region,centre
272+
endpoint: /communes?fields=code,nom,population,departement,region,centre,epci
273273
format: json
274274

275275
arrondissements:
@@ -296,6 +296,15 @@ domains:
296296
name: excelfile_dfload
297297
type: notebook
298298

299+
geocodes_passage_annuel:
300+
API: Opendatasoft
301+
description: Table de passage annuelle 2025, équivalence codes géographiques 2025 et année précédente d'établissement de codes (2023)
302+
type: FileExtractor
303+
endpoint: /catalog/datasets/georef-france-matching-code/exports/csv?use_labels=true
304+
format: csv
305+
load_params:
306+
separator: ;
307+
299308
accueil:
300309

301310
cada_cph_huda:
@@ -550,7 +559,6 @@ domains:
550559

551560
population:
552561

553-
554562
by_age:
555563
API: INSEE.Melodi
556564
description: Répartition de la population par tranches d'âge
@@ -568,42 +576,21 @@ domains:
568576

569577
by_age_gender:
570578
API: INSEE.Melodi
571-
description: Répartition de la population par tranches d'âge et par genre (M/F, Cis/Trans)
579+
description: Répartition de la population par tranches d'âge et par genre
572580
type: MelodiExtractor
573-
endpoint: /data/DS_ESTIMATION_POPULATION # Dataset des estimations de population de l'INSEE
581+
endpoint: /data/DS_RP_POPULATION_PRINC # recensement données principales
574582
format: json
575583
extract_params:
576584
maxResult: 10000
577-
SEX:
578-
- M # Hommes (all)
579-
- M_cis # Hommes cis
580-
- F # Femmes (all)
581-
- F_cis # Femmes cis
582-
- TS # Personnes Trans
583-
- _Z # 'Non Applicable'
584-
EP_MEASURE: POP # Prendre uniquement la mesure de population
585+
TIME_PERIOD: 2022
586+
SEX: ["M", "F", "_T"]
587+
GEO: ["COM", "DEP", "REG"]
588+
RP_MEASURE: POP
585589
response_map:
586590
data: observations
587591
next: paging.next
588592
is_last: paging.isLast
589593

590-
# repartition_sexe_age:
591-
# API: INSEE.Melodi
592-
# description: repartition de la population par sexe et par tranche d'age
593-
# type: MelodiExtractor
594-
# endpoint: /data/DS_RP_POPULATION_PRINC
595-
# format: json
596-
# extract_params:
597-
# maxResult: 10000
598-
# TIME_PERIOD: 2021
599-
# GEO: ["COM","DEP","REG"]
600-
# SEX: ["F","M"]
601-
# AGE: ["Y_LT15","Y15T24","Y25T39","Y40T54","Y55T64","Y65T79","Y_GE80"]
602-
# response_map:
603-
# data: observations
604-
# next: paging.next
605-
# is_last: paging.isLast
606-
607594
population_superficie:
608595
API: INSEE.Melodi
609596
description: recuperation de la population et de la superficie pour calcul de densite
@@ -612,15 +599,31 @@ domains:
612599
format: json
613600
extract_params:
614601
maxResult: 10000
615-
startPeriod: "2009-01-01"
616-
endPeriod: "2025-10-01"
602+
TIME_PERIOD: 2022
617603
GEO: ["COM","DEP","REG"]
618604
RP_MEASURE: ["POP","SUP"]
619605
OCS: "_T"
620606
response_map:
621607
data: observations
622608
next: paging.next
623609
is_last: paging.isLast
610+
611+
population_totale:
612+
API: INSEE.Melodi
613+
description: recuperation des populations communale et totale des communes
614+
type: MelodiExtractor
615+
endpoint: /data/DS_POPULATIONS_REFERENCE
616+
format: json
617+
extract_params:
618+
maxResult: 10000
619+
TIME_PERIOD: 2022
620+
GEO: ["COM"]
621+
POPREF_MEASURE: ["PMUN", "PTOT"]
622+
page: 1
623+
response_map:
624+
data: observations
625+
next: paging.next
626+
is_last: paging.isLast
624627

625628
categorie_socio_pro:
626629
API: INSEE.Melodi
@@ -630,13 +633,12 @@ domains:
630633
format: json
631634
extract_params:
632635
maxResult: 10000
633-
startPeriod: "2009-01-01"
634-
endPeriod: "2025-10-01"
636+
TIME_PERIOD: 2022
635637
GEO: ["COM","DEP","REG"]
636638
SEX: "_T"
637639
RP_MEASURE: "POP"
638-
AGE: "Y_GE15"
639-
PCS: ["1","2","3","4","5","6","7","9"]
640+
AGE: "Y_GE15" # 15 years old or more
641+
PCS: ["1", "2", "3", "4", "5", "6", "7", "9", "_T"] # 8 was excluded (students), added it back just in case
640642
response_map:
641643
data: observations
642644
next: paging.next

dbt_odis/models/bronze/_odis_bronze__models.yml

Lines changed: 110 additions & 40 deletions
Original file line numberDiff line numberDiff line change
@@ -1101,6 +1101,12 @@ models:
11011101
- name: geo_coordonnees_longitude
11021102
description: Coordonnées longitudinales, string pour données en -01.00
11031103
data_type: text
1104+
- name: epci_code
1105+
description: Code de l'EPCI rattaché à la commune
1106+
data_type: integer
1107+
- name: epci_nom
1108+
description: Nom de l'EPCI rattaché à la commune
1109+
data_type: integer
11041110
- name: created_at
11051111
description: date d'extraction des données
11061112
data_type: timestamp without time zone
@@ -1209,6 +1215,25 @@ models:
12091215
description: date d'extraction des données
12101216
data_type: timestamp without time zone
12111217

1218+
- name: vw_geographical_references_geocodes_passage_annuel
1219+
description: Extraction du CSV avec l'équivalence des codes géographiques depuis la dernière année d'établissement des codes.
1220+
columns:
1221+
- name: geocode_year
1222+
description: Année la plus récente d'établissement des codes géographiques
1223+
data_type: text
1224+
- name: geocode_type
1225+
description: Type de code géographique ("COM", "ARM", "REG", etc.).
1226+
data_type: text
1227+
- name: geocode_type_name
1228+
description: Description de code géographique ("commune", "arrondisseent municipal", etc.).
1229+
data_type: text
1230+
- name: old_geocode
1231+
description: Ancien code géographique, à l'année d'établissement précédent la plus récente.
1232+
data_type: text
1233+
- name: geocode
1234+
description: Code géographique courant, à l'année d'établissement la plus récente.
1235+
data_type: text
1236+
12121237
# Logement
12131238
- name: logements_appartement
12141239
description: Extraction du JSON source logement nombre d'appartements par zone géographique
@@ -3699,37 +3724,56 @@ models:
36993724
- name: presentation_page_elus_communes
37003725

37013726
- name: presentation_page_epci
3727+
description: Extraction du JSON source geographical_references_epcis
3728+
columns:
3729+
- name: nom
3730+
description: Nom de l'EPCI
3731+
data_type: text
3732+
- name: code
3733+
description: Code SIREN de l'EPCI
3734+
data_type: integer
3735+
tests:
3736+
- unique
3737+
- name: population
3738+
description: Population totale regroupée en vigueur selon le dernier recensement INSEE
3739+
data_type: integer
3740+
- name: codesRegions
3741+
description: Code de la région associée
3742+
data_type: integer
3743+
- name: codesDepartements
3744+
description: Code du département associé
3745+
data_type: integer
37023746

37033747
- name: presentation_page_population_communes
37043748

3749+
# Population
37053750
- name: population_categorie_socio_pro
37063751
description: Extraction du JSON source CSP par population
37073752
columns:
3708-
- name: dimension_age
3753+
- name: age
37093754
description: Segmentation âge
3710-
data_type: integer
3711-
- name: dimensions_geo
3712-
description: "Clé primaire unique d'identification : Année de mesure - Type de zone géographique - Code INSEE (COM = 5 chiffres) ou Code postal (DEP = 3 chiffres et REG = 2 chiffres)"
37133755
data_type: text
3714-
tests:
3715-
- not_null
3716-
- name: dimensions_pcs
3717-
description: _
3756+
- name: geo
3757+
description: |-
3758+
Union année code - type de code - code géographique.
3759+
e.g. 2025-COM-01001.
3760+
L'année correspond à l'année de définition du code géographique par l'insee.
37183761
data_type: text
3719-
- name: dimensions_sex
3720-
description: _
3762+
- name: pcs
3763+
description: catégorie socio-professionnelle (de 1 à 9, 8 - étudiants non renseigné en 2022).
37213764
data_type: text
3722-
- name: dimensions_rp_measure
3765+
- name: sex
37233766
description: _
37243767
data_type: text
3725-
- name: dimensions_time_period
3726-
description: Période temporelle en année de mesure de la donnée
3768+
- name: rp_measure
3769+
description: Indicateur d'intérêt.
37273770
data_type: text
3728-
- name: measures_obs_value_niveau_value
3729-
description: nombre mesuré du type d'habitation = appartement par zone géographique et par année
3771+
- name: time_period
3772+
description: Période ou point dans le temps auquel l'observation se réfère effectivement.
3773+
data_type: text
3774+
- name: measure_value
3775+
description: Valeur de l'indicateur d'intérêt.
37303776
data_type: text
3731-
3732-
# Population
37333777

37343778
- name: population_by_age
37353779
description: Répartition de la population par tranches d'âge
@@ -3769,33 +3813,27 @@ models:
37693813
- name: id
37703814
description: index
37713815
data_type: integer
3772-
- name: dimensions_GEO
3773-
description: unité géographique (REG, DEP, COM)
3774-
data_type: text
3775-
- name: dimensions_SEX
3816+
- name: geo
37763817
description: |-
3777-
Filtre par genre (H/F et cis/trans).
3778-
_T = total tout confondu
3779-
H = Homme (all)
3780-
F = Femme (all)
3781-
H_cis = Homme cis
3782-
F_cis = Femme cis
3783-
TS = Personne trans
3818+
Union année code - type de code - code géographique.
3819+
e.g. 2025-COM-01001.
3820+
L'année correspond à l'année de définition du code géographique par l'insee.
37843821
data_type: text
3785-
- name: dimensions_AGE
3786-
description: filtre par âge
3822+
- name: sex
3823+
description: _
37873824
data_type: text
3788-
- name: dimensions_TIME_PERIOD
3789-
description: Période temporelle (millésime) de la donnée
3825+
- name: age
3826+
description: tranche d'âge.
37903827
data_type: text
3791-
- name: dimensions_EP_MEASURE
3792-
description: |-
3793-
Type de mesure.
3794-
POP = effectif de population
3828+
- name: rp_measure
3829+
description: Indicateur d'intérêt.
3830+
data_type: text
3831+
- name: time_period
3832+
description: Période ou point dans le temps auquel l'observation se réfère effectivement.
3833+
data_type: text
3834+
- name: measure_value
3835+
description: Valeur de l'indicateur d'intérêt.
37953836
data_type: text
3796-
- name: measures_OBS_VALUE_NIVEAU_value
3797-
description: valeur numérique
3798-
data_type: integer
37993837
- name: created_at
38003838
description: date d'extraction de la donnée
38013839
data_type: timestamp without time zone
@@ -3812,7 +3850,7 @@ models:
38123850
- name: nivgeo
38133851
description: |-
38143852
Niveau de granularité géographique.
3815-
Pour ce dateset, une seul valeur possible :
3853+
Pour ce dateset, une seule valeur possible :
38163854
COM = Commune
38173855
data_type: text
38183856
- name: codgeo
@@ -3832,3 +3870,35 @@ models:
38323870
- name: nb
38333871
description: TBD
38343872
data_type: float
3873+
3874+
- name: population_population_superficie
3875+
description: |-
3876+
Extraction de fichiers JSON avec données historiques population et superficie des territoires.
3877+
columns:
3878+
- name: id
3879+
description: index
3880+
data_type: integer
3881+
- name: geo
3882+
description: |-
3883+
Union année code - type de code - code géographique.
3884+
e.g. 2025-COM-01001.
3885+
L'année correspond à l'année de définition du code géographique par l'insee.
3886+
data_type: text
3887+
- name: ocs
3888+
description: |-
3889+
Catégorie du logement (seulement "_T", pour total).
3890+
data_type: text
3891+
- name: freq
3892+
description: Intervalle de temps séparant deux observations.
3893+
data_type: integer
3894+
- name: rp_measure
3895+
description: Indicateur d'intérêt.
3896+
data_type: text
3897+
- name: time_period
3898+
description: |-
3899+
Période ou point dans le temps auquel l'observation se réfère effectivement.
3900+
data_type: text
3901+
- name: measure_value
3902+
description: |-
3903+
Valeur de l'indicateur d'intérêt.
3904+
data_type: text

0 commit comments

Comments
 (0)