fix(netpol): vervang per-tenant allow-all NetworkPolicy door least-privilege baseline by anneschuth · Pull Request #76 · RijksICTGilde/RIG-Cluster

anneschuth · 2026-05-17T12:45:18Z

Probleem

OPI genereerde in elke tenant-namespace een allow-all NetworkPolicy
(podSelector: {}, ingress: [- {}], egress: [- {}], beide policyTypes).
Dat was geen opt-in. Gevolg: elke tenant-pod had onbeperkte ingress en egress
en kon bij:

datastores van andere tenants,
de Kubernetes API,
cloud-metadata endpoints,
willekeurige internetbestemmingen (exfiltratie).

Bovendien werd elke later toegevoegde default-deny door deze egress: [{}]
volledig teniet gedaan. De policy werd op twee plaatsen onvoorwaardelijk
weggeschreven naar GitOps: de infrastructure-namespace en de per-component
manifestlijst in project_manager.py.

Wijziging

allow-all-network-policy.yaml.jinja is verwijderd en vervangen door
tenant-baseline-network-policy.yaml.jinja. De baseline is default-deny met
expliciete, gescopete uitzonderingen.

Toegestaan:

DNS-egress (UDP/TCP 53) naar de kube-dns pods.
Verkeer binnen de eigen namespace (pod-naar-pod in dezelfde tenant).
Ingress vanaf de ingress-nginx controller, zodat gepubliceerde webapps
bereikbaar blijven.
Voor de infrastructure-namespace: ingress vanaf de eigen app-namespaces van
het project (afgeleid uit deployments), zodat de app zijn eigen PostgreSQL
blijft bereiken.
Per component: egress naar exact de datastores die het project heeft
aangevraagd. PostgreSQL via de *-infrastructure namespace van het project
(alleen als de component postgresql-database/namespace-postgresql-database
gebruikt), MinIO via de cluster-operations namespace (alleen als
minio-storage is gevraagd).

Geweigerd: al het overige ingress- en egressverkeer. De ongerestricteerde
egress: [{}] is volledig weg, wat de kern van de fix is.

Breder netwerk blijft mogelijk maar moet expliciet/opt-in via het
projectbestand (extra_egress_cidrs in de template), nooit als default.

Werking blijft intact

Gepubliceerde webapps blijven ingress-nginx-verkeer ontvangen.
App naar de eigen, door het project geprovisionde database blijft werken
(egress naar de infrastructure-namespace + ingress in die namespace vanaf de
app-namespaces).
Componenten zonder DB/MinIO krijgen geen cross-namespace egress.

Tests

Nieuw: tests/test_tenant_baseline_netpol.py (rood-groen, 9 tests). Rendert de
template en assert dat er geen lege allow-all ingress/egress-regel in zit en dat
DNS + gescopete regels aanwezig zijn; assert dat project_manager de baseline
emit (niet de allow-all) op beide aanroeppunten en dat de oude template
verwijderd is. Geslaagd: 9/9. ruff en pyright schoon op de gewijzigde
Python.

De volledige suite faalt bij collection door een bestaande, los van deze
wijziging staande breuk (Python 3.14.0b4 + pydantic 2.12.5 import fastapi).
De nieuwe test importeert bewust geen FastAPI en draait geisoleerd via
pytest tests/test_tenant_baseline_netpol.py --noconftest.

Residu

features/restrictive-network-policies.md beschrijft een breder
herontwerp (permissive/restrictive modi, aparte default-deny + deployment
policies) en verwijst nog naar de oude template. Dat is planningsdocumentatie,
geen code, en buiten de scope van deze fix. De kern (verwijderen van de
ongerestricteerde egress: [{}] en het vervangen door een gescopete baseline)
is hier afgerond.

Bevinding is pre-existing en onafhankelijk van andere openstaande fixes.

uittenbroekrobbert · 2026-05-18T07:46:12Z

⚠️ Conceptueel correct, maar drie blokkers voor merge — elk een functionele regressie. De allow-all NetworkPolicy was een echt tenant-isolatie-lek en deze baseline dicht de kern. Maar de huidige uitvoering breekt actieve tenants op meerdere assen.

Blokker 1: File-collision bij multi-component deployments

project_manager.py:4495-4530: de per-component loop schrijft onvoorwaardelijk naar tenant-baseline-network-policy.yaml met metadata.name: tenant-baseline-network-policy. Twee componenten in dezelfde namespace (bv. webapp + worker) → elke iteratie overschrijft het bestand én de K8s-resourcenaam is identiek. Resultaat: alleen de scoped egress van het laatste component overleeft. webapp (Postgres) raakt z'n DB kwijt als worker (MinIO) als laatste rendert.

Fix: één policy per namespace berekenen na alle componenten (union van datastore_namespaces over alle componenten in die namespace), niet per-component overschrijven. De namespace-scope is de juiste eenheid voor deze policy.

Blokker 2: Shared PostgreSQL/Redis worden niet meegenomen

project_manager.py:4500-4505: datastore_namespaces bevat alleen get_infrastructure_namespace(cluster, project_name) (= rig-prd-{project}-infrastructure). Maar volgens cluster_config.py:97 woont de shared Postgres in rig-prd-operations:

database_server: rig-db-rw.rig-prd-operations.svc.cluster.local

Idem voor shared Redis (rig-redis.rig-prd-operations). Een component met service: postgresql-database (shared, niet namespace-postgresql-database) krijgt dus geen netpath → DB onbereikbaar.

Fix: detecteer ook POSTGRESQL_DATABASE / REDIS / NAMESPACE_REDIS consumption, en voeg get_namespace(cluster) (= rig-prd-operations) toe aan datastore_namespaces als die diensten gebruikt worden.

Blokker 3: SSO/Keycloak-egress volledig gebroken

Geen keycloak-uitzondering in de baseline. keycloak_discovery_url in cluster_config.py:96 wijst naar https://keycloak.rijksapp.nl — extern. Tenants die SSO gebruiken verliezen alle OIDC-flow op de eerste reconciliation.

In project_manager.py:4198-4222 worden keycloak/SSO, redis/namespace-redis, authorization-wall, metrics-scraper als services herkend, maar geen van die detecties leidt tot een egress-regel in de baseline. Code-pad is wel aanwezig (component_uses_sso etc.) maar de consequentie is nul.

Fix-opties:

FQDN-based egress voor keycloak.rijksapp.nl via een interne ingress-terug-naar-binnen (allow egress naar de ingress-nginx namespace),
of egress-CIDR voor de externe Keycloak (kwetsbaar voor IP-wisselingen).
Voor authorization-wall/metrics-scraper: intra-namespace egress moet sowieso open zijn (de sidecar zit in dezelfde pod), maar verifieer of er externe roundtrips zijn.

Andere belangrijke punten

`ingress_namespace` defaultet `nginx`, ODCN gebruikt `openshift-ingress`

tenant-baseline-network-policy.yaml.jinja:20 — variabele ingress_namespace wordt nergens in project_manager.py gezet. Op ODCN (uses_capsule: True, OpenShift Router) zit de ingress-controller in openshift-ingress, niet ingress-nginx. Resultaat: alle gepubliceerde tenant-webapps krijgen geen ingress-traffic meer.

Fix: maak ingress_controller_namespace configureerbaar per cluster (cluster_config.py), pass het in de template-variabelen. Verifieer waarde voor ODCN op een echte cluster.

`extra_egress_cidrs` is vapor

tenant-baseline-network-policy.yaml.jinja:64-71 rendert een egress-array uit extra_egress_cidrs, maar dit veld is nergens gedefinieerd: geen schema-veld in project_v2.json, geen parser in project_file_handler.py, geen code die het zet. Tenants hebben dus geen escape-hatch voor externe API's.

Fix-opties:

Implementeer het echt: schema-veld + parser + CIDR-sanitization (block metadata-IP 169.254.169.254, RFC1918 buiten cluster-CIDR).
Of verwijder de template-takken tot het werkelijk geïmplementeerd is (YAGNI).

Migratiepad voor bestaande projecten

Volgende reconciliation/edit-save zal voor élk bestaand project nieuwe restrictivere policies pushen. Geen feature-flag, geen permissive grace-mode. Tenants die nu naar externe SaaS uitbellen breken stilletjes.

Voorstel: implementeer een cluster-config flag (permissive_network_baseline: true default, switch per cluster naar false na migratie) + per-project opt-out. Sluit aan op features/restrictive-network-policies.md dat dit al beschrijft maar nog niet gekoppeld is aan deze PR.

Wat tests niet vangen

De negen huidige tests dekken alleen template-niveau en project_manager-source-grep. Geen test voor de multi-component file-collision (blokker 1), shared postgres-routing (blokker 2), of SSO-egress (blokker 3). Allemaal toe te voegen.

Klein voordeel

ArgoCD heeft prune: true aan (argocd-application.yaml.jinja:30) dus de oude allow-all wordt automatisch verwijderd na merge. Goed — anders bleef de allow-all naast de nieuwe baseline staan en zou de fix geneutraliseerd worden (NetworkPolicies zijn additief). Wel handmatig verifiëren na merge in een paar rig-prd-* namespaces.

Vraag: wil je deze PR opsplitsen in stappen (eerst de template-baseline correct krijgen, dán de project_manager wiring), of in één keer doorwerken? Drie blokkers in één PR is voor een review-cyclus aan de zware kant.

uittenbroekrobbert · 2026-05-19T07:00:29Z

Follow-up: 1 van 3 blokkers deels aangepakt, 3 persisteren

Commit `364b9cf1` adresseert Blokker 3 (Keycloak/Redis egress) deels — maar op ODCN nog steeds verkeerd. Plus Blokker 1 en 2 zijn niet aangeraakt. Verifieerd in worktree:

Blokker 1 — file-collision multi-component (ONGEWIJZIGD)

`project_manager.py:4536-4538`: `generate_network_policy_manifest_name("tenant-baseline")` retourneert `tenant-baseline-network-policy` zonder component-suffix (`utils/naming.py:1481`). Beide `generate_network_policy_name` en `generate_network_policy_manifest_name` zijn niet ge-parametriseerd op component. Per-component loop schrijft naar hetzelfde pad → laatste component wint.

Fix-richting: bereken de union van `component_uses_*` flags vóór de component-loop, render één policy per namespace na de loop. Dat past ook beter bij de semantiek (`podSelector: {}` is namespace-breed, niet component-specifiek).

Blokker 2 — shared PostgreSQL routing (ONGEWIJZIGD)

`project_manager.py:4500-4503`: route gaat naar `get_infrastructure_namespace(cluster, project_name)` (= `rig-prd-{project}-infrastructure`) zodra `component_uses_postgresql` true is. Maar de flag pakt zowel `POSTGRESQL_DATABASE` (shared) als `NAMESPACE_POSTGRESQL_DATABASE` (dedicated). Shared Postgres op ODCN woont op `rig-prd-operations` (`cluster_config.py:97`: `rig-db-rw.rig-prd-operations.svc.cluster.local`), niet in de infrastructure-namespace van het project.

Gevolg: een component met `service: postgresql-database` (shared) krijgt egress naar de verkeerde namespace en kan de DB niet bereiken onder default-deny.

Fix-richting: splits de detectie. Voor `POSTGRESQL_DATABASE` (shared) → `get_namespace(cluster)` (= `rig-prd-operations`). Voor `NAMESPACE_POSTGRESQL_DATABASE` (dedicated) → `get_infrastructure_namespace(cluster, project_name)`. De twee zijn niet uitwisselbaar.

Blokker 3 — Keycloak egress (DEELS, MAAR ALSNOG VERKEERD OP ODCN)

`project_manager.py:4521-4522` voegt nu `get_cluster_namespace(cluster)` + `ingress-nginx` toe als `component_uses_sso`. Twee problemen:

Keycloak woont niet in de cluster-namespace op ODCN. `infrastructure/bootstrap/infrastructure/keycloak/controller/overlays/odcn/kustomization.yaml:3` zegt `namespace: rig-system`, niet `rig-prd-operations`. `get_cluster_namespace(cluster)` levert `rig-prd-operations` voor odcn-production — egress gaat dus naar de verkeerde plek.
Ingress controller heet niet `ingress-nginx` op ODCN. ODCN gebruikt de OpenShift Router in `openshift-ingress`. De hardcoded literal `"ingress-nginx"` op regel 4522 dekt alleen het local/sandbox-pad.

`cluster_config` heeft `keycloak_discovery_url` (publieke FQDN) maar geen `keycloak_namespace` en geen `ingress_controller_namespace`. Beide zijn nodig om dit per cluster correct te configureren.

Fix-richting: voeg toe aan `cluster_config.py`:

`keycloak_namespace` (local/sandbox: `rig-system`, odcn: `rig-system`)
`ingress_controller_namespace` (local/sandbox: `ingress-nginx`, odcn: `openshift-ingress`)

Plus helpers `get_keycloak_namespace(cluster)` en `get_ingress_controller_namespace(cluster)`. Gebruik die in plaats van de hardcoded `"ingress-nginx"` en `get_cluster_namespace`.

Aanvullend — template default `ingress_namespace` ook verkeerd op ODCN

`tenant-baseline-network-policy.yaml.jinja:20`: `{{ ingress_namespace | default("ingress-nginx") }}`. `project_manager.py:4530-4535` zet `ingress_namespace` niet als template-variabele, dus de default kicks in voor élke cluster — inclusief ODCN waar het `openshift-ingress` moet zijn. Gevolg: gepubliceerde webapps op ODCN raken hun ingress-traffic kwijt. Zelfde fix-richting als hierboven.

Tests

`tests/test_tenant_baseline_netpol.py` (9 tests) groen, maar dekt geen van bovenstaande scenarios. Tests bevestigen alleen template-shape + grep-niveau code-presence. Voor merge-blokkade is een testset nodig die:

multi-component dezelfde namespace rendert en assert dat egress-union klopt (Blokker 1)
shared vs dedicated postgres elk de juiste namespace krijgt (Blokker 2)
per-cluster Keycloak en ingress-namespace correct doorvloeien (Blokker 3 + aanvullend)

Wat te doen

Mijn voorkeur: deze PR opsplitsen of zware revisie in plaats van augmentation-by-comment. De vier punten raken `tenant-baseline-network-policy.yaml.jinja`, `cluster_config.py`, `project_manager.py` en `naming.py`/`utils` — dat is een herontwerp van de policy-emissie. Bestaande projecten gaan stuk bij eerste reconciliation als deze in huidige vorm landt op ODCN.

Als je liever hebt dat ik de augmentation push (zoals bij #75), zeg het en ik doe het in één commit met testdekking voor de drie blokkers. Geen merge in huidige vorm.

uittenbroekrobbert · 2026-05-19T07:02:17Z

Conclusie na overleg: niet mergen in huidige vorm

Twee overwegingen die deze PR opzij zetten:

1. Mismatch met de bestaande design-doc

`features/restrictive-network-policies.md` beschrijft een per-deployment model: pods praten alleen met andere pods uit hun eigen deployment (via het bestaande `app: ` label) plus gedeelde infra. Deze PR doet per-namespace met `podSelector: {}` — een tenant-pod kan alle andere tenant-pods in dezelfde namespace bereiken, ook van losstaande deployments. Dat is een ander (lossere) scope dan de design-doc voorschrijft.

De PR-omschrijving erkent dit zelf ("`features/restrictive-network-policies.md` beschrijft een breder herontwerp ... buiten de scope van deze fix"). Maar dat "bredere herontwerp" is exact het werkelijk gewenste model. Een tussenstap die het verkeerde scope-niveau pakt creëert later weer een migratie.

2. Internet-egress hoeft niet zo strikt

Het oorspronkelijke probleem (cross-tenant netwerktoegang tot gedeelde datastores) zit aan de ingress-kant van de datastores, en is in PR #75 opgelost (`namespaceSelector: {}` → expliciete allowlist op postgres/minio/vault). Tenants strak op egress naar het internet zetten is een ander probleem — niet noodzakelijk op dezelfde merge-as.

Voorstel

Deze PR sluiten.
Het werk verplaatsen naar een follow-up die `features/restrictive-network-policies.md` volgt (per-deployment, label-based, in fasen).
De cleanup-component (verwijderen `allow-all-network-policy.yaml.jinja` + tests dat het niet terugkeert) eventueel als losse kleine PR landen, los van het nieuwe model.

Drie blokkers en het scope-mismatch maken deze PR niet de juiste landingsplaats. Geen kritiek op het werk — het probleem dat de PR adresseert is reëel — maar de definitieve fix verdient een implementatie die de design-doc volgt.

uittenbroekrobbert · 2026-05-19T07:23:18Z

Refactor gepusht (`ad8de54b`): per-deployment baseline + permissieve egress

Na overleg is de aanpak veranderd: in plaats van een strikte default-deny per component die te veel gevallen miste, levert deze commit een permissieve baseline per deployment. Cross-tenant verkeer is dicht; internet egress (HTTP/HTTPS) blijft open. Stricter regelen volgt later via `features/restrictive-network-policies.md`.

Wat is veranderd

Per-deployment in plaats van per-component

De baseline wordt nu één keer per deployment geëmit, ná de component-loop. Lost de file-collision op die het laatste-component-wint-effect veroorzaakte.
Resource- en bestandsnaam zijn nu `{deployment}-tenant-baseline-network-policy`, dus meerdere deployments in dezelfde namespace botsen niet.

Pod-selector via een nieuw `deployment` label

`deployment.yaml.jinja` zet voortaan `deployment: "{{ deployment_name }}"` als pod-label (additief; geen Deployment.spec.selector-aanpassing).
De NetworkPolicy selecteert die pods via `matchLabels: deployment: `. Helm/helmfile pods dragen dat label niet en vallen daardoor buiten elke per-deployment policy — voor hen geldt nog steeds Kubernetes' default-allow (status quo). Een aparte baseline voor helm/helmfile is een follow-up.

Per-cluster benoemde namespaces in plaats van hardcoded strings

`cluster_config.py` heeft nu `backup_namespace` en `ingress_controller_namespace` per cluster, met `get_backup_namespace()` / `get_ingress_controller_namespace()` helpers.
Waarden: local/sandbox → `rig-backup-destination` + `ingress-nginx`; odcn-production → `rig-prd-backup` + `openshift-ingress`. Lost het ODCN-mismatch op uit de eerdere review.

Baseline-inhoud (permissief maar gescoped):

Ingress van: eigen deployment-pods, ingress controller, ops-namespace, backup-namespace, plus de project-app-namespaces voor de infra-ns-variant.
Egress naar: eigen deployment-pods, kube-dns, ops-namespace, backup-namespace, project's infra-namespace (als die bestaat), en internet (HTTP/HTTPS) met cloud-metadata IP geblokkeerd.

Pre-merge gate (verplicht)

`kustomize build` werkt niet lokaal voor het OPI-pad (Python rendert), maar op staging draaien vóór merge:
- Een bestaand multi-component project → één policy in de namespace met deployment-selector, niet meer per-component.
- Op ODCN: een tenant-pod kan inderdaad `rig-prd-operations` (DB/Redis/MinIO) bereiken, `rig-prd-backup` bereiken, en de `openshift-ingress` controller kan tenant-pods bereiken.
- Een helm/helmfile-deployment pod blijft bereikbaar (geen policy selecteert 'm).
Bestaande tenants: bij eerste reconciliation krijgt elk project een nieuw policy-bestand met deployment-suffix. Het oude `tenant-baseline-network-policy.yaml` zonder suffix wordt door ArgoCD geprund (PR-omschrijving bevestigt `prune: true`).

Wat NIET in deze PR zit (bewust)

Helm/helmfile baseline: status quo (geen policy → default-allow). Aparte follow-up nodig.
Strictere internet egress (block 80/443 standaard, opt-in via project-config): future-werk per `features/restrictive-network-policies.md`.
Cluster-isolation in tenant-namespace tussen losse deployments: per-deployment policy biedt dit op label-niveau, maar Helm-pods zonder label kunnen onbedoeld bij elkaars buren komen. Onderdeel van future-werk.

Tests: 17/17 groen via `pytest tests/test_tenant_baseline_netpol.py --noconftest`. Ruff/format/pyright pre-commit schoon.

uittenbroekrobbert · 2026-05-19T11:04:10Z

Follow-up issues aangemaakt

Helm/helmfile per-deployment NetworkPolicy baseline #84 — Helm/helmfile per-deployment baseline (huidige status: default-allow voor helm-pods)
Restrictive internet egress mode in tenant baseline NetworkPolicy #85 — Restrictive internet egress mode via extra_egress_cidrs (features/restrictive-network-policies.md)

This doc belongs to a different scope (PR #76 era). Will be re-introduced in its proper PR if needed.

…ivilege baseline OPI schreef in elke tenant-namespace een allow-all NetworkPolicy (podSelector {}, ingress [{}], egress [{}], beide policyTypes). Dat hief egress-containment platformbreed op: elke tenant-pod kon bij datastores van andere tenants, de Kubernetes API, cloud-metadata en willekeurige internetbestemmingen, en een latere default-deny werd door deze egress [{}] teniet gedaan. Het was geen opt-in. De allow-all template is verwijderd en vervangen door tenant-baseline-network-policy.yaml.jinja: default-deny met expliciete, gescopete uitzonderingen. Toegestaan: DNS-egress naar kube-dns, verkeer binnen de eigen namespace, ingress vanaf de ingress-nginx controller (zodat gepubliceerde webapps bereikbaar blijven), en egress naar exact de datastore-namespaces die het project heeft aangevraagd (PostgreSQL in de infrastructure-namespace van het project, MinIO alleen als minio-storage is gevraagd). Beide aanroeppunten in project_manager.py (infrastructure-namespace en per-component manifestlijst) emitteren nu de baseline. Breder netwerk blijft mogelijk maar moet expliciet/opt-in via het projectbestand (extra_egress_cidrs), nooit als default.

De default-deny baseline scopete egress alleen naar PostgreSQL en MinIO. Componenten die Redis of SSO (Keycloak) gebruiken kregen wel de bijbehorende secrets en env-vars, maar geen egress-regel naar de Redis-service of de Keycloak back-channel. Onder de default-deny baseline brak daardoor elke Redis- of SSO-afhankelijke tenant-app. Redis (gedeeld en namespace) resolvet via get_redis_server() naar rig-redis.<cluster-namespace>. SSO-componenten draaien de OIDC back-channel tegen Keycloak, dat via de publieke ingress-hostname loopt en dus ook door ingress-nginx hairpint. Beide egress-doelen worden nu toegevoegd, met deterministische deduplicatie. Test uitgebreid zodat deze regressie niet opnieuw kan optreden.

Lost de drie blokkers uit de eerdere review op door de baseline-emissie te herontwerpen: 1. File-collision (per-component overschrijven): de baseline wordt nu één keer per deployment gerendered, na de component-loop, met een deployment-specifieke resource- en bestandsnaam (`{deployment}-tenant-baseline-network-policy`). Twee componenten in dezelfde namespace botsen niet meer. 2. Shared Postgres / Redis / Keycloak routing: de policy verwijst naar per-cluster benoemde namespaces in plaats van per-component-gehakte service-detectie. Nieuwe `cluster_config` velden + `get_backup_namespace()` en `get_ingress_controller_namespace()` helpers. Op odcn-production matchen die nu de realiteit: `rig-prd-operations`, `rig-prd-backup`, `openshift-ingress`. 3. Per-cluster ingress controller: hardcoded `ingress-nginx` is weg, loopt nu via `get_ingress_controller_namespace(cluster)`. Selector op pod-niveau via een nieuw `deployment: <name>` label op deployment.yaml.jinja, zodat meerdere deployments in dezelfde namespace elk hun eigen policy hebben en helm/helmfile pods (zonder dit label) buiten de policy vallen — daar geldt status quo (default-allow) tot een aparte baseline volgt. De baseline staat policy default-deny binnen het pod-vlak, maar laat internet egress (HTTP/HTTPS) bewust open (m.u.v. het cloud-metadata IP). Verdere internet-restrictie is een follow-up uit features/restrictive-network-policies.md. Tests volledig herschreven (17/17 groen, geen FastAPI-collectie nodig) om de nieuwe shape, per-cluster overrides en het pod-label te dekken.

Cloud metadata IP is op ODCN niet bereikbaar (geverifieerd via curl vanuit pod: connection refused). De except-clausule blokkeerde niets en gaf valse suggestie dat we tegen iets reëel beschermden.

Per ODCN docs (docs/knowledge/odcn-ingress-controller.md): de aanbevolen NetworkPolicy match is pod-selector op ingresscontroller.operator.openshift.io/deployment-ingresscontroller naast namespaceSelector. Daarmee alleen de 'rig' router-pods, niet eventuele andere customer-routers in dezelfde namespace. cluster_config heeft nu ingress_controller_selector (dict met namespace + pod_labels). Sandbox/local laten pod_labels leeg (nginx geen OpenShift- specifieke labels). Plus: test_internet_egress_is_permissive — geen 169.254 exception meer (eerder verwijderd want IP is op ODCN niet bereikbaar).

Rebase op main introduceerde een dubbele dict-key — ruff F601 catchte het in CI.

… flag PR #71 made handle_create_project's existence check conditional on payload['is_new_project'] == True (so edit/update flows that reuse the create_project task aren't blocked). The existing test from PR #70 still ran without the flag and expected the block to fire -- now silently passes through. Add the flag, and add a complementary test that an edit-flow payload (no flag) DOES overwrite an existing file.

- ContainerImageConverter.write retourneert None bij lege invoer, samen met remove_when_none=True op COMPONENT_IMAGE_EDITABLE wordt de key uit het YAML weggelaten i.p.v. als lege string geschreven. - Schema-pattern accepteert nu ook een lege string als vangnet voor bestaande YAMLs of code-paden die nog "image: " kunnen schrijven. Voorheen accepteerde de wizard een lege image, maar wees de schema-validator het project later af met "'' does not match ^[A-Za-z0-9]...".

…validatie De asyncio-pump die als vervanger voor de oude shell-pipeline werd geintroduceerd had subtiele race-bugs (WriteUnixTransport closed=True tijdens stream). Vervangen door een subprocess.Popen-keten (pg_dump | sed | psql) via OS-pipes, gewikkeld in asyncio.to_thread, zodat de event-loop niet blokkeert maar het OS de stream zelf afhandelt. Defense-in-depth aan de subprocess-grens: - _validate_in_cluster_host: alleen K8s service-namen of *.svc.cluster.local FQDNs worden geaccepteerd, externe hosts geweigerd. - _validate_pg_port: allow-list (op dit moment alleen 5432). - _validate_pg_password_safe: NUL/CR/LF in wachtwoord geweigerd om argv-/env-injectie via een wachtwoord te voorkomen. - Schema-naam wordt als identifier behandeld en geparseerd door pg_dump zelf; sed doet alleen de regel-geankerde 'CREATE SCHEMA ' -> 'CREATE SCHEMA IF NOT EXISTS ' rewrite. De obsolete _rewrite_create_schema-helper en bijbehorende test_pgdump_clone_rewrite.py vervallen; sed neemt de rewrite over.

Na de centrale CSRF-bescherming (#71) miste de Herverwerken-knop in het danger-confirm-modal de X-CSRF-Token header. Klikken faalde daardoor met een 403 op /projects/<naam>/refresh.

Zonder vaste SECRET_KEY mint Field(default_factory=generate_secret_key) per process een nieuwe random key, waardoor dev-sessies elke pod-restart verlopen. Vaste plaintext-key in de sandbox-overlay (niet-internet-facing dev cluster) houdt sessies stabiel tussen rebuilds. Raakt alleen sandboxed-local; odcn-production overlay is ongewijzigd.

…erImageConverter

This was referenced May 19, 2026

Helm/helmfile per-deployment NetworkPolicy baseline #84

Open

Restrictive internet egress mode in tenant baseline NetworkPolicy #85

Open

uittenbroekrobbert force-pushed the fix/tenant-baseline-netpol branch from f6d26d7 to 5566538 Compare May 26, 2026 18:02

uittenbroekrobbert added a commit that referenced this pull request May 28, 2026

remove stray ingress doc accidentally included in CSRF commit

d39c044

This doc belongs to a different scope (PR #76 era). Will be re-introduced in its proper PR if needed.

anneschuth and others added 6 commits May 28, 2026 14:56

fix(netpol): geen 169.254.169.254 exception in tenant baseline

9d49493

Cloud metadata IP is op ODCN niet bereikbaar (geverifieerd via curl vanuit pod: connection refused). De except-clausule blokkeerde niets en gaf valse suggestie dat we tegen iets reëel beschermden.

fix(netpol): dedupe deployment_name in variables dict

bf24be7

Rebase op main introduceerde een dubbele dict-key — ruff F601 catchte het in CI.

uittenbroekrobbert force-pushed the fix/tenant-baseline-netpol branch from de57169 to bf24be7 Compare May 28, 2026 13:27

uittenbroekrobbert mentioned this pull request May 28, 2026

Strictere internet egress: block 80/443 standaard, opt-in via project-config #113

Closed

uittenbroekrobbert and others added 9 commits May 28, 2026 16:02

fix(modals): voeg CSRF-token toe aan Herverwerken-knop

3c5ae80

Na de centrale CSRF-bescherming (#71) miste de Herverwerken-knop in het danger-confirm-modal de X-CSRF-Token header. Klikken faalde daardoor met een 403 op /projects/<naam>/refresh.

docs(weekly): ZAD update 10 april t/m 29 mei 2026

d2475ea

docs(weekly): trim toekomst-sectie en aanscherpingen

d1e81a5

test(converters): pas test_write_empty aan op None-retour van Contain…

eb71226

…erImageConverter

Merge branch 'main' into fix/tenant-baseline-netpol

00e19d0

uittenbroekrobbert merged commit 527ff9c into main May 29, 2026
13 of 15 checks passed

uittenbroekrobbert deleted the fix/tenant-baseline-netpol branch May 29, 2026 14:51

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

fix(netpol): vervang per-tenant allow-all NetworkPolicy door least-privilege baseline#76

fix(netpol): vervang per-tenant allow-all NetworkPolicy door least-privilege baseline#76
uittenbroekrobbert merged 15 commits into
mainfrom
fix/tenant-baseline-netpol

anneschuth commented May 17, 2026

Uh oh!

uittenbroekrobbert commented May 18, 2026

Uh oh!

uittenbroekrobbert commented May 19, 2026

Uh oh!

uittenbroekrobbert commented May 19, 2026

Uh oh!

uittenbroekrobbert commented May 19, 2026

Uh oh!

uittenbroekrobbert commented May 19, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Uh oh!

Conversation

anneschuth commented May 17, 2026

Probleem

Wijziging

Werking blijft intact

Tests

Residu

Uh oh!

uittenbroekrobbert commented May 18, 2026

Blokker 1: File-collision bij multi-component deployments

Blokker 2: Shared PostgreSQL/Redis worden niet meegenomen

Blokker 3: SSO/Keycloak-egress volledig gebroken

Andere belangrijke punten

ingress_namespace defaultet nginx, ODCN gebruikt openshift-ingress

extra_egress_cidrs is vapor

Migratiepad voor bestaande projecten

Wat tests niet vangen

Klein voordeel

Uh oh!

uittenbroekrobbert commented May 19, 2026

Follow-up: 1 van 3 blokkers deels aangepakt, 3 persisteren

Blokker 1 — file-collision multi-component (ONGEWIJZIGD)

Blokker 2 — shared PostgreSQL routing (ONGEWIJZIGD)

Blokker 3 — Keycloak egress (DEELS, MAAR ALSNOG VERKEERD OP ODCN)

Aanvullend — template default `ingress_namespace` ook verkeerd op ODCN

Tests

Wat te doen

Uh oh!

uittenbroekrobbert commented May 19, 2026

Conclusie na overleg: niet mergen in huidige vorm

1. Mismatch met de bestaande design-doc

2. Internet-egress hoeft niet zo strikt

Voorstel

Uh oh!

uittenbroekrobbert commented May 19, 2026

Refactor gepusht (`ad8de54b`): per-deployment baseline + permissieve egress

Wat is veranderd

Pre-merge gate (verplicht)

Wat NIET in deze PR zit (bewust)

Uh oh!

uittenbroekrobbert commented May 19, 2026

Follow-up issues aangemaakt

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

`ingress_namespace` defaultet `nginx`, ODCN gebruikt `openshift-ingress`

`extra_egress_cidrs` is vapor