@@ -33,17 +33,17 @@ global:
3333 ctrlRuntimeEnabled : true
3434
3535 nodeSelector : {}
36-
37- tolerations :
38- - operator : Exists
39-
36+
37+ tolerations :
38+ - operator : Exists
39+
4040 affinity : {}
41-
41+
4242 systemNodeSelector :
4343 node-role.kubernetes.io/control-plane : " "
44-
44+
4545 systemNodeTolerations :
46- - operator : Exists
46+ - operator : Exists
4747
4848 gpuHealthMonitor :
4949 enabled : true
@@ -73,7 +73,7 @@ global:
7373
7474 inclusterFileServer :
7575 enabled : true
76-
76+
7777 janitor :
7878 enabled : true
7979
@@ -91,13 +91,13 @@ global:
9191
9292 eventExporter :
9393 enabled : true
94-
94+
9595 metricsPort : 2112
9696
9797mongodb-store :
9898 useBitnami : true
9999 usePerconaOperator : false
100-
100+
101101 job :
102102 nodeSelector :
103103 node-role.kubernetes.io/control-plane : " "
@@ -138,26 +138,26 @@ mongodb-store:
138138 - operator : Exists
139139 podDisruptionBudget :
140140 maxUnavailable : 1
141-
141+
142142 sharding :
143143 enabled : false
144-
144+
145145 logcollector :
146146 enabled : false
147-
147+
148148 tls :
149149 mode : requireTLS
150150
151151 secrets :
152152 keyFile : mongodb-keyfile
153153 encryptionKey : mongodb-encryption-key
154-
154+
155155 backup :
156156 enabled : false
157157 storages : {}
158158 tasks : []
159159 volumeMounts : []
160-
160+
161161 finalizers : []
162162
163163 psmdb :
@@ -170,18 +170,18 @@ mongodb-store:
170170 repository : ghcr.io/rtsp/docker-mongosh
171171 tag : " 2.5.2"
172172 pullPolicy : IfNotPresent
173-
173+
174174 # Bitnami MongoDB configuration
175175 mongodb :
176176 replicaCount : 1
177177 nodeSelector :
178178 node-role.kubernetes.io/control-plane : " "
179-
179+
180180 tolerations :
181- - operator : Exists
181+ - operator : Exists
182182
183183 jobTolerations :
184- - operator : Exists
184+ - operator : Exists
185185
186186 image :
187187 registry : " docker.io"
@@ -193,7 +193,7 @@ mongodb-store:
193193 replicaset :
194194 existingSecrets :
195195 - " mongo-server-cert-0"
196-
196+
197197 image :
198198 registry : " docker.io"
199199 repository : " bitnamilegacy/nginx"
@@ -220,13 +220,13 @@ fault-quarantine:
220220 affinity :
221221 podAntiAffinity :
222222 requiredDuringSchedulingIgnoredDuringExecution :
223- - labelSelector :
224- matchLabels :
225- app.kubernetes.io/name : kwok
226- namespaceSelector :
227- matchLabels :
228- kubernetes.io/metadata.name : kube-system
229- topologyKey : kubernetes.io/hostname
223+ - labelSelector :
224+ matchLabels :
225+ app.kubernetes.io/name : kwok
226+ namespaceSelector :
227+ matchLabels :
228+ kubernetes.io/metadata.name : kube-system
229+ topologyKey : kubernetes.io/hostname
230230
231231fault-remediation :
232232 replicaCount : 1
@@ -237,56 +237,61 @@ fault-remediation:
237237 enabled : true
238238 image :
239239 repository : localhost:5001/ghcr.io_nvidia_nvsentinel_log-collector
240- tag : latest
241- pullPolicy : Always
242- timeout : " 10s" # Short timeout for faster testing (production default: "10m")
240+ tag : latest
241+ pullPolicy : Always
242+ timeout : " 10s" # Short timeout for faster testing (production default: "10m")
243243 env :
244- MOCK_MODE : " true"
244+ MOCK_MODE : " true"
245245 affinity :
246246 podAntiAffinity :
247247 requiredDuringSchedulingIgnoredDuringExecution :
248- - labelSelector :
249- matchLabels :
250- app.kubernetes.io/name : kwok
251- namespaceSelector :
252- matchLabels :
253- kubernetes.io/metadata.name : kube-system
254- topologyKey : kubernetes.io/hostname
248+ - labelSelector :
249+ matchLabels :
250+ app.kubernetes.io/name : kwok
251+ namespaceSelector :
252+ matchLabels :
253+ kubernetes.io/metadata.name : kube-system
254+ topologyKey : kubernetes.io/hostname
255+
255256
256257node-drainer :
257258 logLevel : debug
258259
259260 affinity :
260261 podAntiAffinity :
261262 requiredDuringSchedulingIgnoredDuringExecution :
262- - labelSelector :
263- matchLabels :
264- app.kubernetes.io/name : kwok
265- namespaceSelector :
266- matchLabels :
267- kubernetes.io/metadata.name : kube-system
268- topologyKey : kubernetes.io/hostname
263+ - labelSelector :
264+ matchLabels :
265+ app.kubernetes.io/name : kwok
266+ namespaceSelector :
267+ matchLabels :
268+ kubernetes.io/metadata.name : kube-system
269+ topologyKey : kubernetes.io/hostname
270+
269271
270272health-events-analyzer :
271273 logLevel : debug
272274
273275 affinity :
274276 podAntiAffinity :
275277 requiredDuringSchedulingIgnoredDuringExecution :
276- - labelSelector :
277- matchLabels :
278- app.kubernetes.io/name : kwok
279- namespaceSelector :
280- matchLabels :
281- kubernetes.io/metadata.name : kube-system
282- topologyKey : kubernetes.io/hostname
278+ - labelSelector :
279+ matchLabels :
280+ app.kubernetes.io/name : kwok
281+ namespaceSelector :
282+ matchLabels :
283+ kubernetes.io/metadata.name : kube-system
284+ topologyKey : kubernetes.io/hostname
283285
284286janitor :
285287 config :
286288 cspProviderHost : " janitor-provider.nvsentinel.svc.cluster.local:50051"
287289 webhook :
288290 certIssuer : " janitor-selfsigned-issuer"
289291
292+ janitorProvider :
293+ csp : kind
294+
290295labeler :
291296 logLevel : debug
292297 # Test kata label override with the annotation present on kata test nodes
@@ -295,7 +300,7 @@ labeler:
295300
296301csp-health-monitor :
297302 logLevel : debug
298- cspName : " gcp" # this will be updated to aws as well dynamically during tests
303+ cspName : " gcp" # this will be updated to aws as well dynamically during tests
299304 quarantineTriggerEngine :
300305 logLevel : debug
301306 configToml :
@@ -306,17 +311,17 @@ csp-health-monitor:
306311 endpointOverride : " csp-api-mock.nvsentinel.svc.cluster.local:50051"
307312 aws :
308313 endpointOverride : " http://csp-api-mock.nvsentinel.svc.cluster.local:8080/aws/health"
309-
314+
310315 affinity :
311316 podAntiAffinity :
312317 requiredDuringSchedulingIgnoredDuringExecution :
313- - labelSelector :
314- matchLabels :
315- app.kubernetes.io/name : kwok
316- namespaceSelector :
317- matchLabels :
318- kubernetes.io/metadata.name : kube-system
319- topologyKey : kubernetes.io/hostname
318+ - labelSelector :
319+ matchLabels :
320+ app.kubernetes.io/name : kwok
321+ namespaceSelector :
322+ matchLabels :
323+ kubernetes.io/metadata.name : kube-system
324+ topologyKey : kubernetes.io/hostname
320325
321326# Enable node metadata enrichment for testing
322327platformConnector :
@@ -325,32 +330,32 @@ platformConnector:
325330 maxNodeConditionMessageLength : 1024
326331 qps : 5.0
327332 burst : 10
328-
333+
329334 pipeline :
330335 - name : MetadataAugmentor
331336 enabled : true
332337 config : /etc/config/metadata.toml
333-
338+
334339 - name : OverrideTransformer
335340 enabled : true
336341 config : /etc/config/overrides.toml
337-
342+
338343 transformers :
339344 MetadataAugmentor :
340345 cacheSize : 50
341346 cacheTTLSeconds : 3600
342347 allowedLabels :
343348 - " topology.kubernetes.io/zone"
344349 - " topology.kubernetes.io/region"
345-
350+
346351 OverrideTransformer :
347352 rules :
348- - name : " escalate-xid-94"
349- when : ' event.agent == "syslog-health-monitor" && "94" in event.errorCode'
350- override :
351- isFatal : true
352- recommendedAction : " CONTACT_SUPPORT"
353-
353+ - name : " escalate-xid-94"
354+ when : ' event.agent == "syslog-health-monitor" && "94" in event.errorCode'
355+ override :
356+ isFatal : true
357+ recommendedAction : " CONTACT_SUPPORT"
358+
354359 # - name: "zone-specific-override"
355360 # when: 'event.metadata["topology.kubernetes.io/zone"] == "us-west1-a" && event.componentClass == "GPU"'
356361 # override:
@@ -379,13 +384,13 @@ kubernetes-object-monitor:
379384 affinity :
380385 podAntiAffinity :
381386 requiredDuringSchedulingIgnoredDuringExecution :
382- - labelSelector :
383- matchLabels :
384- app.kubernetes.io/name : kwok
385- namespaceSelector :
386- matchLabels :
387- kubernetes.io/metadata.name : kube-system
388- topologyKey : kubernetes.io/hostname
387+ - labelSelector :
388+ matchLabels :
389+ app.kubernetes.io/name : kwok
390+ namespaceSelector :
391+ matchLabels :
392+ kubernetes.io/metadata.name : kube-system
393+ topologyKey : kubernetes.io/hostname
389394
390395event-exporter :
391396 replicaCount : 1
@@ -409,13 +414,13 @@ event-exporter:
409414 affinity :
410415 podAntiAffinity :
411416 requiredDuringSchedulingIgnoredDuringExecution :
412- - labelSelector :
413- matchLabels :
414- app.kubernetes.io/name : kwok
415- namespaceSelector :
416- matchLabels :
417- kubernetes.io/metadata.name : kube-system
418- topologyKey : kubernetes.io/hostname
417+ - labelSelector :
418+ matchLabels :
419+ app.kubernetes.io/name : kwok
420+ namespaceSelector :
421+ matchLabels :
422+ kubernetes.io/metadata.name : kube-system
423+ topologyKey : kubernetes.io/hostname
419424
420425 exporter :
421426 metadata :
@@ -450,6 +455,3 @@ event-exporter:
450455 initialBackoff : " 1s"
451456 maxBackoff : " 10s"
452457 backoffMultiplier : 2.0
453-
454- janitorProvider :
455- csp : kind
0 commit comments