You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
-`explore_dataset` - Get dataset details and distributions
54
54
-`preview_distribution` - Download and preview first rows of CSV/JSON data
55
55
56
+
Note: keep these tools available, but do not treat them as the default entry point for `schema.gov.it`. In this catalog, many DCAT-AP_IT datasets are semantic assets such as ontologies, controlled vocabularies, and their distributions. For `schema.gov.it`, prefer ontology, vocabulary, class/property, and SPARQL tools first; dataset tools are more useful for external catalogs or specific DCAT-AP_IT inspection tasks.
57
+
56
58
**Intelligent Tools:**
57
59
-`search_concepts` - Fuzzy keyword search (use when URI is unknown)
58
60
-`inspect_concept` - Deep profiling (definition, hierarchy, usage, relations)
Copy file name to clipboardExpand all lines: README.md
+3-1Lines changed: 3 additions & 1 deletion
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -38,6 +38,8 @@ Il server espone **34 strumenti** organizzati in 11 categorie:
38
38
*`explore_dataset`: Mostra dettagli e distribuzioni di un dataset.
39
39
*`preview_distribution`: Scarica e mostra le prime righe di una distribuzione CSV/JSON.
40
40
41
+
Nota: questi tool restano utili, ma su `schema.gov.it` sono spesso secondari. Il catalogo contiene soprattutto asset semantici pubblicati come dataset DCAT-AP_IT, ad esempio ontologie, vocabolari controllati e relative distribuzioni. Per esplorare `schema.gov.it` conviene di norma partire da ontologie, vocabolari, classi, proprietà e query SPARQL; i tool dataset sono più indicati per cataloghi esterni o per casi DCAT-AP_IT specifici.
42
+
41
43
### 6. Intelligence (Avanzato)
42
44
*`search_concepts`: **Ricerca fuzzy**. Trova concetti (es. "Scuola") senza conoscere l'URI esatto.
43
45
*`inspect_concept`: **Deep Dive**. Ottiene in un colpo solo definizione, gerarchia, usage stats e vicini di un concetto.
@@ -239,7 +241,7 @@ Una volta configurato, puoi chiedere all'agente cose come:
239
241
***Compressione Token**: Le liste lunghe (> 5 item) vengono restituite in formato tabellare compatto per risparmiare token.
240
242
***Input Sanitizzati**: Tutti i parametri utente sono sanitizzati per prevenire SPARQL injection.
241
243
***Ontologia Locale**: I tool del gruppo 9 (`inspect_local_ontology`, `query_local_ontology`, `compare_local_with_remote`) usano [oxigraph](https://github.com/oxigraph/oxigraph) (WASM) per caricare file RDF/OWL locali in memoria ed eseguire SPARQL. I file vengono cachati dopo il primo caricamento; le query successive sullo stesso file non rileggono il disco. Formati supportati: `.ttl`, `.owl`, `.rdf`, `.nt`, `.jsonld`.
242
-
***Logging**: Tutte le chiamate vengono loggate in `logs/usage_log.jsonl` per analisi e miglioramento continuo.
244
+
***Logging**: Tutte le chiamate vengono loggate in `logs/usage_log.jsonl` per analisi e miglioramento continuo. Ogni entry include argomenti, riepilogo, `source_data_metrics` e `ai_data_metrics`: metriche quantitative dei dati ricevuti e del payload finale passato al modello, ad esempio numero di caratteri e, quando rilevabile, righe, colonne o numero di elementi.
243
245
***Trasporto**: Il server supporta sia `stdio` (default, per uso locale) che HTTP/SSE (via `MCP_TRANSPORT=sse`, per uso remoto/Docker).
Copy file name to clipboardExpand all lines: src/tools/group-e.ts
+19Lines changed: 19 additions & 0 deletions
Original file line number
Diff line number
Diff line change
@@ -15,6 +15,8 @@ server.registerTool(
15
15
title: "List Datasets",
16
16
description: `List available Datasets (dcatapit:Dataset) in the catalog.
17
17
18
+
Use this when you explicitly need DCAT-AP_IT dataset records. On schema.gov.it, these are often semantic assets such as ontologies, controlled vocabularies, and related distributions rather than classic tabular datasets, so ontology/vocabulary/SPARQL tools are usually a better starting point.
19
+
18
20
**Args:**
19
21
- limit: Maximum datasets per page (default: 20)
20
22
- offset: Number of datasets to skip (default: 0)
@@ -75,6 +77,10 @@ server.registerTool(
75
77
},
76
78
},
77
79
rowCount: count,
80
+
sourceData: {
81
+
dataResult,
82
+
countResult,
83
+
},
78
84
};
79
85
});
80
86
}
@@ -86,6 +92,8 @@ server.registerTool(
86
92
title: "Explore Dataset",
87
93
description: `Get details of a specific Dataset including metadata and distributions.
88
94
95
+
Use this for targeted DCAT-AP_IT inspection. On schema.gov.it, many datasets describe semantic assets, so this tool is usually secondary to ontology, vocabulary, class/property, and SPARQL exploration.
description: `Download and preview the first rows of a distribution file.
153
165
166
+
Most useful after you already identified a concrete distribution URL. On schema.gov.it, distributions often belong to semantic assets rather than classic tabular datasets.
167
+
154
168
**Args:**
155
169
- url: Download URL of the distribution (CSV or JSON)
0 commit comments