Skip to content

Latest commit

 

History

History
532 lines (422 loc) · 34.3 KB

File metadata and controls

532 lines (422 loc) · 34.3 KB

Palantir Foundry: Checklist Completa de Características y Servicios

Propósito de este documento: Referencia exhaustiva de todas las capacidades de Palantir Foundry para validar si una implementación open source las cubre. Cada ítem incluye una casilla [ ] para marcar como cumplido.


Resumen Ejecutivo

Palantir Foundry es una plataforma de operaciones de datos de nivel empresarial construida sobre una arquitectura de más de 300+ microservicios. Su diferenciador clave es el Palantir Ontology: una capa operacional que conecta activos digitales (datasets, modelos, pipelines) con sus contrapartes del mundo real, habilitando tanto análisis convencional como flujos de trabajo con IA. La plataforma se organiza en ocho grandes dominios de capacidad: Data Connectivity, Model Connectivity, Ontology Building, Use Case Development, Analytics, Product Delivery, Security & Governance, y Management & Enablement.[1][2][3][4]


1. CONECTIVIDAD E INTEGRACIÓN DE DATOS

1.1 Data Connection (Conectores y Fuentes)

# Característica Descripción ✅ Cumplido
1.1.1 Conectores nativos (200+) Soporte out-of-the-box para sistemas enterprise como SAP, Salesforce, Oracle, etc.[5] [ ]
1.1.2 Conector SAP (Foundry Connector 2.0) Conector dedicado para SAP con actualizaciones regulares (v2.35.0 SP32)[6] [ ]
1.1.3 Streaming data sources Soporte para Kafka, Kinesis y otras fuentes de streaming con baja latencia[7] [ ]
1.1.4 REST API source Conector genérico para cualquier REST API con autenticación configurable[8] [ ]
1.1.5 Generic source / custom connectors Framework para conectores personalizados vía genéric source o REST API source[9] [ ]
1.1.6 IoT / IIoT data sources Integración con sistemas industriales y sensores IoT/IIoT[10] [ ]
1.1.7 On-premises agent Agente para conectar con fuentes en redes privadas o on-premises[11] [ ]
1.1.8 Virtual tables (zero-copy) Acceso in-place a tablas en Databricks, BigQuery, Snowflake sin mover datos[12] [ ]
1.1.9 Auto-registration de tablas Registro automático periódico de todas las tablas accesibles de una fuente[12] [ ]
1.1.10 Bulk registration Registro masivo de múltiples virtual tables a la vez[12] [ ]
1.1.11 Update detection / versioning Detección de cambios en fuentes externas (Delta, Iceberg) para builds incrementales[12] [ ]
1.1.12 Export / egress controls Controles de egress y políticas para exportar datos hacia sistemas externos[8] [ ]

1.2 Pipeline Builder

# Característica Descripción ✅ Cumplido
1.2.1 Interfaz visual drag-and-drop Constructor de pipelines punto a clic sin código[4] [ ]
1.2.2 Transforms batch (PySpark) Transformaciones Spark en Python para pipelines batch a gran escala[13] [ ]
1.2.3 Transforms ligeros (Polars/Python) Lightweight transforms composables con Spark; hasta 10x mejora en consumo[14] [ ]
1.2.4 LLM-powered transforms Clasificación, análisis de sentimiento, resumen, extracción de entidades, traducción via LLMs[1] [ ]
1.2.5 External compute orchestration Orquestación de compute externo (ej. Spark clusters externos) junto con pipelines nativos[15] [ ]
1.2.6 Streaming pipelines Pipelines de streaming con latencia < 15 segundos hasta el Ontology[16] [ ]
1.2.7 Scheduling e integración de builds Programación y orquestación de pipelines complejos multi-tecnología[15] [ ]
1.2.8 Incremental transforms Transforms incrementales que procesan solo datos nuevos/cambiados[12] [ ]
1.2.9 Multi-language pipelines Pipelines que combinan diferentes lenguajes y motores de compute[14] [ ]
1.2.10 AI Assist en Pipeline Builder Asistente de IA integrado que sugiere transformaciones y acciones[1] [ ]

1.3 Code Repositories

# Característica Descripción ✅ Cumplido
1.3.1 Web-based IDE Entorno de autoría de código en browser con soporte Git[4] [ ]
1.3.2 Control de versiones (Git) Branching, merging, pull requests, protected branches[17] [ ]
1.3.3 CI/CD integrado (ci/foundry-publish) Pipeline de publicación continua integrado en el flujo de PR[17] [ ]
1.3.4 Soporte TypeScript v2 Funciones en TypeScript v2 con autenticación first-class[18] [ ]
1.3.5 Soporte Python Funciones y transforms en Python con todas las librerías del ecosistema[18] [ ]
1.3.6 Plantillas de repositorio Templates predefinidos (Model Training, Functions, etc.)[19] [ ]
1.3.7 Libraries side panel Gestión de dependencias/librerías directamente desde el IDE[18] [ ]

1.4 Streaming

# Característica Descripción ✅ Cumplido
1.4.1 Stream creation con schema Definición de streams con schema tipado (String, Double, Timestamp, etc.)[20] [ ]
1.4.2 Hot buffer + cold storage archiving Datos del stream archivados a cold storage cada pocos minutos como dataset estándar[21] [ ]
1.4.3 Fault tolerance con checkpoints Tolerancia a fallos con checkpoints periódicos para restart sin reprocesar[21] [ ]
1.4.4 Job graph visualization Representación visual del pipeline de streaming (job graph)[21] [ ]
1.4.5 Streaming syncs desde fuentes externas Ingesta de Kafka, Kinesis y otras plataformas de streaming[7] [ ]
1.4.6 Transform de streams en Pipeline Builder Transformación de streams en tiempo real directamente en Pipeline Builder[20] [ ]
1.4.7 Push manual via API Ingesta de records vía curl/OAuth para testing y producción[20] [ ]

1.5 Data Lineage

# Característica Descripción ✅ Cumplido
1.5.1 Grafo interactivo de linaje Vista gráfica de cómo fluyen los datos a través de la plataforma[22] [ ]
1.5.2 Data Lineage (datasets) Trazabilidad completa de origen y transformaciones de cada dataset[23] [ ]
1.5.3 Workflow Lineage (GA) Linaje de ejecución: cómo interactúan objetos, acciones, apps y automatizaciones[24] [ ]
1.5.4 Upstream/downstream impact analysis Ver qué datasets se verán afectados antes de hacer cambios[24] [ ]
1.5.5 Builds desde Data Lineage Trigger de builds directamente desde la vista de linaje[25] [ ]
1.5.6 Propagación de markings por linaje Los markings de seguridad se heredan automáticamente a datasets derivados[26] [ ]

1.6 Datasets y Filesystem

# Característica Descripción ✅ Cumplido
1.6.1 Dataset con transacciones Historial de transacciones (snapshot, append, delete) sobre cada dataset[27] [ ]
1.6.2 Branching de datasets Branches por entorno (dev/prod) con el mismo patrón que Git[27] [ ]
1.6.3 Dataset Views Vistas de datasets sin duplicar datos[27] [ ]
1.6.4 Dataset Preview Visualización de contenido e historial/metadatos de un dataset[4] [ ]
1.6.5 Data Health checks Definición y monitoreo de health checks sobre la calidad de datasets[4] [ ]
1.6.6 Filesystem navegable Sistema de ficheros jerárquico (proyectos, carpetas, archivos)[27] [ ]
1.6.7 Linter / anti-patterns detector Análisis del enrollment para detectar anti-patrones y optimizar recursos[4] [ ]

1.7 HyperAuto (SDDI)

# Característica Descripción ✅ Cumplido
1.7.1 Generación automática de pipelines ERP Genera pipelines end-to-end sobre sistemas ERP sin desarrollo manual[4] [ ]
1.7.2 Generación de Ontology desde ERP Crea el Ontology a partir de sistemas enterprise automáticamente[4] [ ]

2. ONTOLOGY (CAPA SEMÁNTICA Y OPERACIONAL)

2.1 Ontology Manager — Tipos Semánticos

# Característica Descripción ✅ Cumplido
2.1.1 Object Types Definición de tipos de objeto con propiedades tipadas y metadata rico[3] [ ]
2.1.2 Link Types Relaciones entre tipos de objeto (uni/bidireccionales)[3] [ ]
2.1.3 Properties con Value Types Tipos de valor con restricciones y contexto adicional embebido[1] [ ]
2.1.4 Interfaces / Polimorfismo Interfaces que describen la forma de un object type para polimorfismo[3] [ ]
2.1.5 Shared Property Types Propiedades compartidas entre múltiples object types[28] [ ]
2.1.6 Time-dependent properties Propiedades que varían en el tiempo (time series nativas)[29] [ ]
2.1.7 Geo-point properties Soporte nativo para coordenadas geoespaciales en object types[28] [ ]
2.1.8 Media references Referencias a imágenes, vídeos y otros medios en objetos[1] [ ]
2.1.9 Semantic search (unstructured data) Búsqueda semántica para desbloquear datos no estructurados[1] [ ]
2.1.10 Digital twin / espejo del mundo real El Ontology como gemelo digital de la organización[3] [ ]

2.2 Action Types (Kinética del Ontology)

# Característica Descripción ✅ Cumplido
2.2.1 Action Types (formularios punto a clic) Configuración de acciones con interfaz visual sin código[1] [ ]
2.2.2 Function-backed Actions Acciones con lógica arbitraria definida en Functions (TypeScript/Python)[30] [ ]
2.2.3 Ontology Edits TypeScript API API tipada para crear/editar/borrar objetos y links desde Functions[30] [ ]
2.2.4 Batch apply actions Aplicar hasta 20 (o más) acciones del mismo tipo en una sola llamada[31] [ ]
2.2.5 Action validation Validar parámetros de una acción antes de ejecutarla[32] [ ]
2.2.6 Object Storage V2 (escritura inmediata) Ediciones visibles inmediatamente tras completar la acción[31] [ ]
2.2.7 Webhook / External system actions Acciones que orquestan cambios en sistemas externos[1] [ ]
2.2.8 Permisos granulares por Action Control de quién puede ejecutar cada acción bajo qué condiciones[1] [ ]
2.2.9 Scenario / what-if branching Proyectar consecuencias de un cambio en un branch del Ontology (sandbox)[1] [ ]

2.3 Functions (Lógica de Negocio)

# Característica Descripción ✅ Cumplido
2.3.1 Functions en TypeScript v2 Lógica de negocio tipada en TypeScript con soporte de autenticación[18] [ ]
2.3.2 Functions en Python Funciones en Python con acceso al Ontology y plataforma SDK[18] [ ]
2.3.3 Object Set Queries Consultas sobre conjuntos de objetos (filtros, agregaciones)[30] [ ]
2.3.4 Link Traversals Navegación por las relaciones entre objetos del Ontology[30] [ ]
2.3.5 External Functions Llamadas a sistemas externos en tiempo real desde acciones y workflows[1] [ ]
2.3.6 Platform SDK en Functions Acceso a APIs de la plataforma (schedules, media sets, etc.) desde Functions[18] [ ]
2.3.7 LLM en Functions (Language Model Service) Llamadas a LLMs directamente desde Functions para lógica IA[18] [ ]

2.4 Object Views, Explorer y Vertex

# Característica Descripción ✅ Cumplido
2.4.1 Object Views Representación canónica / UI estándar para mostrar un tipo de objeto[4] [ ]
2.4.2 Object Explorer Exploración y búsqueda visual del Ontology completo[4] [ ]
2.4.3 Vertex — System graphs Grafos de objetos relacionados para análisis de sistemas[4] [ ]
2.4.4 Vertex — Simulaciones end-to-end Ejecución de simulaciones usando modelos sobre los grafos del sistema[4] [ ]

2.5 Foundry Rules y Machinery

# Característica Descripción ✅ Cumplido
2.5.1 Foundry Rules Definición y aplicación de reglas de negocio complejas sobre datasets, objetos y series temporales[4] [ ]
2.5.2 Machinery (Process Mining) Comprensión y gestión de procesos, identificación de comportamientos no deseados[4] [ ]
2.5.3 Machinery widget de monitoreo Widget de análisis y monitoreo en tiempo real de procesos Machinery[15] [ ]
2.5.4 Dynamic Scheduling Optimización de scheduling con ML y gestión de restricciones del Ontology[4] [ ]

2.6 Gotham Integration

# Característica Descripción ✅ Cumplido
2.6.1 Type mapping Foundry ↔ Gotham Representación unificada del Ontology entre Foundry y Gotham[28] [ ]
2.6.2 Object Set Service Servicio backend que soporta búsqueda, filtrado y agregación de objetos para Gotham[28] [ ]

3. CONECTIVIDAD Y DESARROLLO DE MODELOS (MLOps)

3.1 Model Assets y Modeling Objectives

# Característica Descripción ✅ Cumplido
3.1.1 Modeling Objectives Gestión del ciclo de vida completo de un problema ML (colaboración, documentación, deployment)[33] [ ]
3.1.2 Model development in-platform Entrenamiento de modelos con scikit-learn, TensorFlow, OR-tools, etc.[33] [ ]
3.1.3 Import de modelos externos Integración de modelos entrenados fuera de la plataforma (containers, librerías, APIs)[33] [ ]
3.1.4 Batch deployment Despliegue batch: transform que corre inferencia sobre un dataset de entrada[34] [ ]
3.1.5 Live/online deployment Despliegue en tiempo real de modelos envueltos en Functions para Workshop[35] [ ]
3.1.6 Model adapters Abstracción de la lógica del modelo independientemente del framework[1] [ ]
3.1.7 Versioning y reproducibilidad Cada modelo está vinculado al código, datos y entorno de entrenamiento[19] [ ]
3.1.8 Governance y audit trail de modelos Registro gobernado de cómo se produjo cada modelo[33] [ ]
3.1.9 Staging y release to production Flujo de release: staging → production con número de versión[34] [ ]
3.1.10 ML feedback loops Loops de feedback desde datos de producción, outcomes y acciones de usuario[33] [ ]
3.1.11 MLflow integration Integración con MLflow para tracking de métricas, image logging y vistas de parámetros[36] [ ]
3.1.12 Marketplace de modelos (DevOps) Packaging y distribución de modelos como productos via Marketplace[37] [ ]
3.1.13 Compute Modules (containers serverless) Despliegue de containers Docker serverless con escalado horizontal[4] [ ]

3.2 AIP — Language Model Service

# Característica Descripción ✅ Cumplido
3.2.1 Interfaz unificada multi-LLM Interfaz unificada para GPT-4, Claude, Gemini, Grok, y otros modelos[38] [ ]
3.2.2 LLM en redes privadas Modelos LLM operando dentro de redes privadas del cliente[39] [ ]
3.2.3 Multimodal / Vision-Language Models Soporte para modelos de visión y aplicaciones móviles[1] [ ]
3.2.4 LLM cost governance Tracking de consumo y costes de los LLMs[23] [ ]
3.2.5 Evaluations (benchmarking LLMs) Suite de evaluación para medir y comparar rendimiento de modelos LLM[40] [ ]

3.3 AIP Agent Studio

# Característica Descripción ✅ Cumplido
3.3.1 AIP Agents con herramientas del Ontology Agentes LLM con acceso a datos y herramientas del Ontology[41] [ ]
3.3.2 Deploy interno (Workshop widget) Agentes deployables en Workshop via AIP Interactive widget[41] [ ]
3.3.3 Deploy externo (OSDK / APIs) Agentes accesibles desde aplicaciones externas via OSDK y APIs[41] [ ]
3.3.4 Agents como Functions (para Automate) Publicación de agentes como funciones para usar en Automate[41] [ ]
3.3.5 Tool use / Function calling Los LLMs pueden invocar herramientas y trazabilidad de la secuencia de llamadas[38] [ ]
3.3.6 AI FDE (natural language platform ops) Operar Foundry en lenguaje natural para todos los usuarios[15] [ ]

3.4 AIP Logic y Automate

# Característica Descripción ✅ Cumplido
3.4.1 AIP Logic (LLM decision logic builder) Entorno de desarrollo de lógica de decisión con LLMs[42] [ ]
3.4.2 Automate (event-driven triggers) Automatizaciones disparadas por cambios en el Ontology[4] [ ]
3.4.3 Automate — notificaciones Envío de notificaciones cuando se cumplen condiciones sobre los datos[4] [ ]
3.4.4 Automate — submit Actions automáticas Ejecución automática de acciones cuando se cumplen condiciones[4] [ ]
3.4.5 Proposal-based pattern (human-in-the-loop) Agentes que generan propuestas para revisión humana antes de aplicar cambios[1] [ ]

4. DESARROLLO DE CASOS DE USO (APLICACIONES)

4.1 Workshop (No-code / Low-code App Builder)

# Característica Descripción ✅ Cumplido
4.1.1 Punto a clic (drag-and-drop) Constructor de aplicaciones visual sin código[4] [ ]
4.1.2 Pro-code customizations Soporte para personalizaciones en código dentro del builder[4] [ ]
4.1.3 Widget library (continuamente actualizada) Biblioteca de widgets prediseñados integrada[43] [ ]
4.1.4 AIP Interactive widget (agent embed) Widget para embeber agentes AIP en aplicaciones Workshop[41] [ ]
4.1.5 Scenario / what-if en Workshop Soporte nativo de escenarios para workflows "¿Qué pasaría si...?"[1] [ ]
4.1.6 Embedded Quiver dashboards Incrustar dashboards de Quiver dentro de apps Workshop[44] [ ]
4.1.7 Embedded Map Incrustar componente de mapa geoespacial[45] [ ]
4.1.8 Consumer mode (usuarios externos B2C/B2B) Modo seguro para entregar apps a usuarios externos sin acceso a la plataforma[46] [ ]

4.2 Slate (Pro-code App Builder)

# Característica Descripción ✅ Cumplido
4.2.1 HTML / CSS / JavaScript custom apps Aplicaciones completamente personalizadas con tecnologías web estándar[47] [ ]
4.2.2 Integración con Ontology layer Acceso nativo al Ontology desde aplicaciones Slate[47] [ ]
4.2.3 Acceso directo a datasets Slate puede interactuar directamente con datasets además del Ontology[48] [ ]
4.2.4 Drag-and-drop + código Interfaz mixta: visual para estructura, código para personalización[47] [ ]

4.3 OSDK React Applications

# Característica Descripción ✅ Cumplido
4.3.1 React UI con OSDK como backend Aplicaciones React usando Foundry como backend via OSDK[4] [ ]
4.3.2 TypeScript bindings type-safe Bindings TypeScript con type-safety para el Ontology[49] [ ]
4.3.3 Soporte NPM, Pip/Conda, Maven SDK disponible para TypeScript, Python, Java y OpenAPI spec[49] [ ]
4.3.4 Developer Console Portal para crear y gestionar aplicaciones OSDK[49] [ ]
4.3.5 VS Code Workspaces in-platform IDE VS Code integrado con soporte nativo para Python transforms y OSDK React[4] [ ]
4.3.6 Palantir extension for VS Code Extensión VS Code con acceso a repositorios, builds y AI coding assistant[4] [ ]
4.3.7 Palantir MCP (Model Context Protocol) Conecta IDEs de IA externas con el Ontology y herramientas de Foundry[4] [ ]
4.3.8 Ontology MCP Expone recursos del Ontology como herramientas MCP para agentes externos[4] [ ]

4.4 Workflow Building

# Característica Descripción ✅ Cumplido
4.4.1 Automate (ver sección AIP) [ ]
4.4.2 Solution Designer Herramienta interactiva para diseñar arquitecturas de soluciones[4] [ ]
4.4.3 Carbon (curated workspaces) Combina apps y recursos en workspaces curados para usuarios finales[4] [ ]
4.4.4 Use Case app App de gestión de casos de uso con Workshop, Slate y Quiver integrados[50] [ ]

5. ANALYTICS

5.1 Contour (Top-down Analysis)

# Característica Descripción ✅ Cumplido
5.1.1 Exploración top-down visual Análisis punto a clic sobre datasets a escala[51] [ ]
5.1.2 Transform boards (joins, filtros, agregaciones) Transformaciones step-by-step con recálculo automático downstream[52] [ ]
5.1.3 Display boards (gráficos, tablas) Visualizaciones de resultados: histogramas, scatter, tablas, etc.[52] [ ]
5.1.4 Paths y secuencias de análisis Análisis organizados en paths con boards en serie[51] [ ]
5.1.5 Parámetros de análisis Parámetros para cambiar vistas (rangos de fechas, IDs, localizaciones)[51] [ ]
5.1.6 Dashboards con chart-to-chart filtering Dashboards interactivos con filtrado cruzado entre gráficos[51] [ ]
5.1.7 Export a dataset (materialización) Guardar resultados de Contour como nuevo dataset en Foundry[51] [ ]
5.1.8 Export PDF Exportación de dashboards a PDF[51] [ ]
5.1.9 Fullscreen presentation view Modo presentación en pantalla completa para dashboards[51] [ ]

5.2 Quiver (Time Series y Ontology Analytics)

# Característica Descripción ✅ Cumplido
5.2.1 Análisis de time series Visualización y cálculo de KPIs sobre datos temporales[29] [ ]
5.2.2 Point-and-click sin código Transformaciones y análisis sin escribir código[44] [ ]
5.2.3 Navegación de relaciones entre object types Traversal y análisis de objetos relacionados del Ontology[44] [ ]
5.2.4 Joins entre object sets Agregación y análisis sobre múltiples object sets[44] [ ]
5.2.5 Visual functions (bloques de lógica reutilizables) Funciones visuales reutilizables para simplificar análisis[44] [ ]
5.2.6 Dashboards interactivos y paramétricos Dashboards con filtros dinámicos publicables para stakeholders[44] [ ]
5.2.7 Embed en Workshop, Object Views, Carbon Incrustar análisis Quiver en otros contextos de la plataforma[44] [ ]
5.2.8 Vega plots Soporte para gráficos Vega avanzados[44] [ ]

5.3 Map (Geospatial Analysis)

# Característica Descripción ✅ Cumplido
5.3.1 Análisis geoespacial y temporal Canvas geoespacial con datos del Ontology sobre capas de mapa[45] [ ]
5.3.2 Track analysis (movimiento histórico) Visualización de trayectorias y movimiento de activos móviles en el tiempo[45] [ ]
5.3.3 Raster imagery y capas GIS Soporte para imagery satelital y capas geoespaciales externas[45] [ ]
5.3.4 Color/style por valor de dato Visualización diferenciada con colores y estilos basados en propiedades del objeto[45] [ ]
5.3.5 Combinación con time series y sensores Análisis conjunto de datos IoT, series temporales y eventos sobre el mapa[45] [ ]
5.3.6 Standalone o embebido en Workshop Usable como análisis independiente o componente en Workshop[45] [ ]

5.4 Notepad (Collaborative Documents)

# Característica Descripción ✅ Cumplido
5.4.1 Editor de texto enriquecido colaborativo Documentos colaborativos con formato rico (texto, imágenes)[53] [ ]
5.4.2 Embed de widgets de Contour, Quiver, etc. Integración de gráficos y tablas de otras apps directamente en el documento[53] [ ]
5.4.3 Templates de Notepad Plantillas como blueprints para generar nuevos documentos[53] [ ]
5.4.4 Export / print de documentos Exportación e impresión de documentos Notepad[53] [ ]
5.4.5 Indexado por AIP Assist Los documentos pueden ser indexados y consultados via AIP Assist (RAG)[54] [ ]
5.4.6 Marketplace support Incluir documentos y templates Notepad en productos Marketplace[55] [ ]

5.5 Fusion (Spreadsheet Bidireccional)

# Característica Descripción ✅ Cumplido
5.5.1 Spreadsheet editable sincronizado con dataset Sync bidireccional: editar en spreadsheet → actualiza dataset en Foundry[4] [ ]
5.5.2 Query de datos del Ontology en spreadsheet Mostrar y consultar datos del Ontology en formato de hoja de cálculo[4] [ ]

5.6 Code Workspaces y Code Workbook

# Característica Descripción ✅ Cumplido
5.6.1 JupyterLab® integrado Entorno Jupyter nativo en la plataforma[4] [ ]
5.6.2 RStudio® Workbench integrado RStudio nativo para workflows de estadística y R[4] [ ]
5.6.3 LLMs en notebooks Acceso a modelos LLM directamente desde notebooks[42] [ ]
5.6.4 Code Workbook (legacy) Entorno web de análisis en código con workflows de data science[4] [ ]

5.7 Integraciones BI Externas

# Característica Descripción ✅ Cumplido
5.7.1 Conector Tableau Conector dedicado para Tableau[1] [ ]
5.7.2 Conector Power BI Conector dedicado para Power BI[1] [ ]
5.7.3 ODBC/JDBC drivers Drivers estándar para conectar herramientas SQL externas[1] [ ]
5.7.4 Python SDK SDK Python para acceso programático a datos y Ontology[56] [ ]
5.7.5 REST API (Foundry API) API REST con OAuth 2.0 para construir aplicaciones sobre la plataforma[57] [ ]

6. PRODUCT DELIVERY (DevOps y Marketplace)

6.1 Foundry DevOps

# Característica Descripción ✅ Cumplido
6.1.1 Packaging de productos Crear "productos" con colecciones de recursos (pipelines, Ontology, apps, modelos)[58] [ ]
6.1.2 Release channels / versioning Etiquetar versiones del producto con canales de release[58] [ ]
6.1.3 Gestión de instalaciones (fleet) Administrar una flota de instalaciones con upgrades automáticos[58] [ ]
6.1.4 Maintenance windows Configuración de ventanas de mantenimiento para actualizaciones[46] [ ]
6.1.5 Foundry Branching (beta) Branching a nivel de enrollment para desarrollo de features[59] [ ]

6.2 Marketplace

# Característica Descripción ✅ Cumplido
6.2.1 Storefront de productos Descubrimiento e instalación de productos publicados[4] [ ]
6.2.2 Guided installation Instalación guiada con configuración personalizable[4] [ ]
6.2.3 Recommended products Recomendaciones de productos relacionados[4] [ ]
6.2.4 Starter packs / ejemplos Workflow starter packs para arranque rápido[4] [ ]
6.2.5 Instalaciones multi-space Instalación del mismo producto en múltiples spaces[46] [ ]

7. SEGURIDAD Y GOBERNANZA

7.1 Control de Acceso

# Característica Descripción ✅ Cumplido
7.1.1 Role-based access control (RBAC) Control de acceso discrecional basado en roles[60] [ ]
7.1.2 Markings (mandatory access controls) Controles mandatorios que viajan con los datos independientemente de la ubicación[61][62] [ ]
7.1.3 Propagación de markings por linaje Los markings se heredan automáticamente a todos los recursos derivados[26] [ ]
7.1.4 Classification-based access controls (CBAC) Controles de clasificación para información gubernamental sensible[63] [ ]
7.1.5 Scoped sessions Usuarios pueden seleccionar un subconjunto de markings por sesión[62] [ ]
7.1.6 Organization-level isolation Silos estrictos entre organizaciones dentro de un mismo enrollment[64] [ ]
7.1.7 Guest access cross-organization Acceso de invitado controlado entre organizaciones[65] [ ]
7.1.8 Restricted views Vistas granulares que limitan columnas/filas visibles[66] [ ]
7.1.9 Consumer mode (external users) Entrega segura de apps a usuarios externos sin acceso a la plataforma[46] [ ]

7.2 Autenticación y Cifrado

# Característica Descripción ✅ Cumplido
7.2.1 Single Sign-On (SSO / SAML 2.0) Integración con identity providers via SAML[67] [ ]
7.2.2 Multi-factor authentication (MFA) Autenticación de múltiples factores[60] [ ]
7.2.3 OAuth 2.0 (client credentials, auth code) Flujos OAuth para server-to-server y autenticación interactiva[68] [ ]
7.2.4 Encryption in transit y at rest Cifrado completo de datos en tránsito y en reposo[39] [ ]
7.2.5 Zero-trust security architecture Infraestructura zero-trust con node cycling agresivo[2] [ ]

7.3 Governance y Privacidad

# Característica Descripción ✅ Cumplido
7.3.1 Audit logging completo Registro de todas las interacciones del sistema y decisiones[23] [ ]
7.3.2 Approvals (change management) Flujo de aprobación para cambios sensibles (propuestas, acceso, ontology)[4] [ ]
7.3.3 Checkpoint (justification prompts) Prompts de justificación para interacciones con datos sensibles[4] [ ]
7.3.4 Cipher (cryptographic operations) Servicio de cifrado/descifrado/hashing con gestión de algoritmos y claves[4] [ ]
7.3.5 Sensitive Data Scanner (SDS) Descubrimiento automático de datos sensibles con acciones de remediación[4] [ ]
7.3.6 Data Lifetime / retention policies Políticas de retención lineage-aware con deletion gobernado[4] [ ]
7.3.7 Compliances: HIPAA, GDPR, ITAR Alineación con marcos regulatorios globales[4] [ ]
7.3.8 Project templates para governance estándar Templates que estandarizan la gobernanza a escala[66] [ ]

8. MANAGEMENT Y ENABLEMENT

8.1 Control Panel y Administración

# Característica Descripción ✅ Cumplido
8.1.1 Control Panel centralizado Suite completa de governance, gestión de recursos y administración de seguridad[4] [ ]
8.1.2 Enrollment vs Organization permissions Permisos gestionados en dos niveles independientes[69] [ ]
8.1.3 Resource Management Insights granulares sobre utilización de recursos del enrollment[4] [ ]
8.1.4 Upgrade Assistant Herramienta para gestionar actualizaciones de la plataforma[4] [ ]
8.1.5 Identity provider mapping (SAML org assignment) Asignación automática de usuarios a organizaciones via SAML[65] [ ]
8.1.6 Custom platform branding Personalización de la experiencia de plataforma con branding organizacional[4] [ ]

8.2 Enablement y Documentación

# Característica Descripción ✅ Cumplido
8.2.1 AIP Assist (platform-wide chatbot) Asistente IA disponible en toda la plataforma para navegar y generar valor[70] [ ]
8.2.2 Custom documentation in-platform Creación y gestión de documentación interna indexada por AIP Assist (RAG)[54] [ ]
8.2.3 Walkthroughs (tutoriales interactivos) Tutoriales step-by-step customizables para onboarding de usuarios[4] [ ]

8.3 Multi-Organization Ecosystems

# Característica Descripción ✅ Cumplido
8.3.1 Private + shared spaces Construcción de ecosistemas con espacios privados y compartidos[71] [ ]
8.3.2 Data sharing controlado entre orgs Compartición de datos con controles de auditoría y marcings mandatorios[71] [ ]
8.3.3 Host organization + partners Modelo de ecosistema con organización host y partners[71] [ ]

9. DEVELOPER TOOLCHAIN (APIs y SDKs)

9.1 APIs REST

# Característica Descripción ✅ Cumplido
9.1.1 Foundry Platform API (v1 y v2) API REST completa para interactuar con la plataforma (datasets, ontology, filesystem, etc.)[57] [ ]
9.1.2 Datasets API CRUD completo sobre datasets, branches, transacciones, archivos[72] [ ]
9.1.3 Ontologies API (Objects, Links, Actions) API para consultar objetos, navegar links, aplicar acciones[32] [ ]
9.1.4 Orchestration API (Builds, Jobs, Schedules) API para gestionar pipelines y schedules programáticamente[6] [ ]
9.1.5 Streams API (real-time, second latency) API para análisis y procesamiento de datos en tiempo real[6] [ ]
9.1.6 Connectivity API (external systems) API para gestionar conexiones a sistemas externos[6] [ ]
9.1.7 Filesystem API (folders, projects) API para gestionar el filesystem de recursos[6] [ ]
9.1.8 SQL Queries API API para ejecutar queries SQL sobre datasets[6] [ ]
9.1.9 Admin API (Users, Groups, Markings, Orgs) API para gestión administrativa de usuarios, grupos y markings[6] [ ]

9.2 SDKs

# Característica Descripción ✅ Cumplido
9.2.1 Foundry Platform SDK (Python) SDK Python oficial sobre la Foundry API[56] [ ]
9.2.2 OSDK (TypeScript/NPM) SDK del Ontology para TypeScript/React[49] [ ]
9.2.3 OSDK (Python/Pip) SDK del Ontology para Python[49] [ ]
9.2.4 OSDK (Java/Maven) SDK del Ontology para Java[49] [ ]
9.2.5 OpenAPI spec (any language) Especificación OpenAPI para integrar cualquier lenguaje[49] [ ]

10. INFRAESTRUCTURA Y DEPLOYMENT

# Característica Descripción ✅ Cumplido
10.1 SaaS multi-cloud (AWS, Azure, GCP, OCI) Despliegue como SaaS sobre múltiples clouds[11] [ ]
10.2 On-premises / air-gapped deployment Soporte para entornos air-gapped con agent on-premises[11] [ ]
10.3 Apollo (CI/CD autónomo) Plataforma de entrega continua que gestiona 300+ microservicios automáticamente[2] [ ]
10.4 Kubernetes autoscaling build system Sistema de builds basado en Kubernetes con autoescalado[1] [ ]
10.5 High availability / autoscaling compute mesh Compute mesh altamente disponible con autoescalado[2] [ ]
10.6 Geo-restricted enrollments Soporte para restricciones geográficas de datos y compute[59] [ ]

Resumen de Áreas por Dominio

Dominio Total Ítems Complejidad
1. Data Connectivity e Integración ~45 Alta
2. Ontology ~35 Muy alta
3. ML / AIP ~30 Alta
4. Aplicaciones (Workshop/Slate/OSDK) ~30 Media-Alta
5. Analytics (Contour/Quiver/Map/etc.) ~35 Media
6. Product Delivery (DevOps/Marketplace) ~10 Media
7. Seguridad y Gobernanza ~25 Alta
8. Management y Enablement ~10 Media
9. APIs y SDKs ~15 Alta
10. Infraestructura ~6 Muy alta
TOTAL ~241 características

Notas de Priorización para una Implementación Open Source

Las características se pueden priorizar en tres capas para una implementación open source:

Capa 1 — Core (Bloqueante para viabilidad):

  • Ontology (Objects, Links, Actions, Functions)
  • Dataset / Filesystem con branching y transacciones
  • Pipeline Builder batch (PySpark/Python)
  • RBAC + Markings básicos
  • REST API + OSDK básico

Capa 2 — Funcional (Para uso real):

  • Streaming pipelines
  • Model deployment (batch y live)
  • Workshop / app builder básico
  • Contour y Quiver básicos
  • Audit logging y data lineage

Capa 3 — Avanzada (Enterprise / diferenciadora):

  • AIP Agent Studio y LLM integration
  • HyperAuto (ERP auto-generation)
  • DevOps y Marketplace
  • CBAC, Cipher, Sensitive Data Scanner
  • Multi-organization ecosystems
  • Apollo (autonomous CI/CD)