Neo4j Configuration Best Practices

This guide provides best practices for configuring Neo4j 5.26+ and 2025.x+ in Kubernetes using the Neo4j Enterprise Operator.

Important Configuration Changes

Neo4j 5.26+ Configuration Updates

The operator supports Neo4j 5.26+ which introduced several configuration changes. This guide helps you use the correct, non-deprecated settings.

Memory Configuration

✅ Correct (Neo4j 5.26+)

config:
  server.memory.heap.initial_size: "2G"
  server.memory.heap.max_size: "4G"
  server.memory.pagecache.size: "2G"

❌ Deprecated (Pre-5.26)

config:
  dbms.memory.heap.initial_size: "2G"    # Deprecated
  dbms.memory.heap.max_size: "4G"        # Deprecated
  dbms.memory.pagecache.size: "2G"       # Deprecated

TLS/SSL Configuration

✅ Correct (Neo4j 5.26+)

config:
  # HTTPS configuration
  server.https.enabled: "true"
  server.https.listen_address: "0.0.0.0:7473"

  # Bolt TLS configuration
  server.bolt.enabled: "true"
  server.bolt.tls_level: "REQUIRED"

  # SSL Policies
  dbms.ssl.policy.https.enabled: "true"
  dbms.ssl.policy.bolt.enabled: "true"

❌ Deprecated

config:
  dbms.connector.https.enabled: "true"        # Deprecated
  dbms.connector.bolt.tls_level: "REQUIRED"   # Deprecated

Clustering Configuration

🔧 CRITICAL: V2_ONLY Discovery Configuration

Neo4j 5.26+ and 2025.x use V2_ONLY discovery mode which requires specific port configuration.

✅ Correct (Automatically configured by operator)

Neo4j 5.26+ (Semver):

# The operator automatically configures these settings:
dbms.cluster.discovery.resolver_type: "K8S"
dbms.kubernetes.discovery.v2.service_port_name: "tcp-discovery"  # Port 5000
dbms.cluster.discovery.version: "V2_ONLY"

Neo4j 2025.x+ (Calver):

# The operator automatically configures these settings:
dbms.cluster.discovery.resolver_type: "K8S"
dbms.kubernetes.discovery.service_port_name: "tcp-discovery"     # Port 5000
# V2_ONLY is default in 2025.x, no explicit setting needed

❌ Deprecated/Incorrect

config:
  # These settings will cause cluster formation to fail:
  dbms.kubernetes.discovery.v2.service_port_name: "tcp-tx"      # Wrong port!
  dbms.kubernetes.discovery.service_port_name: "discovery"      # Legacy name
  dbms.cluster.discovery.type: "K8S"                           # Deprecated

  # Database format
  db.format: "standard"                                        # Deprecated since 5.23
  db.format: "high_limit"                                     # Deprecated since 5.23
  server.groups: "group1"                                     # Deprecated - use initial.server.tags

⚠️ IMPORTANT: V2_ONLY mode disables the discovery port (6000) and only uses the cluster port (5000). Using tcp-tx instead of tcp-discovery will cause cluster formation to fail.

Common Configuration Patterns

Production Cluster Configuration

apiVersion: neo4j.neo4j.com/v1alpha1
kind: Neo4jEnterpriseCluster
metadata:
  name: production-cluster
spec:
  topology:
    primaries: 3
    secondaries: 2
  config:
    # Memory settings (using correct server.* prefix)
    server.memory.heap.initial_size: "8G"
    server.memory.heap.max_size: "16G"
    server.memory.pagecache.size: "8G"

    # Query performance
    dbms.logs.query.enabled: "INFO"
    dbms.logs.query.threshold: "1s"
    dbms.logs.query.page_logging_enabled: "true"

    # Transaction settings
    dbms.transaction.timeout: "5m"
    dbms.lock.acquisition.timeout: "2m"

    # Checkpoint tuning
    dbms.checkpoint.interval.time: "15m"
    dbms.checkpoint.interval.tx: "100000"

Development Standalone Configuration

apiVersion: neo4j.neo4j.com/v1alpha1
kind: Neo4jEnterpriseStandalone
metadata:
  name: dev-instance
spec:
  config:
    # Memory settings (using correct server.* prefix)
    server.memory.heap.initial_size: "1G"
    server.memory.heap.max_size: "2G"
    server.memory.pagecache.size: "512M"

    # Development-friendly settings
    dbms.logs.query.enabled: "true"
    dbms.security.procedures.unrestricted: "gds.*,apoc.*"
    dbms.security.allow_csv_import_from_file_urls: "true"

Configuration Do's and Don'ts

Do's ✅

Use server.memory.* for memory settings
Use server.https.* and server.bolt.* for protocol settings
Use dbms.cluster.discovery.resolver_type instead of type
Use db.format: "block" for new databases
Let the operator manage Discovery V2 settings

Don'ts ❌

Don't use dbms.mode=SINGLE (removed in 5.x)
Don't use dbms.memory.* settings (use server.memory.*)
Don't use dbms.connector.* settings (use server.*)
Don't use causal_clustering.* settings (use dbms.cluster.*)
Don't manually configure Kubernetes discovery endpoints

Automatic Configuration by Operator

The operator automatically configures many settings for optimal Kubernetes operation:

Cluster Deployments

dbms.cluster.discovery.resolver_type: "K8S"
dbms.cluster.discovery.version: "V2_ONLY" (for Neo4j 5.26+)
Kubernetes service discovery endpoints
Network advertised addresses
Raft and clustering ports

Standalone Deployments

Unified clustering infrastructure (no dbms.mode=SINGLE)
Single-member cluster configuration
Appropriate network bindings

Database Configuration Best Practices

Database Creation Options

The operator supports two main approaches for populating databases with initial data:

Standard Database with Initial Data

apiVersion: neo4j.neo4j.com/v1alpha1
kind: Neo4jDatabase
metadata:
  name: my-app-database
spec:
  clusterRef: production-cluster
  name: appdb

  # Initial schema and constraints
  initialData:
    source: cypher
    cypherStatements:
      - "CREATE CONSTRAINT user_email IF NOT EXISTS ON (u:User) ASSERT u.email IS UNIQUE"
      - "CREATE INDEX user_name IF NOT EXISTS FOR (u:User) ON (u.name)"
      - "CREATE INDEX product_category IF NOT EXISTS FOR (p:Product) ON (p.category)"

  # Database topology
  topology:
    primaries: 2
    secondaries: 1

  wait: true
  ifNotExists: true

Database from Seed URI (Recommended for Migrations)

apiVersion: neo4j.neo4j.com/v1alpha1
kind: Neo4jDatabase
metadata:
  name: migrated-database
spec:
  clusterRef: production-cluster
  name: migrated-db

  # Create from existing backup
  seedURI: "s3://my-neo4j-backups/production-backup.backup"

  # Point-in-time recovery (Neo4j 2025.x only)
  seedConfig:
    restoreUntil: "2025-01-15T10:30:00Z"
    config:
      compression: "gzip"
      validation: "strict"
      bufferSize: "128MB"

  # Use system-wide cloud authentication (preferred)
  # seedCredentials: null  # Relies on IAM roles, workload identity, etc.

  # Database distribution
  topology:
    primaries: 2
    secondaries: 2

  wait: true
  ifNotExists: true
  defaultCypherLanguage: "25"  # Neo4j 2025.x only

Database Configuration Best Practices

✅ Do's

Prefer seed URI for migrations: Use seedURI when migrating from existing Neo4j instances
Use system-wide authentication: Rely on IAM roles, workload identity, managed identities instead of explicit credentials
Choose appropriate topology: Balance primaries and secondaries based on read/write patterns
Use .backup format: Prefer Neo4j backup format over dump format for better performance
Set appropriate timeouts: Use wait: true for critical databases to ensure they're ready before proceeding
Use IF NOT EXISTS patterns: Include ifNotExists: true and IF NOT EXISTS in Cypher statements
Test restoration: Verify seed URIs are accessible and contain expected data before production use

❌ Don'ts

Don't combine data sources: Never specify both seedURI and initialData - they conflict
Don't use explicit credentials unnecessarily: Avoid storing cloud credentials in secrets when system-wide auth is available
Don't ignore topology validation: Ensure database topology doesn't exceed cluster capacity
Don't use .dump for large datasets: Use .backup format for better performance with large databases
Don't skip point-in-time recovery: Use restoreUntil when precise restoration timing is required (Neo4j 2025.x)

Seed URI Security Best Practices

Authentication Hierarchy (Preferred → Fallback)

System-Wide Authentication (Most Secure):
- AWS: IAM roles for service accounts (IRSA), EC2 instance profiles
- GCP: Workload Identity, default service accounts
- Azure: Managed identities, service principal environment variables
Explicit Credentials (When System-Wide Unavailable):
- Kubernetes secrets with minimal required permissions
- Temporary credentials with limited lifetime
- Regular credential rotation

Example: System-Wide Authentication Setup

# AWS IRSA example
apiVersion: v1
kind: ServiceAccount
metadata:
  name: neo4j-backup-reader
  annotations:
    eks.amazonaws.com/role-arn: arn:aws:iam::ACCOUNT:role/Neo4jBackupReader
---
apiVersion: neo4j.neo4j.com/v1alpha1
kind: Neo4jEnterpriseCluster
metadata:
  name: production-cluster
spec:
  backups:
    cloud:
      provider: aws
      identity:
        provider: aws
        serviceAccount: neo4j-backup-reader  # Uses IAM role
  # ... other cluster configuration
---
apiVersion: neo4j.neo4j.com/v1alpha1
kind: Neo4jDatabase
metadata:
  name: restored-database
spec:
  clusterRef: production-cluster
  seedURI: "s3://my-backups/database.backup"
  # No explicit credentials needed - uses IAM role

Version-Specific Considerations

Neo4j 5.26+ (Semver)

Discovery parameter: dbms.kubernetes.service_port_name
Discovery V2 parameter: dbms.kubernetes.discovery.v2.service_port_name
Seed URI support with CloudSeedProvider
No point-in-time recovery for seed URIs

Neo4j 2025.x+ (Calver)

Discovery parameter: dbms.kubernetes.discovery.service_port_name
Same memory and server settings as 5.26+
Enhanced seed URI support with point-in-time recovery
defaultCypherLanguage field support
restoreUntil field support in seedConfig

Validation

The operator includes validation to prevent common configuration mistakes:

Warns about deprecated db.format values
Blocks clustering configurations in standalone deployments
Validates memory settings against container resources
Ensures required settings for chosen deployment type

Migration from Older Versions

If migrating from Neo4j 4.x or earlier 5.x versions:

Update all dbms.memory.* to server.memory.*
Update all dbms.connector.* to appropriate server.* settings
Remove any dbms.mode=SINGLE configurations
Update causal_clustering.* to dbms.cluster.* (if manually configured)
Ensure using db.format: "block" for new databases

FilesExpand file tree

configuration_best_practices.md

Latest commit

History

configuration_best_practices.md

File metadata and controls

Neo4j Configuration Best Practices

Important Configuration Changes

Neo4j 5.26+ Configuration Updates

Memory Configuration

✅ Correct (Neo4j 5.26+)

❌ Deprecated (Pre-5.26)

TLS/SSL Configuration

✅ Correct (Neo4j 5.26+)

❌ Deprecated

Clustering Configuration

🔧 CRITICAL: V2_ONLY Discovery Configuration

✅ Correct (Automatically configured by operator)

❌ Deprecated/Incorrect

Common Configuration Patterns

Production Cluster Configuration

Development Standalone Configuration

Configuration Do's and Don'ts

Do's ✅

Don'ts ❌

Automatic Configuration by Operator

Cluster Deployments

Standalone Deployments

Database Configuration Best Practices

Database Creation Options

Standard Database with Initial Data

Database from Seed URI (Recommended for Migrations)

Database Configuration Best Practices

✅ Do's

❌ Don'ts

Seed URI Security Best Practices

Authentication Hierarchy (Preferred → Fallback)

Example: System-Wide Authentication Setup

Version-Specific Considerations

Neo4j 5.26+ (Semver)

Neo4j 2025.x+ (Calver)

Validation

Migration from Older Versions

References