GraphRAG Orchestration Service

Enterprise-grade knowledge graph service using Neo4j GraphRAG for intelligent document analysis and semantic querying.

🚀 Features

Neo4j GraphRAG Integration: Official neo4j-graphrag-python package (v1.10.1)
3 Retrieval Methods:
- Vector similarity search (chunk-based)
- Hybrid search (vector + fulltext fusion)
- Text-to-Cypher (LLM-generated graph queries)
Document Indexing: SimpleKGPipeline with automatic entity resolution
Multi-tenancy: Group-based data isolation
Azure OpenAI: GPT-4o + text-embedding-3-large (3072 dimensions)
91% Code Reduction: Replaced 1,636 lines with ~150 lines

📋 Prerequisites

Azure subscription
Neo4j Aura Pro instance
Azure OpenAI service (GPT-4o + text-embedding-3-large)
Azure CLI (az)
Azure Developer CLI (azd)
Python 3.11+

🏗️ Architecture

┌─────────────────────────────────────────┐
│   FastAPI Application (Port 8000)      │
├─────────────────────────────────────────┤
│  Neo4j GraphRAG Service                 │
│  ├─ VectorCypherRetriever              │
│  ├─ HybridCypherRetriever              │
│  ├─ Text2CypherRetriever               │
│  └─ SimpleKGPipeline (Indexing)        │
├─────────────────────────────────────────┤
│  Azure OpenAI                           │
│  ├─ LLM: gpt-4o                        │
│  └─ Embeddings: text-embedding-3-large │
├─────────────────────────────────────────┤
│  Neo4j Aura Pro (Graph Database)       │
│  └─ Group-aware multi-tenancy          │
└─────────────────────────────────────────┘

🛠️ Local Development

1. Setup Environment

# Clone repository
cd /afh/projects/graphrag-orchestration

# Create virtual environment
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# Install dependencies
pip install -r graphrag-orchestration/requirements.txt

2. Configure Environment Variables

Create .env file:

# Azure OpenAI
AZURE_OPENAI_ENDPOINT=https://your-openai.openai.azure.com/
AZURE_OPENAI_API_KEY=your-api-key
AZURE_OPENAI_DEPLOYMENT_NAME=gpt-4o
AZURE_OPENAI_EMBEDDING_DEPLOYMENT=text-embedding-3-large
AZURE_OPENAI_EMBEDDING_DIMENSIONS=3072
AZURE_OPENAI_API_VERSION=2024-10-21

# Neo4j
NEO4J_URI=neo4j+s://your-instance.databases.neo4j.io
NEO4J_USERNAME=neo4j
NEO4J_PASSWORD=your-password
NEO4J_DATABASE=neo4j

# Multi-tenancy
ENABLE_GROUP_ISOLATION=true

3. Run Locally

cd graphrag-orchestration
python -m uvicorn app.main:app --reload --port 8000

API available at: http://localhost:8000 Docs available at: http://localhost:8000/docs

☁️ Azure Deployment

Quick Deploy

# Login to Azure
az login
azd auth login

# Deploy
azd up

Manual Deployment

# Provision infrastructure
azd provision

# Deploy application
azd deploy

📡 API Endpoints

V2 Endpoints (Neo4j GraphRAG)

Local Search (Vector Similarity)

POST /graphrag/v2/query/local
{
  "query": "Who is the CEO of Acme Corporation?",
  "top_k": 10
}

Hybrid Search (Vector + Fulltext)

POST /graphrag/v2/query/hybrid
{
  "query": "Financial performance in 2024",
  "top_k": 10
}

Structured Search (Text-to-Cypher)

POST /graphrag/v2/query/structured
{
  "query": "Show all relationships for Jane Smith"
}

Index Text

POST /graphrag/v2/index/text
{
  "text": "Your document content...",
  "document_name": "annual_report_2024.txt"
}

Required Headers

All requests must include:

X-Group-ID: your-tenant-id
Content-Type: application/json

🧪 Testing

# Run tests
pytest graphrag-orchestration/tests/

# Test specific module
pytest graphrag-orchestration/tests/services/test_neo4j_graphrag_service.py -v

# Run with coverage
pytest --cov=app graphrag-orchestration/tests/

📊 Performance

Code Reduction: 91% (1,636 → ~150 lines)
Document Compression: 84.5% (4,382 → 678 words)
Query Latency: Sub-second
Embedding Quality: 3,072 dimensions (text-embedding-3-large)

🔒 Multi-Tenancy

All data is isolated by group_id:

Neo4j nodes have group_id property
All Cypher queries filter by partition key
Cross-tenant data leaks prevented at database level

📝 Configuration

See graphrag-orchestration/app/core/config.py for all available settings.

🐛 Troubleshooting

Neo4j Connection Issues

# Test connection
python -c "from neo4j import GraphDatabase; driver = GraphDatabase.driver('neo4j+s://...', auth=('neo4j', 'password')); driver.verify_connectivity(); print('OK')"

Azure OpenAI API Issues

# Check API version
curl https://your-openai.openai.azure.com/openai/deployments?api-version=2024-10-21

Missing Dependencies

pip install --upgrade neo4j-graphrag-python==1.10.1

📚 Documentation

🤝 Contributing

This is a standalone service extracted from the Content Processing Solution Accelerator.

📄 License

MIT License - See LICENSE file for details

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

GraphRAG Orchestration Service

🚀 Features

📋 Prerequisites

🏗️ Architecture

🛠️ Local Development

1. Setup Environment

2. Configure Environment Variables

3. Run Locally

☁️ Azure Deployment

Quick Deploy

Manual Deployment

📡 API Endpoints

V2 Endpoints (Neo4j GraphRAG)

Required Headers

🧪 Testing

📊 Performance

🔒 Multi-Tenancy

📝 Configuration

🐛 Troubleshooting

📚 Documentation

🤝 Contributing

📄 License

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
Sorry, we had to truncate this directory to 1,000 files. 216 entries were omitted from the list.
.gitignore		.gitignore
401_ERROR_FILE_CONTENT_FIX_COMPLETE.md		401_ERROR_FILE_CONTENT_FIX_COMPLETE.md
404_OPERATION_NOT_FOUND_FIX_COMPLETE.md		404_OPERATION_NOT_FOUND_FIX_COMPLETE.md
405_ERROR_FIX_SUMMARY.md		405_ERROR_FIX_SUMMARY.md
405_FIX_COMPLETE_SUMMARY.md		405_FIX_COMPLETE_SUMMARY.md
405_METHOD_NOT_ALLOWED_COMPREHENSIVE_FIX.md		405_METHOD_NOT_ALLOWED_COMPREHENSIVE_FIX.md
422_DEBUGGING_GUIDE.md		422_DEBUGGING_GUIDE.md
422_ERROR_ROOT_CAUSE_AND_FIX.md		422_ERROR_ROOT_CAUSE_AND_FIX.md
422_VALIDATION_ERROR_COMPREHENSIVE_FIX.md		422_VALIDATION_ERROR_COMPREHENSIVE_FIX.md
422_VALIDATION_ERROR_SCHEMA_FORMAT_FIX.md		422_VALIDATION_ERROR_SCHEMA_FORMAT_FIX.md
500_ERROR_FIX_COMPLETE.md		500_ERROR_FIX_COMPLETE.md
7D_INTEGRATION_IMPLEMENTATION_COMPLETE.md		7D_INTEGRATION_IMPLEMENTATION_COMPLETE.md
7D_INTEGRATION_IMPLEMENTATION_PLAN.md		7D_INTEGRATION_IMPLEMENTATION_PLAN.md
7_DIMENSION_SELF_CORRECTION_IMPLEMENTATION_COMPLETE.md		7_DIMENSION_SELF_CORRECTION_IMPLEMENTATION_COMPLETE.md
=0.9.0		=0.9.0
ACCESSIBILITY_FORM_FIXES_COMPLETE.md		ACCESSIBILITY_FORM_FIXES_COMPLETE.md
ACCESSIBILITY_REMAINING_FORM_FIXES_COMPLETE.md		ACCESSIBILITY_REMAINING_FORM_FIXES_COMPLETE.md
ACTUAL_BACKEND_CODE_UPDATE_COMPLETE.md		ACTUAL_BACKEND_CODE_UPDATE_COMPLETE.md
ADMIN_QUICK_SETUP.md		ADMIN_QUICK_SETUP.md
AI_ENHANCED_SCHEMA_ANALYSIS_FIX_COMPLETE.md		AI_ENHANCED_SCHEMA_ANALYSIS_FIX_COMPLETE.md
AI_ENHANCED_SCHEMA_FORMAT_FIX_COMPLETE.md		AI_ENHANCED_SCHEMA_FORMAT_FIX_COMPLETE.md
AI_ENHANCED_SCHEMA_OUTPUT_HANDLING_COMPLETE.md		AI_ENHANCED_SCHEMA_OUTPUT_HANDLING_COMPLETE.md
AI_ENHANCED_SCHEMA_PREVIEW_EMPTY_DIAGNOSIS.md		AI_ENHANCED_SCHEMA_PREVIEW_EMPTY_DIAGNOSIS.md
AI_ENHANCED_SCHEMA_PREVIEW_FIX_COMPLETE.md		AI_ENHANCED_SCHEMA_PREVIEW_FIX_COMPLETE.md
AI_ENHANCEMENT_405_ERROR_FIX_COMPLETE.md		AI_ENHANCEMENT_405_ERROR_FIX_COMPLETE.md
AI_ENHANCEMENT_API_FIX_COMPLETE.md		AI_ENHANCEMENT_API_FIX_COMPLETE.md
AI_ENHANCEMENT_DIRECT_IMPLEMENTATION.md		AI_ENHANCEMENT_DIRECT_IMPLEMENTATION.md
AI_ENHANCEMENT_FIELD_COUNT_DEBUG.md		AI_ENHANCEMENT_FIELD_COUNT_DEBUG.md
AI_ENHANCEMENT_FIELD_LOSS_ANALYSIS.md		AI_ENHANCEMENT_FIELD_LOSS_ANALYSIS.md
AI_ENHANCEMENT_JSON_PARSE_FIX_STATUS.md		AI_ENHANCEMENT_JSON_PARSE_FIX_STATUS.md
AI_ENHANCEMENT_MODAL_TRANSLATION_SUPPORT.md		AI_ENHANCEMENT_MODAL_TRANSLATION_SUPPORT.md
AI_ENHANCEMENT_ORCHESTRATION_REFACTOR.md		AI_ENHANCEMENT_ORCHESTRATION_REFACTOR.md
AI_ENHANCEMENT_ORCHESTRATION_REFACTORING_COMPLETE.md		AI_ENHANCEMENT_ORCHESTRATION_REFACTORING_COMPLETE.md
AI_ENHANCEMENT_PROMPT_SIMPLIFICATION_SUMMARY.md		AI_ENHANCEMENT_PROMPT_SIMPLIFICATION_SUMMARY.md
AI_ENHANCEMENT_SECTION_LAYOUT_IMPROVEMENT.md		AI_ENHANCEMENT_SECTION_LAYOUT_IMPROVEMENT.md
AI_ENHANCEMENT_VALIDATION_FIX_COMPLETE.md		AI_ENHANCEMENT_VALIDATION_FIX_COMPLETE.md
AI_ENHANCEMENT_VS_NATURAL_LANGUAGE_CREATOR_COMPARISON.md		AI_ENHANCEMENT_VS_NATURAL_LANGUAGE_CREATOR_COMPARISON.md
AI_ENHANCEMENT_ZERO_FIELDS_DIAGNOSTIC_PLAN.md		AI_ENHANCEMENT_ZERO_FIELDS_DIAGNOSTIC_PLAN.md
AI_ENHANCEMENT_ZERO_FIELDS_ISSUE_STATUS.md		AI_ENHANCEMENT_ZERO_FIELDS_ISSUE_STATUS.md
AI_EXTRACTION_TEST_DOCUMENTATION.md		AI_EXTRACTION_TEST_DOCUMENTATION.md
AI_POWERED_FILE_COMPARISON_IMPLEMENTATION_COMPLETE.md		AI_POWERED_FILE_COMPARISON_IMPLEMENTATION_COMPLETE.md
AI_SCHEMA_ENHANCEMENT_ARRAY_ANALYSIS.md		AI_SCHEMA_ENHANCEMENT_ARRAY_ANALYSIS.md
AI_SCHEMA_ENHANCEMENT_BACKEND_FIX_APPLIED.md		AI_SCHEMA_ENHANCEMENT_BACKEND_FIX_APPLIED.md
AI_SCHEMA_ENHANCEMENT_COMPLETE_FIX_SUMMARY.md		AI_SCHEMA_ENHANCEMENT_COMPLETE_FIX_SUMMARY.md
AI_SCHEMA_ENHANCEMENT_EMPTY_SAVE_FIX.md		AI_SCHEMA_ENHANCEMENT_EMPTY_SAVE_FIX.md
AI_SCHEMA_ENHANCEMENT_EMPTY_SAVE_FIX_COMPLETE.md		AI_SCHEMA_ENHANCEMENT_EMPTY_SAVE_FIX_COMPLETE.md
AI_SCHEMA_ENHANCEMENT_FIX_REQUIRED.md		AI_SCHEMA_ENHANCEMENT_FIX_REQUIRED.md
AI_SCHEMA_ENHANCEMENT_LOADING_STATE_ANALYSIS.md		AI_SCHEMA_ENHANCEMENT_LOADING_STATE_ANALYSIS.md
AI_SCHEMA_ENHANCEMENT_MISMATCH_ANALYSIS.md		AI_SCHEMA_ENHANCEMENT_MISMATCH_ANALYSIS.md
AI_SCHEMA_ENHANCEMENT_PROMPTS_GUIDE.md		AI_SCHEMA_ENHANCEMENT_PROMPTS_GUIDE.md
AI_SCHEMA_GENERATION_FEATURE_SPEC.md		AI_SCHEMA_GENERATION_FEATURE_SPEC.md
AI_SCHEMA_GENERATION_FIXED.md		AI_SCHEMA_GENERATION_FIXED.md
AI_SCHEMA_GENERATION_IMPLEMENTATION_SUMMARY.md		AI_SCHEMA_GENERATION_IMPLEMENTATION_SUMMARY.md
AI_SCHEMA_OPTIMIZATION_D37B194_SIMPLE_PATTERN_RESTORATION.md		AI_SCHEMA_OPTIMIZATION_D37B194_SIMPLE_PATTERN_RESTORATION.md
AI_SCHEMA_OPTIMIZATION_FIELD_NAME_FIX.md		AI_SCHEMA_OPTIMIZATION_FIELD_NAME_FIX.md
AI_SCHEMA_OPTIMIZATION_FIXES_COMPLETE.md		AI_SCHEMA_OPTIMIZATION_FIXES_COMPLETE.md
AI_SELF_CORRECTION_COMPLETE_SUMMARY.md		AI_SELF_CORRECTION_COMPLETE_SUMMARY.md
AI_SELF_CORRECTION_IMPLEMENTATION.md		AI_SELF_CORRECTION_IMPLEMENTATION.md
AI_SELF_CORRECTION_QUICK_SUMMARY.md		AI_SELF_CORRECTION_QUICK_SUMMARY.md
AI_SELF_CORRECTION_STATUS.md		AI_SELF_CORRECTION_STATUS.md
AI_VS_MANUAL_SCHEMA_EXTRACTION_ANALYSIS.md		AI_VS_MANUAL_SCHEMA_EXTRACTION_ANALYSIS.md
ALL_SYSTEMS_READY.md		ALL_SYSTEMS_READY.md
ALL_TYPE_ERRORS_RESOLVED.md		ALL_TYPE_ERRORS_RESOLVED.md
ANALYSIS_401_AND_COLLECTION_KEY_RESOLUTION.md		ANALYSIS_401_AND_COLLECTION_KEY_RESOLUTION.md
ANALYSIS_ASYNC_IMPLEMENTATION_AND_STATUS_CODE_HANDLING.md		ANALYSIS_ASYNC_IMPLEMENTATION_AND_STATUS_CODE_HANDLING.md
ANALYSIS_BUTTON_LOADING_STATE_FIX.md		ANALYSIS_BUTTON_LOADING_STATE_FIX.md
ANALYSIS_COMPLETION_TRACKING_ENHANCEMENT.md		ANALYSIS_COMPLETION_TRACKING_ENHANCEMENT.md
ANALYSIS_ENDPOINTS_GROUP_ISOLATION_COMPLETE.md		ANALYSIS_ENDPOINTS_GROUP_ISOLATION_COMPLETE.md
ANALYSIS_ENDPOINT_VIRTUAL_FOLDER_UPDATE_COMPLETE.md		ANALYSIS_ENDPOINT_VIRTUAL_FOLDER_UPDATE_COMPLETE.md
ANALYSIS_FLOW_ASYNC_AUDIT_COMPLETE.md		ANALYSIS_FLOW_ASYNC_AUDIT_COMPLETE.md
ANALYSIS_FUNCTIONS_COMPARISON.md		ANALYSIS_FUNCTIONS_COMPARISON.md
ANALYSIS_INPUT_NORMALIZATION_GUIDE.md		ANALYSIS_INPUT_NORMALIZATION_GUIDE.md
ANALYSIS_INPUT_NORMALIZATION_SUMMARY.md		ANALYSIS_INPUT_NORMALIZATION_SUMMARY.md
ANALYSIS_LOGGING_ISSUE_TRACE.md		ANALYSIS_LOGGING_ISSUE_TRACE.md
ANALYSIS_PATHS_ARCHITECTURE_EXPLANATION.md		ANALYSIS_PATHS_ARCHITECTURE_EXPLANATION.md
ANALYSIS_RESULTS_AUTHENTICATION_AUDIT_COMPLETE.md		ANALYSIS_RESULTS_AUTHENTICATION_AUDIT_COMPLETE.md
ANALYSIS_RESULTS_CLEAN_DISPLAY_UPDATE.md		ANALYSIS_RESULTS_CLEAN_DISPLAY_UPDATE.md
ANALYSIS_RESULTS_DARK_MODE_FIX.md		ANALYSIS_RESULTS_DARK_MODE_FIX.md
ANALYSIS_RESULTS_DEBUG_AND_FIX.md		ANALYSIS_RESULTS_DEBUG_AND_FIX.md
ANALYSIS_RESULTS_HORIZONTAL_SCROLL_SOLUTION.md		ANALYSIS_RESULTS_HORIZONTAL_SCROLL_SOLUTION.md
ANALYSIS_RESULTS_SCROLLING_FIX_COMPLETE.md		ANALYSIS_RESULTS_SCROLLING_FIX_COMPLETE.md
ANALYSIS_RESULTS_WINDOW_DEMO.md		ANALYSIS_RESULTS_WINDOW_DEMO.md
ANALYSIS_RESULTS_WINDOW_PREVIEW.md		ANALYSIS_RESULTS_WINDOW_PREVIEW.md
ANALYSIS_RESULT_GROUP_ISOLATION_FIX.md		ANALYSIS_RESULT_GROUP_ISOLATION_FIX.md
ANALYSIS_STATE_MANAGEMENT_FLOW_AUDIT.md		ANALYSIS_STATE_MANAGEMENT_FLOW_AUDIT.md
ANALYSIS_TAB_GROUPING_ORDER_IMPROVEMENT.md		ANALYSIS_TAB_GROUPING_ORDER_IMPROVEMENT.md
ANALYZER_CREATION_500_ERROR_COMPLETE_FIX.md		ANALYZER_CREATION_500_ERROR_COMPLETE_FIX.md
ANALYZER_CREATION_CONTAINER_URL_FIX_COMPLETE.md		ANALYZER_CREATION_CONTAINER_URL_FIX_COMPLETE.md
ANALYZER_CREATION_MICROSOFT_VERIFICATION_COMPLETE.md		ANALYZER_CREATION_MICROSOFT_VERIFICATION_COMPLETE.md
ANALYZER_CREATION_POLLING_FIX_COMPLETE.md		ANALYZER_CREATION_POLLING_FIX_COMPLETE.md
ANALYZER_CREATION_POLLING_ISSUE_ANALYSIS.md		ANALYZER_CREATION_POLLING_ISSUE_ANALYSIS.md
ANALYZER_DUAL_STORAGE_COMPLETE.md		ANALYZER_DUAL_STORAGE_COMPLETE.md
ANALYZER_ID_PARAMETER_FIX_COMPLETE.md		ANALYZER_ID_PARAMETER_FIX_COMPLETE.md
ANALYZER_PERSISTENCE_IMPLEMENTATION.md		ANALYZER_PERSISTENCE_IMPLEMENTATION.md
ANALYZER_REUSE_HANDOFF.md		ANALYZER_REUSE_HANDOFF.md
ANALYZER_STATUS_POLLING_FIX_COMPLETE.md		ANALYZER_STATUS_POLLING_FIX_COMPLETE.md
ANALYZER_TIMEOUT_SOLUTION.md		ANALYZER_TIMEOUT_SOLUTION.md
ANSWER_META_SCHEMA_MISMATCH.md		ANSWER_META_SCHEMA_MISMATCH.md
API_DOMAIN_MIGRATION_SUMMARY.md		API_DOMAIN_MIGRATION_SUMMARY.md
API_ENDPOINT_MIGRATION_SUMMARY.md		API_ENDPOINT_MIGRATION_SUMMARY.md

mirojs/graphrag-orchestration

Folders and files

Latest commit

History

Repository files navigation

GraphRAG Orchestration Service

🚀 Features

📋 Prerequisites

🏗️ Architecture

🛠️ Local Development

1. Setup Environment

2. Configure Environment Variables

3. Run Locally

☁️ Azure Deployment

Quick Deploy

Manual Deployment

📡 API Endpoints

V2 Endpoints (Neo4j GraphRAG)

Required Headers

🧪 Testing

📊 Performance

🔒 Multi-Tenancy

📝 Configuration

🐛 Troubleshooting

📚 Documentation

🤝 Contributing

📄 License

About

Resources

Code of conduct

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages