UNGA Analysis App

Production-ready analysis platform for UN General Assembly speeches

🎯 Overview

The UNGA Analysis App is a comprehensive platform for analyzing United Nations General Assembly speeches from 1946 to 2025. It provides advanced AI-powered analysis, cross-year trend analysis, document context analysis, and interactive visualizations for UN member states and development partners.

✨ Features

🔐 Authentication & User Management

Secure user registration and authentication
Admin portal for user management
Role-based access control
Session management

📊 Core Analysis Features

New Analysis: AI-powered speech analysis with multiple models
Cross-Year Analysis: Historical trend analysis across 80 years
Document Context: Upload and analyze documents with context
Database Chat: Direct interaction with UNGA database
Visualizations: Interactive charts and graphs
Data Explorer: Comprehensive data exploration tools

🌍 Data Coverage

11,093 speeches from 1946-2025
199 countries represented
80 years of historical data
Complete embeddings for semantic search
African vs Development Partner classification

🤖 AI Capabilities

Multiple AI model support (GPT-4, Claude, etc.)
Semantic search with embeddings
Document classification
Sentiment analysis
Topic extraction
Cross-reference analysis

🏗️ Architecture

unga_analysis/
├── src/unga_analysis/          # Main application package
│   ├── core/                   # Core business logic
│   │   ├── auth.py            # Authentication
│   │   ├── classify.py        # Document classification
│   │   ├── enhanced_search_engine.py  # Advanced search
│   │   ├── llm.py             # LLM integration
│   │   ├── openai_client.py   # OpenAI client
│   │   ├── prompts.py         # AI prompts
│   │   ├── startup.py         # Application startup
│   │   └── user_auth.py       # User authentication
│   ├── data/                   # Data management
│   │   ├── cross_year_analysis.py  # Cross-year analysis
│   │   ├── data_ingestion.py  # Data ingestion
│   │   ├── ingest.py          # Data processing
│   │   └── simple_vector_storage.py  # Vector database
│   ├── ui/                     # User interface
│   │   ├── auth_interface.py   # Authentication UI
│   │   ├── components/         # UI components
│   │   ├── tabs/              # Tab implementations
│   │   ├── ui_components.py   # UI utilities
│   │   └── unified_search_interface.py  # Search interface
│   ├── utils/                  # Utilities
│   │   ├── country_manager.py  # Country management
│   │   ├── export_utils.py     # Export functionality
│   │   ├── logging_config.py  # Logging configuration
│   │   ├── security.py        # Security utilities
│   │   ├── utils.py           # General utilities
│   │   └── visualization.py   # Visualization utilities
│   └── config/                 # Configuration
│       ├── countries.py        # Country definitions
│       └── questions.py        # Analysis questions
├── tests/                      # Test suite
├── docs/                       # Documentation
├── scripts/                    # Deployment scripts
├── artifacts/                  # Data artifacts
├── requirements.txt           # Dependencies
├── main.py                    # Application entry point
└── README.md                  # This file

🚀 Quick Start

Prerequisites

Python 3.13+
Virtual environment (recommended)

Installation

Clone the repository

git clone <repository-url>
cd unga-analysis-app

Create virtual environment

python3 -m venv unga80
source unga80/bin/activate  # On Windows: unga80\Scripts\activate

Install dependencies
```
pip install -r requirements.txt
```

Set up environment variables

cp env.template .env
# Edit .env with your configuration

Initialize database
```
python setup_database.py
```

Run the application

python main.py
# Or: streamlit run main.py

Default Admin Access

Email: [email protected]
Password: OSAAKing!

🔧 Configuration

Environment Variables

Create a .env file with the following variables:

# OpenAI Configuration
OPENAI_API_KEY=your_openai_api_key_here

# Admin Configuration
ADMIN_EMAIL=[email protected]
ADMIN_PASSWORD=OSAAKing!

# Database Configuration
DATABASE_URL=sqlite:///unga_vector.db
USER_DATABASE_URL=sqlite:///user_auth.db

# Application Configuration
APP_NAME=UNGA Analysis App
APP_VERSION=1.0.0
DEBUG=False

Database Setup

The application uses two databases:

unga_vector.db: Main speech database with embeddings
user_auth.db: User authentication database

📊 Data Management

Database Population

The application comes with a complete UNGA corpus (1946-2025):

Total Speeches: 11,093
Countries: 199
Years: 1946-2025 (80 years)
Embeddings: 100% coverage for semantic search

Data Quality

✅ No duplicates
✅ Complete country mapping
✅ Proper African vs Development Partner classification
✅ Full temporal coverage
✅ Semantic search capabilities

🎨 User Interface

Main Tabs

📝 New Analysis: Create new speech analyses
🌍 Cross-Year Analysis: Historical trend analysis
📄 Document Context: Upload and analyze documents
📚 All Analyses: View past analyses
📊 Visualizations: Interactive charts and graphs
🗺️ Data Explorer: Explore the database
🗄️ Database Chat: Chat with the database
🔍 Error Insights: System monitoring
🛡️ Admin Portal: User management (admin only)

Features by User Type

Regular Users: All analysis and visualization features
Admin Users: Additional user management capabilities

🔒 Security

Secure password hashing
Session management
Input validation
SQL injection prevention
XSS protection
CSRF protection

🧪 Testing

# Run tests
pytest tests/

# Run with coverage
pytest --cov=src tests/

📈 Performance

Database: Optimized with proper indexing
Search: Semantic search with embeddings
Caching: Efficient country and data caching
Memory: Optimized for large datasets

🚀 Deployment

Local Development

streamlit run main.py --server.port 8501

Production Deployment

See docs/DEPLOYMENT.md for detailed deployment instructions.

📚 Documentation

🤝 Contributing

Fork the repository
Create a feature branch
Make your changes
Add tests
Submit a pull request

📄 License

This project is licensed under the MIT License - see the LICENSE file for details.

🏢 Organization

Built for UN OSAA (Office of the Special Adviser on Africa)

Supports: PDF, DOCX, MP3 file formats
Auto-classifies: African Member States vs Development Partners
Developed by: SMU Data Team

🆘 Support

For support and questions:

Email: [email protected]
Documentation: See docs/ directory
Issues: Create an issue in the repository

🇺🇳 UNGA Analysis App - Empowering UN Member States with Data-Driven Insights

Name		Name	Last commit message	Last commit date
Latest commit History 60 Commits
artifacts		artifacts
docs		docs
scripts		scripts
src		src
tests		tests
.deployment		.deployment
.dockerignore		.dockerignore
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
Dockerfile		Dockerfile
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
QUICK_START.md		QUICK_START.md
README.md		README.md
ULTIMATE_DEMO_GUIDE.md		ULTIMATE_DEMO_GUIDE.md
UNGA_Database_Search_Demo.md		UNGA_Database_Search_Demo.md
UNGA_Database_Search_Demo.pptx		UNGA_Database_Search_Demo.pptx
azure-deploy-clean.sh		azure-deploy-clean.sh
env.template		env.template
logo.svg		logo.svg
main.py		main.py
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
setup.py		setup.py
setup_admin.py		setup_admin.py
setup_database.py		setup_database.py
unga_vector_backup.db		unga_vector_backup.db
user_auth_backup.db		user_auth_backup.db
web.config		web.config

License

MafiAtUN/osaa-unga-analysis

Folders and files

Latest commit

History

Repository files navigation