Merge pull request #122 from khushiiagrawal/enh/result-summary

rh-rahulshetty · web-flow · commit d9671fbaa6d8 · 2026-01-31T17:33:27.000+05:30
enh: GeneticAlgorithm to track run metadata and generate results summary
diff --git a/krkn_ai/algorithm/genetic.py b/krkn_ai/algorithm/genetic.py
@@ -1,5 +1,6 @@
 import os
 import copy
+import datetime
 import json
 import time
 import uuid
@@ -20,6 +21,7 @@
 from krkn_ai.models.config import ConfigFile
 from krkn_ai.reporter.generations_reporter import GenerationsReporter
 from krkn_ai.reporter.health_check_reporter import HealthCheckReporter
+from krkn_ai.reporter.json_summary_reporter import JSONSummaryReporter
 from krkn_ai.utils.logger import get_logger
 from krkn_ai.chaos_engines.krkn_runner import KrknRunner
 from krkn_ai.utils.rng import rng
@@ -81,6 +83,12 @@ def __init__(
         self.run_uuid = str(uuid.uuid4())
         logger.info("Krkn-AI run UUID: %s", self.run_uuid)
 
+        # Track run metadata for results summary
+        self.start_time: Optional[datetime.datetime] = None
+        self.end_time: Optional[datetime.datetime] = None
+        self.seed: Optional[int] = None  # Seed can be set externally if needed
+        self.completed_generations: int = 0
+
         if self.config.population_size < 2:
             raise PopulationSizeError("Population size should be at least 2")
 
@@ -105,6 +113,7 @@ def simulate(self):
         self.population = self.create_population(self.config.population_size)
 
         # Variables to track the progress of the algorithm
+        self.start_time = datetime.datetime.now(datetime.timezone.utc)
         start_time = time.time()
         cur_generation = 0
 
@@ -122,6 +131,8 @@ def simulate(self):
                     cur_generation,
                     format_duration(elapsed_time),
                 )
+                self.completed_generations = cur_generation
+                self.end_time = datetime.datetime.now(datetime.timezone.utc)
                 break
 
             # Check if duration has been exceeded
@@ -136,6 +147,8 @@ def simulate(self):
                         cur_generation,
                         format_duration(elapsed_time),
                     )
+                    self.completed_generations = cur_generation
+                    self.end_time = datetime.datetime.now(datetime.timezone.utc)
                     break
                 remaining_time = self.config.duration - elapsed_time
                 logger.debug(
@@ -146,6 +159,8 @@ def simulate(self):
 
             if len(self.population) == 0:
                 logger.warning("No more population found, stopping generations.")
+                self.completed_generations = cur_generation
+                self.end_time = datetime.datetime.now(datetime.timezone.utc)
                 break
 
             logger.info("| Population |")
@@ -488,12 +503,24 @@ def composition(self, scenario_a: BaseScenario, scenario_b: BaseScenario):
 
     def save(self):
         """Save run results"""
-        # TODO: Create a single result file (results.json) that contains summary of all the results
         self.generations_reporter.save_best_generations(self.best_of_generation)
         self.generations_reporter.save_best_generation_graph(self.best_of_generation)
         self.health_check_reporter.save_report(self.seen_population.values())
         self.health_check_reporter.sort_fitness_result_csv()
 
+        # Generate and save unified results summary
+        summary_reporter = JSONSummaryReporter(
+            run_uuid=self.run_uuid,
+            config=self.config,
+            seen_population=self.seen_population,
+            best_of_generation=self.best_of_generation,
+            start_time=self.start_time,
+            end_time=self.end_time,
+            completed_generations=self.completed_generations,
+            seed=self.seed,
+        )
+        summary_reporter.save(self.output_dir)
+
         # TODO: Send run summary to Elasticsearch
 
     def save_config(self):
diff --git a/krkn_ai/reporter/json_summary_reporter.py b/krkn_ai/reporter/json_summary_reporter.py
@@ -0,0 +1,188 @@
+"""
+JSON Summary Reporter for generating unified results.json files.
+"""
+
+import json
+import os
+import datetime
+from typing import Any, Dict, List, Optional
+
+from krkn_ai.models.app import CommandRunResult
+from krkn_ai.models.config import ConfigFile
+from krkn_ai.utils.logger import get_logger
+
+logger = get_logger(__name__)
+
+
+class JSONSummaryReporter:
+    """
+    Reporter class for generating and saving unified JSON summary files.
+
+    This class consolidates all run statistics into a single results.json file
+    for easier analysis and programmatic access.
+    """
+
+    def __init__(
+        self,
+        run_uuid: str,
+        config: ConfigFile,
+        seen_population: Dict[Any, CommandRunResult],
+        best_of_generation: List[CommandRunResult],
+        start_time: Optional[datetime.datetime] = None,
+        end_time: Optional[datetime.datetime] = None,
+        completed_generations: int = 0,
+        seed: Optional[int] = None,
+    ):
+        """
+        Initialize the JSON summary reporter.
+
+        Args:
+            run_uuid: Unique identifier for this run.
+            config: Configuration used for this run.
+            seen_population: Map of scenarios to their execution results.
+            best_of_generation: List of best results per generation.
+            start_time: When the run started.
+            end_time: When the run ended.
+            completed_generations: Number of generations completed.
+            seed: Random seed used for the run (if any).
+        """
+        self.run_uuid = run_uuid
+        self.config = config
+        self.seen_population = seen_population
+        self.best_of_generation = best_of_generation
+        self.start_time = start_time
+        self.end_time = end_time
+        self.completed_generations = completed_generations
+        self.seed = seed
+
+    def generate_summary(self) -> Dict[str, Any]:
+        """
+        Generate a unified results summary containing all run statistics.
+
+        Returns:
+            Dict containing run metadata, config summary, best scenarios,
+            and fitness progression over generations.
+        """
+        # Calculate duration
+        duration_seconds = 0.0
+        if self.start_time and self.end_time:
+            duration_seconds = (self.end_time - self.start_time).total_seconds()
+
+        # Get all fitness scores for statistics
+        all_fitness_scores = [
+            result.fitness_result.fitness_score
+            for result in self.seen_population.values()
+        ]
+
+        # Calculate average fitness score
+        average_fitness_score = 0.0
+        if all_fitness_scores:
+            average_fitness_score = sum(all_fitness_scores) / len(all_fitness_scores)
+
+        # Get best fitness score
+        best_fitness_score = 0.0
+        if all_fitness_scores:
+            best_fitness_score = max(all_fitness_scores)
+
+        # Count unique scenarios by their string representation
+        unique_scenarios = set()
+        for result in self.seen_population.values():
+            unique_scenarios.add(str(result.scenario))
+
+        # Generate fitness progression from best_of_generation
+        fitness_progression = self._build_fitness_progression()
+
+        # Generate best scenarios list (sorted by fitness score, top 10)
+        best_scenarios = self._build_best_scenarios()
+
+        # Build the results summary
+        results_summary: Dict[str, Any] = {
+            "run_id": self.run_uuid,
+            "seed": self.seed,
+            "start_time": self.start_time.isoformat() if self.start_time else None,
+            "end_time": self.end_time.isoformat() if self.end_time else None,
+            "duration_seconds": round(duration_seconds, 2),
+            "config": {
+                "generations": self.config.generations,
+                "population_size": self.config.population_size,
+                "mutation_rate": self.config.mutation_rate,
+                "scenario_mutation_rate": self.config.scenario_mutation_rate,
+                "crossover_rate": self.config.crossover_rate,
+                "composition_rate": self.config.composition_rate,
+            },
+            "summary": {
+                "total_scenarios_executed": len(self.seen_population),
+                "unique_scenarios": len(unique_scenarios),
+                "generations_completed": self.completed_generations,
+                "best_fitness_score": round(best_fitness_score, 4),
+                "average_fitness_score": round(average_fitness_score, 4),
+            },
+            "best_scenarios": best_scenarios,
+            "fitness_progression": fitness_progression,
+        }
+
+        return results_summary
+
+    def _build_fitness_progression(self) -> List[Dict[str, Any]]:
+        """Build fitness progression data from best_of_generation."""
+        fitness_progression = []
+        for i, result in enumerate(self.best_of_generation):
+            # Calculate average fitness for this generation from seen_population
+            gen_fitness_scores = [
+                r.fitness_result.fitness_score
+                for r in self.seen_population.values()
+                if r.generation_id == i
+            ]
+            gen_average = 0.0
+            if gen_fitness_scores:
+                gen_average = sum(gen_fitness_scores) / len(gen_fitness_scores)
+
+            fitness_progression.append(
+                {
+                    "generation": i,
+                    "best": result.fitness_result.fitness_score,
+                    "average": round(gen_average, 4),
+                }
+            )
+        return fitness_progression
+
+    def _build_best_scenarios(self) -> List[Dict[str, Any]]:
+        """Build ranked list of best scenarios (top 10)."""
+        sorted_results = sorted(
+            self.seen_population.values(),
+            key=lambda x: x.fitness_result.fitness_score,
+            reverse=True,
+        )
+        best_scenarios = []
+        for rank, result in enumerate(sorted_results[:10], start=1):
+            scenario_params = {}
+            if hasattr(result.scenario, "parameters"):
+                scenario_params = {
+                    param.get_name(): param.get_value()
+                    for param in result.scenario.parameters
+                }
+
+            best_scenarios.append(
+                {
+                    "rank": rank,
+                    "scenario_id": result.scenario_id,
+                    "generation": result.generation_id,
+                    "fitness_score": result.fitness_result.fitness_score,
+                    "scenario_type": result.scenario.name,
+                    "parameters": scenario_params,
+                }
+            )
+        return best_scenarios
+
+    def save(self, output_dir: str):
+        """
+        Generate and save the results summary to a JSON file.
+
+        Args:
+            output_dir: Directory where results.json will be saved.
+        """
+        summary = self.generate_summary()
+        output_path = os.path.join(output_dir, "results.json")
+        with open(output_path, "w", encoding="utf-8") as f:
+            json.dump(summary, f, indent=2)
+        logger.info("Results summary saved to %s", output_path)
diff --git a/tests/unit/algorithm/test_genetic_algorithm.py b/tests/unit/algorithm/test_genetic_algorithm.py
@@ -81,12 +81,19 @@ def test_save_method_calls_reporters(self, genetic_algorithm):
                         genetic_algorithm.health_check_reporter,
                         "sort_fitness_result_csv",
                     ) as mock_sort:
-                        genetic_algorithm.best_of_generation = [Mock()]
-                        genetic_algorithm.seen_population = {Mock(): Mock()}
-                        genetic_algorithm.save()
+                        with patch(
+                            "krkn_ai.algorithm.genetic.JSONSummaryReporter"
+                        ) as mock_summary_reporter:
+                            mock_reporter_instance = Mock()
+                            mock_summary_reporter.return_value = mock_reporter_instance
+                            genetic_algorithm.best_of_generation = [Mock()]
+                            genetic_algorithm.seen_population = {Mock(): Mock()}
+                            genetic_algorithm.save()
 
-                        # Verify all reporter methods are called
-                        assert mock_save_gen.called
-                        assert mock_graph.called
-                        assert mock_save_report.called
-                        assert mock_sort.called
+                            # Verify all reporter methods are called
+                            assert mock_save_gen.called
+                            assert mock_graph.called
+                            assert mock_save_report.called
+                            assert mock_sort.called
+                            assert mock_summary_reporter.called
+                            assert mock_reporter_instance.save.called