Fix CSV header naming typos in qdrant_collection.py

raviriley · web-flow · commit 66f78ff483bf · 2025-03-07T18:11:41.000-08:00
diff --git a/src/flare_ai_rag/retriever/qdrant_collection.py b/src/flare_ai_rag/retriever/qdrant_collection.py
@@ -42,12 +42,12 @@ def generate_collection(
     for idx, (_, row) in enumerate(
         df_docs.iterrows(), start=1
     ):  # Using _ for unused variable
-        content = row["Contents"]
+        content = row["content"]
 
         if not isinstance(content, str):
             logger.warning(
                 "Skipping document due to missing or invalid content.",
-                filename=row["Filename"],
+                filename=row["file_name"],
             )
             continue
 
@@ -56,34 +56,34 @@ def generate_collection(
                 embedding_model=retriever_config.embedding_model,
                 task_type=EmbeddingTaskType.RETRIEVAL_DOCUMENT,
                 contents=content,
-                title=str(row["Filename"]),
+                title=str(row["file_name"]),
             )
         except google.api_core.exceptions.InvalidArgument as e:
             # Check if it's the known "Request payload size exceeds the limit" error
             # If so, downgrade it to a warning
             if "400 Request payload size exceeds the limit" in str(e):
                 logger.warning(
                     "Skipping document due to size limit.",
-                    filename=row["Filename"],
+                    filename=row["file_name"],
                 )
                 continue
             # Log the full traceback for other InvalidArgument errors
             logger.exception(
                 "Error encoding document (InvalidArgument).",
-                filename=row["Filename"],
+                filename=row["file_name"],
             )
             continue
         except Exception:
             # Log the full traceback for any other errors
             logger.exception(
                 "Error encoding document (general).",
-                filename=row["Filename"],
+                filename=row["file_name"],
             )
             continue
 
         payload = {
-            "filename": row["Filename"],
-            "metadata": row["Metadata"],
+            "filename": row["file_name"],
+            "metadata": row["meta_data"],
             "text": content,
         }