Add Category and Created columns to homepage table with working sorting

Copilot · mvadari · Copilot · commit 41596687b6db · 2025-08-20T19:58:03.000Z
Co-authored-by: mvadari &lt;8029314+mvadari@users.noreply.github.com&gt;
diff --git a/site/assets/style.css b/site/assets/style.css
@@ -219,6 +219,37 @@ main { min-height: calc(100vh - 200px); padding: 48px 0; }
     color: var(--text-color-secondary);
 }
 
+/* Category badges */
+.category-badge {
+    display: inline-block;
+    border-radius: 4px;
+    font-weight: 600;
+    letter-spacing: 0.5px;
+    text-align: center;
+    text-transform: capitalize;
+    min-width: 80px;
+    padding: 6px 12px;
+    font-size: 12px;
+}
+
+.category-badge.amendment {
+    border: 1px solid #FF6B35;
+    background-color: #4A1E0E;
+    color: #FF6B35;
+}
+
+.category-badge.community {
+    border: 1px solid var(--color-purple-4);
+    background-color: #2E1A4C;
+    color: var(--color-purple-4);
+}
+
+.category-badge.protocol {
+    border: 1px solid #FFD700;
+    background-color: #4C4200;
+    color: #FFD700;
+}
+
 /* XLS document page */
 .xls-document {
     padding: 32px;
diff --git a/site/templates/index.html b/site/templates/index.html
@@ -26,8 +26,10 @@ <h2>XRP Ledger Standards (XLS)</h2>
                 <!-- Sortable column headers with data attributes for JavaScript -->
                 <th class="sortable" data-column="number">Number</th>
                 <th class="sortable" data-column="title">Title</th>
+                <th class="sortable" data-column="category">Category</th>
                 <th class="sortable" data-column="author">Author(s)</th>
                 <th class="sortable" data-column="status">Status</th>
+                <th class="sortable" data-column="created">Created</th>
             </tr>
         </thead>
         <tbody>
@@ -44,6 +46,11 @@ <h2>XRP Ledger Standards (XLS)</h2>
                     <a href="{{ base_url }}/xls/{{ doc.folder }}.html">{{ doc.title }}</a>
                 </td>
                 
+                <!-- Category column -->
+                <td class="category-col" data-label="Category" data-sort-value="{{ doc.category|lower }}">
+                    <span class="category-badge {{ doc.category|lower }}">{{ doc.category }}</span>
+                </td>
+                
                 <!-- Author information -->
                 <td class="author-col" data-label="Author" data-sort-value="{% for author in doc.authors %}{% if author %}{{ author[0]|lower }}{% endif %}{% if not loop.last %}, {% endif %}{% endfor %}">
                 {% for author in doc.authors %}
@@ -55,6 +62,11 @@ <h2>XRP Ledger Standards (XLS)</h2>
                 <td class="status-col" data-label="Status" data-sort-value="{{ doc.status|lower }}">
                     <span class="status-badge {{doc.status|lower}}">{{ doc.status.title() }}</span>
                 </td>
+                
+                <!-- Created date column -->
+                <td class="created-col" data-label="Created" data-sort-value="{{ doc.created }}">
+                    {{ doc.created }}
+                </td>
             </tr>
             {% endfor %}
         </tbody>
@@ -108,10 +120,14 @@ <h2>XRP Ledger Standards (XLS)</h2>
         rows.sort((a, b) => {
             let aVal, bVal;
             
-            // Special handling for numerical sorting of XLS numbers
+            // Special handling for numerical sorting of XLS numbers and dates
             if (column === 'number') {
                 aVal = parseInt(a.querySelector(`td[data-label="${column.charAt(0).toUpperCase() + column.slice(1)}"]`).dataset.sortValue);
                 bVal = parseInt(b.querySelector(`td[data-label="${column.charAt(0).toUpperCase() + column.slice(1)}"]`).dataset.sortValue);
+            } else if (column === 'created') {
+                // Sort by date - data is already in YYYY-MM-DD format which sorts correctly as strings
+                aVal = a.querySelector(`td[data-label="${column.charAt(0).toUpperCase() + column.slice(1)}"]`).dataset.sortValue;
+                bVal = b.querySelector(`td[data-label="${column.charAt(0).toUpperCase() + column.slice(1)}"]`).dataset.sortValue;
             } else {
                 // Text-based sorting for other columns
                 aVal = a.querySelector(`td[data-label="${column.charAt(0).toUpperCase() + column.slice(1)}"]`).dataset.sortValue;
diff --git a/site/xls_parser.py b/site/xls_parser.py
@@ -26,6 +26,8 @@ class XLSDocument:
     folder: str
     filename: str
     status: str  # draft, final, stagnant, withdrawn, etc.
+    category: str  # amendment, community, protocol, etc.
+    created: str  # YYYY-MM-DD format
 
     def to_dict(self):
         return asdict(self)
@@ -54,53 +56,49 @@ def extract_xls_metadata(content: str, folder_name: str) -> Optional[XLSDocument
         print("ERROR: No <pre> block found in content")
         sys.exit(1)
 
-    # Extract metadata using various patterns
+    # Extract metadata using standardized patterns (headers are now enforced by CI)
     patterns = {
-        "title": [
-            r"[tT]itle:\s*<b>(.*?)</b>",
-            r"[tT]itle:\s*(.*?)(?:\n|$)",
-        ],
-        "description": [
-            r"[dD]escription:\s*(.*?)(?:\n|$)",
-        ],
-        "authors": [r"[aA]uthor:\s*(.*?)(?:\n|$)"],
-        "status":  [r"[sS]tatus:\s*(.*?)(?:\n|$)"],
+        "title": r"[tT]itle:\s*(.*?)(?:\n|$)",
+        "description": r"[dD]escription:\s*(.*?)(?:\n|$)",
+        "authors": r"[aA]uthor:\s*(.*?)(?:\n|$)",
+        "status": r"[sS]tatus:\s*(.*?)(?:\n|$)",
+        "category": r"[cC]ategory:\s*(.*?)(?:\n|$)",
+        "created": r"[cC]reated:\s*(.*?)(?:\n|$)",
     }
 
-    for key, pattern_list in patterns.items():
-        for pattern in pattern_list:
-            match = re.search(pattern, pre_text, re.IGNORECASE | re.DOTALL)
-            if match:
-                value = match.group(1).strip()
-                # Clean HTML tags from value
-                if key == "authors":
-                    # Ensure authors are comma-separated
-                    # Convert author to mailto or GitHub link if possible
-                    def format_author(author):
-                        author = author.strip()
-                        # Email address
-                        email_match = re.match(r"^(.*?)\s*<\s*([^>]+)\s*>$", author)
-                        if email_match:
-                            name = email_match.group(1).strip()
-                            email = email_match.group(2).strip()
-                            return name, f'mailto:{email}'
-                        # GitHub username in parentheses
-                        gh_match = re.match(r"^(.*?)\s*\(@([^)]+)\)$", author)
-                        if gh_match:
-                            name = gh_match.group(1).strip()
-                            gh_user = gh_match.group(2).strip()
-                            return name, f'https://github.com/{gh_user}'
-                        # Just a name
-                        return author, ""
-
-                    value = [
-                        format_author(author)
-                        for author in value.split(",")
-                    ]
-                else:
-                    value = BeautifulSoup(value, "html.parser").get_text().strip()
-                metadata[key] = value
-                break
+    def format_author(author):
+        """Format author information into name and link tuple."""
+        author = author.strip()
+        # Email address
+        email_match = re.match(r"^(.*?)\s*<\s*([^>]+)\s*>$", author)
+        if email_match:
+            name = email_match.group(1).strip()
+            email = email_match.group(2).strip()
+            return name, f'mailto:{email}'
+        # GitHub username in parentheses
+        gh_match = re.match(r"^(.*?)\s*\(@([^)]+)\)$", author)
+        if gh_match:
+            name = gh_match.group(1).strip()
+            gh_user = gh_match.group(2).strip()
+            return name, f'https://github.com/{gh_user}'
+        # Just a name
+        return author, ""
+
+    for key, pattern in patterns.items():
+        match = re.search(pattern, pre_text, re.IGNORECASE | re.DOTALL)
+        if match:
+            value = match.group(1).strip()
+            # Clean HTML tags from value and process based on field type
+            if key == "authors":
+                # Process comma-separated authors
+                value = [
+                    format_author(author)
+                    for author in value.split(",")
+                ]
+            else:
+                # Clean HTML tags for other fields
+                value = BeautifulSoup(value, "html.parser").get_text().strip()
+            metadata[key] = value
 
     # Extract XLS number from folder name
     xls_match = re.match(r"XLS-(\d+)([d]?)", folder_name)
@@ -111,12 +109,14 @@ def format_author(author):
 
     return XLSDocument(
         number=number,
-        title=metadata["title"],
-        description=metadata["description"],
-        authors=metadata["authors"],
+        title=metadata.get("title", "Unknown Title"),
+        description=metadata.get("description", "No description available"),
+        authors=metadata.get("authors", [("Unknown Author", "")]),
         folder=folder_name,
         filename="README.md",
-        status=metadata["status"],
+        status=metadata.get("status", "Unknown"),
+        category=metadata.get("category", "Unknown"),
+        created=metadata.get("created", "Unknown"),
     )
 
 
@@ -189,10 +189,22 @@ def validate_xls_documents(root_dir: Path) -> bool:
                 validation_errors.append(
                     f"Error: {doc.folder} is missing required title metadata"
                 )
-            if not doc.authors or doc.authors == "Unknown Author":
+            if not doc.authors or doc.authors == [("Unknown Author", "")]:
                 validation_errors.append(
                     f"Error: {doc.folder} is missing required authors metadata"
                 )
+            if not doc.status or doc.status == "Unknown":
+                validation_errors.append(
+                    f"Error: {doc.folder} is missing required status metadata"
+                )
+            if not doc.category or doc.category == "Unknown":
+                validation_errors.append(
+                    f"Error: {doc.folder} is missing required category metadata"
+                )
+            if not doc.created or doc.created == "Unknown":
+                validation_errors.append(
+                    f"Error: {doc.folder} is missing required created metadata"
+                )
 
         if validation_errors:
             for error in validation_errors: