tilesprivacy · madclaws · Mar 29, 2026 · Mar 28, 2026 · Mar 29, 2026 · coderabbitai
diff --git a/modelfiles/qwen b/modelfiles/qwen
@@ -1,4 +1,4 @@
-FROM mlx-community/Qwen3.5-0.8B-8bit
+FROM mlx-community/Qwen3.5-4B-MLX-4bit
+#FROM mlx-community/Qwen3.5-0.8B-8bit
 # FROM mlx-community/Qwen3.5-0.8B-MLX-8bit
-# FROM mlx-community/Qwen3.5-4B-MLX-4bit
 # FROM mlx-community/Qwen3-0.6B-4bit
diff --git a/pkg/scripts/preinstall b/pkg/scripts/preinstall
@@ -0,0 +1,6 @@
+#!/bin/bash
+
+# So that we don't have multiple copies of python libs lying around
+# from previous installs
+
+rm -rf /usr/local/share/tiles/server
diff --git a/server/api.py b/server/api.py
@@ -7,7 +7,6 @@
 from pydantic import BaseModel, Field
 
 from . import runtime
-from .hf_downloader import pull_model
 from .mem_agent.engine import execute_sandboxed_code
 from .mem_agent.utils import (
     create_memory_if_not_exists,
@@ -37,12 +36,6 @@ async def ping():
     return {"message": "Badda-Bing Badda-Bang"}
 
 
-@app.post("/download")
-async def download(request: downloadRequest):
-    """Download the model"""
-    runtime.backend.download_model(request.model)
-
-
 @app.post("/start")
 async def start_model(request: StartRequest):
     """Load the model and start the agent"""

diff --git a/server/backend/mlx.py b/server/backend/mlx.py
@@ -24,14 +24,12 @@
 from ..reasoning_utils import ReasoningExtractor
 
 from ..cache_utils import get_model_path
-from ..hf_downloader import pull_model
 from ..schemas import (
     ChatCompletionRequest,
     ChatMessage,
     GenerationMetrics,
     ResponsesRequest,
     ResponsesResponse,
-    downloadRequest,
 )
 from .mlx_runner import MLXRunner
 
@@ -46,14 +44,6 @@
 _responses: Dict[str, ResponsesResponse] = {}
 
 
-def download_model(model_name: str):
-    """Download the model"""
-    if pull_model(model_name):
-        return {"message": "Model downloaded"}
-    else:
-        raise HTTPException(status_code=400, detail="Downloading model failed")
-
-
 def get_or_load_model(
     model_spec: str, model_cache_path: str | None = None, verbose: bool = True
 ) -> MLXRunner:

diff --git a/server/hf_downloader.py b/server/hf_downloader.py
diff --git a/server/pyproject.toml b/server/pyproject.toml
@@ -4,11 +4,10 @@ version = "0.1.0"
 description = "Local MLX inference server for the Tiles CLI"
 requires-python = "==3.13.*"
 dependencies = [
-    "fastapi",
-    "uvicorn",
-    "mlx-lm",
-    "black",
-    "huggingface-hub>=0.34.0",
+    "fastapi==0.119.0",
+    "uvicorn==0.38.0",
+    "mlx-lm==0.31.0",
+    "black==25.9.0",
     "openai-harmony==0.0.8",
     "openresponses-types"
 ]
@@ -19,3 +18,6 @@ build-backend = "setuptools.build_meta"
 
 [tool.setuptools.packages.find]
 exclude = ["backend", "backend.*"]
+
+[tool.uv]
+exclude-newer="10 days"
diff --git a/server/stack/requirements/app-server/packages-app-server.txt b/server/stack/requirements/app-server/packages-app-server.txt
@@ -1,23 +1,27 @@
 # Package summary for app-server
 #     Auto-generated by venvstacks (DO NOT EDIT)
+annotated-doc==0.0.4
 annotated-types==0.7.0
-anyio==4.12.1
+anyio==4.13.0
 black==25.9.0
 certifi==2026.2.25
-charset-normalizer==3.4.6
 click==8.3.1
 fastapi==0.119.0
 filelock==3.25.2
-fsspec==2026.2.0
+fsspec==2026.3.0
 h11==0.16.0
 hf-xet==1.4.2
-huggingface-hub==0.35.0
+httpcore==1.0.9
+httpx==0.28.1
+huggingface-hub==1.8.0
 idna==3.11
 jinja2==3.1.6
+markdown-it-py==4.0.0
 markupsafe==3.0.3
-mlx-lm==0.28.3
+mdurl==0.1.2
+mlx-lm==0.31.0
 mypy-extensions==1.1.0
-numpy==2.4.3
+numpy==2.4.4
 openai-harmony==0.0.8
 openresponses-types==2.3.0.post1
 packaging==26.0
@@ -26,20 +30,23 @@ platformdirs==4.9.4
 protobuf==7.34.1
 pydantic==2.12.5
 pydantic-core==2.41.5
+pygments==2.20.0
 pytokens==0.4.1
 pyyaml==6.0.3
-regex==2026.2.28
-requests==2.32.5
+regex==2026.3.32
+rich==14.3.3
 safetensors==0.7.0
+sentencepiece==0.2.1
+shellingham==1.5.4
 starlette==0.48.0
 tokenizers==0.22.2
 tqdm==4.67.3
-transformers==4.57.6
+transformers==5.4.0
+typer==0.24.1
 typing-extensions==4.15.0
 typing-inspection==0.4.2
-urllib3==2.6.3
 uvicorn==0.38.0
 
 # Shared packages inherited from other layers
-mlx-metal==0.29.3 ; platform_machine == 'arm64' and sys_platform == 'darwin'
-mlx==0.29.3 ; platform_machine == 'arm64' and sys_platform == 'darwin'
+mlx-metal==0.31.1 ; platform_machine == 'arm64' and sys_platform == 'darwin'
+mlx==0.31.1 ; platform_machine == 'arm64' and sys_platform == 'darwin'
diff --git a/server/stack/requirements/app-server/pylock.app-server.meta.json b/server/stack/requirements/app-server/pylock.app-server.meta.json
@@ -1,8 +1,8 @@
 {
-  "lock_input_hash": "sha256:c836d5cfb697330a57241b2b8f275a804178488ec906b19866809ef33c95ba81",
+  "lock_input_hash": "sha256:d7a2f2a68301eb65d01fc121715ef8b96a6af48a315d580340d976fde6e1dc47",
   "lock_version": 1,
-  "locked_at": "2026-03-22T21:45:51.270370+00:00",
+  "locked_at": "2026-03-29T17:39:54.163496+00:00",
   "other_inputs_hash": "sha256:63b3c2cfe2ec414938e81dace7aac779c7b902bae681618cd8827e9f16880985",
-  "requirements_hash": "sha256:167a9044a762af6b1b0b26589b77a245bf351a3b74860bc9f1bc6a07053a48a7",
+  "requirements_hash": "sha256:d848ff36972adee8df190ab839a11cd766fcdd9577ae2e24ebbe1f25f9074da3",
   "version_inputs_hash": "sha256:58db986b7cd72eeded675f7c9afd8138fe024fb51451131b5562922bbde3cf43"
 }