[release test] convert job_id and job_url into methods (#60278)

aslonnie · web-flow · commit 61aee6a33ae5 · 2026-01-20T13:47:14.000-08:00
and saves the job ID in `_job_id`. this makes the information flow
clearer and simpler.

this is preparation for refactoring the job sdk usage.

Signed-off-by: Lonnie Liu &lt;95255098+aslonnie@users.noreply.github.com&gt;
diff --git a/release/ray_release/command_runner/anyscale_job_runner.py b/release/ray_release/command_runner/anyscale_job_runner.py
@@ -449,3 +449,9 @@ def fetch_output(self) -> Dict[str, Any]:
         return self._fetch_json(
             _join_cloud_storage_paths(self.path_in_bucket, self.output_json),
         )
+
+    def job_url(self) -> Optional[str]:
+        return self.job_manager.job_url()
+
+    def job_id(self) -> Optional[str]:
+        return self.job_manager.job_id()
diff --git a/release/ray_release/glue.py b/release/ray_release/glue.py
@@ -537,8 +537,8 @@ def run_release_test_anyscale(
 
         # Obtain the cluster info again as it is set after the
         # command was run in case of anyscale jobs
-        result.job_url = runner.job_manager.job_url
-        result.job_id = runner.job_manager.job_id
+        result.job_url = runner.job_url()
+        result.job_id = runner.job_id()
         result.last_logs = runner.get_last_logs()
 
     except Exception as e:
diff --git a/release/ray_release/job_manager/anyscale_job_manager.py b/release/ray_release/job_manager/anyscale_job_manager.py
@@ -40,6 +40,7 @@ def __init__(self, cluster_manager: ClusterManager):
         self.cluster_manager = cluster_manager
         self._sdk = cluster_manager.sdk
         self._last_job_result = None
+        self._job_id: Optional[str] = None
         self._last_logs = None
         self.cluster_startup_timeout = 600
         self._duration = None
@@ -92,7 +93,7 @@ def _run_job(
         self.last_job_result = job_response.result
         self.start_time = time.time()
 
-        logger.info(f"Link to job: " f"{format_link(self.job_url)}")
+        logger.info(f"Link to job: " f"{format_link(self.job_url())}")
         return
 
     @property
@@ -102,18 +103,15 @@ def last_job_result(self):
     @last_job_result.setter
     def last_job_result(self, value):
         self._last_job_result = value
+        self._job_id = value.id if value else None
 
-    @property
     def job_id(self) -> Optional[str]:
-        if not self.last_job_result:
-            return None
-        return self.last_job_result.id
+        return self._job_id
 
-    @property
     def job_url(self) -> Optional[str]:
-        if not self.job_id:
+        if not self._job_id:
             return None
-        return anyscale_job_url(self.job_id)
+        return anyscale_job_url(self._job_id)
 
     @property
     def last_job_status(self) -> Optional[HaJobStates]:
@@ -127,7 +125,7 @@ def in_progress(self) -> bool:
 
     def _get_job_status_with_retry(self):
         return exponential_backoff_retry(
-            lambda: self._sdk.get_production_job(self.job_id),
+            lambda: self._sdk.get_production_job(self._job_id),
             retry_exceptions=Exception,
             initial_retry_delay_s=1,
             max_retries=3,
@@ -136,12 +134,12 @@ def _get_job_status_with_retry(self):
     def _terminate_job(self, raise_exceptions: bool = False):
         if not self.in_progress:
             return
-        logger.info(f"Terminating job {self.job_id}...")
+        logger.info(f"Terminating job {self._job_id}...")
         try:
-            self._sdk.terminate_job(self.job_id)
-            logger.info(f"Job {self.job_id} terminated!")
+            self._sdk.terminate_job(self._job_id)
+            logger.info(f"Job {self._job_id} terminated!")
         except Exception:
-            msg = f"Couldn't terminate job {self.job_id}!"
+            msg = f"Couldn't terminate job {self._job_id}!"
             if raise_exceptions:
                 logger.error(msg)
                 raise
@@ -172,7 +170,7 @@ def _wait_job(self, timeout: int):
         # The context ensures the job always either finishes normally
         # or is terminated.
         with self._terminate_job_context():
-            assert self.job_id, "Job must have been started"
+            assert self._job_id, "Job must have been started"
 
             start_time = time.monotonic()
             # Waiting for cluster needs to be a part of the whole
@@ -254,10 +252,10 @@ def run_and_wait(
 
     def _get_ray_logs(self) -> str:
         """Obtain the last few log"""
-        return anyscale.job.get_logs(id=self.job_id, max_lines=LAST_LOGS_LENGTH)
+        return anyscale.job.get_logs(id=self._job_id, max_lines=LAST_LOGS_LENGTH)
 
     def get_last_logs(self):
-        if not self.job_id:
+        if not self._job_id:
             raise RuntimeError(
                 "Job has not been started, therefore there are no logs to obtain."
             )
diff --git a/release/ray_release/tests/test_anyscale_job_manager.py b/release/ray_release/tests/test_anyscale_job_manager.py
@@ -31,7 +31,7 @@ def test_get_last_logs_long_running_job():
     )
     anyscale_job_manager = AnyscaleJobManager(cluster_manager=cluster_manager)
     anyscale_job_manager._duration = 4 * 3_600 + 1
-    anyscale_job_manager._last_job_result = FakeJobResult(_id="foo")
+    anyscale_job_manager.last_job_result = FakeJobResult(_id="foo")
     assert anyscale_job_manager.get_last_logs() is None
 
 

Original file line number	Diff line number	Diff line change
`@@ -31,7 +31,7 @@ def test_get_last_logs_long_running_job():`
`31`	`31`	`)`
`32`	`32`	`anyscale_job_manager = AnyscaleJobManager(cluster_manager=cluster_manager)`
`33`	`33`	`anyscale_job_manager._duration = 4 * 3_600 + 1`
`34`		`- anyscale_job_manager._last_job_result = FakeJobResult(_id="foo")`
	`34`	`+ anyscale_job_manager.last_job_result = FakeJobResult(_id="foo")`
`35`	`35`	`assert anyscale_job_manager.get_last_logs() is None`
`36`	`36`
`37`	`37`