feat: Search pipeline run API uses pagination cursor

yuechao-qin · yuechao-qin · commit 119dadb47a5b · 2026-03-04T11:45:57.000-08:00
diff --git a/cloud_pipelines_backend/api_server_sql.py b/cloud_pipelines_backend/api_server_sql.py
@@ -187,26 +187,27 @@ def list(
         include_pipeline_names: bool = False,
         include_execution_stats: bool = False,
     ) -> ListPipelineJobsResponse:
-        where_clauses, offset, next_token = filter_query_sql.build_list_filters(
+        where_clauses = filter_query_sql.build_list_filters(
             filter_value=filter,
             filter_query_value=filter_query,
-            page_token_value=page_token,
+            cursor_value=page_token,
             current_user=current_user,
-            page_size=self._DEFAULT_PAGE_SIZE,
         )
 
         pipeline_runs = list(
             session.scalars(
                 sql.select(bts.PipelineRun)
                 .where(*where_clauses)
-                .order_by(bts.PipelineRun.created_at.desc())
-                .offset(offset)
+                .order_by(
+                    bts.PipelineRun.created_at.desc(),
+                    bts.PipelineRun.id.desc(),
+                )
                 .limit(self._DEFAULT_PAGE_SIZE)
             ).all()
         )
 
-        next_page_token = (
-            next_token if len(pipeline_runs) >= self._DEFAULT_PAGE_SIZE else None
+        next_page_token = filter_query_sql.maybe_next_page_token(
+            rows=pipeline_runs, page_size=self._DEFAULT_PAGE_SIZE
         )
 
         return ListPipelineJobsResponse(
diff --git a/cloud_pipelines_backend/backend_types_sql.py b/cloud_pipelines_backend/backend_types_sql.py
@@ -128,6 +128,9 @@ class _TableBase(orm.MappedAsDataclass, orm.DeclarativeBase, kw_only=True):
 
 class PipelineRun(_TableBase):
     __tablename__ = "pipeline_run"
+    _IX_PR_CREATED_AT_DESC_ID_DESC: Final[str] = (
+        "ix_pipeline_run_created_at_desc_id_desc"
+    )
     id: orm.Mapped[IdType] = orm.mapped_column(
         primary_key=True, init=False, insert_default=generate_unique_id
     )
@@ -160,6 +163,11 @@ class PipelineRun(_TableBase):
             created_by,
             created_at.desc(),
         ),
+        sql.Index(
+            _IX_PR_CREATED_AT_DESC_ID_DESC,
+            created_at.desc(),
+            id.desc(),
+        ),
     )
 
 
diff --git a/cloud_pipelines_backend/database_ops.py b/cloud_pipelines_backend/database_ops.py
@@ -89,6 +89,11 @@ def migrate_db(db_engine: sqlalchemy.Engine):
             index.create(db_engine, checkfirst=True)
             break
 
+    for index in bts.PipelineRun.__table__.indexes:
+        if index.name == bts.PipelineRun._IX_PR_CREATED_AT_DESC_ID_DESC:
+            index.create(db_engine, checkfirst=True)
+            break
+
     _backfill_pipeline_run_created_by_annotations(db_engine=db_engine)
     _backfill_pipeline_run_name_annotations(db_engine=db_engine)
 
diff --git a/cloud_pipelines_backend/filter_query_sql.py b/cloud_pipelines_backend/filter_query_sql.py
@@ -1,4 +1,3 @@
-import base64
 import datetime
 import json
 import enum
@@ -38,39 +37,58 @@ class PipelineRunAnnotationSystemKey(enum.StrEnum):
 }
 
 # ---------------------------------------------------------------------------
-# Page-token helpers
+# Cursor encode / decode
 # ---------------------------------------------------------------------------
 
-_PAGE_TOKEN_OFFSET_KEY: Final[str] = "offset"
-_PAGE_TOKEN_FILTER_KEY: Final[str] = "filter"
-_PAGE_TOKEN_FILTER_QUERY_KEY: Final[str] = "filter_query"
+CURSOR_SEPARATOR: Final[str] = "~"
 
 
-def _encode_page_token(*, page_token_dict: dict[str, Any]) -> str:
-    return base64.b64encode(json.dumps(page_token_dict).encode("utf-8")).decode("utf-8")
+def encode_cursor(created_at: datetime.datetime, run_id: str) -> str:
+    """Encode the last row's position as a tilde-separated cursor string.
 
+    The created_at from PipelineRun is naive UTC (no UtcDateTime decorator on
+    this column). We stamp it as UTC here so the cursor string is
+    timezone-explicit for readability and correctness.
+    decode_cursor() normalizes back to naive UTC for DB comparison.
+    """
+    if created_at.tzinfo is None:
+        created_at = created_at.replace(tzinfo=datetime.timezone.utc)
+    return f"{created_at.isoformat()}{CURSOR_SEPARATOR}{run_id}"
 
-def _decode_page_token(*, page_token: str | None) -> dict[str, Any]:
-    return json.loads(base64.b64decode(page_token)) if page_token else {}
 
+def decode_cursor(cursor: str | None) -> tuple[datetime.datetime, str] | None:
+    """Parse a tilde-separated cursor string into (created_at, run_id).
 
-def _resolve_filter_value(
-    *,
-    filter: str | None,
-    filter_query: str | None,
-    page_token: str | None,
-) -> tuple[str | None, str | None, int]:
-    """Decode page_token and return the effective (filter_value, filter_query_value, offset).
-
-    If a page_token is present, its stored values take precedence over the
-    raw parameters (the token carries resolved values forward across pages).
+    Returns None for empty/missing cursors. Raises ApiValidationError
+    for unrecognized formats (e.g. legacy base64 tokens).
     """
-    page_token_dict = _decode_page_token(page_token=page_token)
-    offset = page_token_dict.get(_PAGE_TOKEN_OFFSET_KEY, 0)
-    if page_token:
-        filter = page_token_dict.get(_PAGE_TOKEN_FILTER_KEY)
-        filter_query = page_token_dict.get(_PAGE_TOKEN_FILTER_QUERY_KEY)
-    return filter, filter_query, offset
+    if not cursor:
+        return None
+    if CURSOR_SEPARATOR not in cursor:
+        raise errors.ApiValidationError(
+            f"Unrecognized page_token format. "
+            f"Expected 'created_at~id' cursor. token={cursor[:20]}... (truncated)"
+        )
+    # maxsplit=1: split on first ~ only, so run_id can safely contain ~
+    created_at_str, run_id = cursor.split(CURSOR_SEPARATOR, 1)
+    created_at = datetime.datetime.fromisoformat(created_at_str)
+    # Normalize to naive UTC to match DB storage format (PipelineRun.created_at
+    # is plain DateTime, not UtcDateTime -- stores/returns naive datetimes).
+    if created_at.tzinfo is not None:
+        created_at = created_at.astimezone(datetime.timezone.utc).replace(tzinfo=None)
+    return created_at, run_id
+
+
+def maybe_next_page_token(
+    *,
+    rows: list[bts.PipelineRun],
+    page_size: int,
+) -> str | None:
+    """Return a cursor token for the next page, or None if this is the last page."""
+    if len(rows) < page_size:
+        return None
+    last = rows[page_size - 1]
+    return encode_cursor(last.created_at, last.id)
 
 
 # ---------------------------------------------------------------------------
@@ -154,25 +172,15 @@ def build_list_filters(
     *,
     filter_value: str | None,
     filter_query_value: str | None,
-    page_token_value: str | None,
+    cursor_value: str | None,
     current_user: str | None,
-    page_size: int,
-) -> tuple[list[sql.ColumnElement], int, str]:
-    """Resolve pagination token, legacy filter, and filter_query into WHERE clauses.
-
-    Returns (where_clauses, offset, next_page_token_encoded).
-    """
+) -> list[sql.ColumnElement]:
+    """Build WHERE clauses from filters and cursor."""
     if filter_value and filter_query_value:
         raise errors.ApiValidationError(
             "Cannot use both 'filter' and 'filter_query'. Use one or the other."
         )
 
-    filter_value, filter_query_value, offset = _resolve_filter_value(
-        filter=filter_value,
-        filter_query=filter_query_value,
-        page_token=page_token_value,
-    )
-
     if filter_value:
         filter_query_value = _convert_legacy_filter_to_filter_query(
             filter_value=filter_value,
@@ -188,14 +196,18 @@ def build_list_filters(
             )
         )
 
-    next_page_token = _encode_page_token(
-        page_token_dict={
-            _PAGE_TOKEN_OFFSET_KEY: offset + page_size,
-            _PAGE_TOKEN_FILTER_QUERY_KEY: filter_query_value,
-        }
-    )
+    cursor = decode_cursor(cursor_value)
+    if cursor:
+        cursor_created_at, cursor_id = cursor
+        where_clauses.append(
+            sql.tuple_(bts.PipelineRun.created_at, bts.PipelineRun.id)
+            < sql.tuple_(
+                sql.literal(cursor_created_at),
+                sql.literal(cursor_id),
+            )
+        )
 
-    return where_clauses, offset, next_page_token
+    return where_clauses
 
 
 def filter_query_to_where_clause(
diff --git a/tests/test_api_server_sql.py b/tests/test_api_server_sql.py
@@ -179,6 +179,7 @@ def test_list_pagination(self, session_factory, service):
             )
         assert len(page1.pipeline_runs) == 10
         assert page1.next_page_token is not None
+        assert "~" in page1.next_page_token
 
         with session_factory() as session:
             page2 = service.list(
@@ -188,6 +189,70 @@ def test_list_pagination(self, session_factory, service):
         assert len(page2.pipeline_runs) == 2
         assert page2.next_page_token is None
 
+    def test_list_cursor_pagination_order(self, session_factory, service):
+        for i in range(5):
+            _create_run(
+                session_factory,
+                service,
+                root_task=_make_task_spec(f"pipeline-{i}"),
+            )
+
+        with session_factory() as session:
+            result = service.list(session=session)
+
+        dates = [r.created_at for r in result.pipeline_runs]
+        assert dates == sorted(dates, reverse=True)
+
+    def test_list_cursor_pagination_no_overlap(self, session_factory, service):
+        for i in range(12):
+            _create_run(
+                session_factory,
+                service,
+                root_task=_make_task_spec(f"pipeline-{i}"),
+            )
+
+        with session_factory() as session:
+            page1 = service.list(session=session)
+        with session_factory() as session:
+            page2 = service.list(session=session, page_token=page1.next_page_token)
+        page1_ids = {r.id for r in page1.pipeline_runs}
+        page2_ids = {r.id for r in page2.pipeline_runs}
+        assert page1_ids.isdisjoint(page2_ids)
+
+    def test_list_cursor_pagination_stable_under_inserts(
+        self, session_factory, service
+    ):
+        for i in range(12):
+            _create_run(
+                session_factory,
+                service,
+                root_task=_make_task_spec(f"pipeline-{i}"),
+            )
+
+        with session_factory() as session:
+            page1 = service.list(session=session)
+        page1_ids = {r.id for r in page1.pipeline_runs}
+
+        _create_run(
+            session_factory,
+            service,
+            root_task=_make_task_spec("pipeline-new"),
+        )
+
+        with session_factory() as session:
+            page2 = service.list(session=session, page_token=page1.next_page_token)
+        page2_ids = {r.id for r in page2.pipeline_runs}
+        assert page1_ids.isdisjoint(page2_ids)
+        assert len(page2.pipeline_runs) == 2
+
+    def test_list_invalid_page_token_raises(self, session_factory, service):
+        """page_token without ~ raises ApiValidationError (422)."""
+        with session_factory() as session:
+            with pytest.raises(
+                errors.ApiValidationError, match="Unrecognized page_token"
+            ):
+                service.list(session=session, page_token="not-a-cursor")
+
     def test_list_filter_unsupported(self, session_factory, service):
         with session_factory() as session:
             with pytest.raises(NotImplementedError, match="Unsupported filter"):
@@ -1278,7 +1343,7 @@ def test_list_filter_query_time_range_offset_timezone(
         returned_ids = {r.id for r in result.pipeline_runs}
         assert returned_ids == {run_b.id, run_c.id}
 
-    def test_pagination_preserves_filter_query(self, session_factory, service):
+    def test_pagination_with_filter_query(self, session_factory, service):
         for _ in range(12):
             run = _create_run(
                 session_factory,
@@ -1302,14 +1367,13 @@ def test_pagination_preserves_filter_query(self, session_factory, service):
             )
         assert len(page1.pipeline_runs) == 10
         assert page1.next_page_token is not None
-
-        decoded = filter_query_sql._decode_page_token(page_token=page1.next_page_token)
-        assert decoded["filter_query"] == fq
+        assert "~" in page1.next_page_token
 
         with session_factory() as session:
             page2 = service.list(
                 session=session,
                 page_token=page1.next_page_token,
+                filter_query=fq,
             )
         assert len(page2.pipeline_runs) == 2
         assert page2.next_page_token is None
diff --git a/tests/test_filter_query_sql.py b/tests/test_filter_query_sql.py