olivas/backend/app/services/cloud_run_client.py

"""HTTP client for OliVAS Cloud Run services.

Provides sync wrappers suitable for use inside BackgroundTasks threadpool.
Falls back to local processing if Cloud Run URLs are not configured.
"""
import base64
import logging
from typing import Any

import httpx

from app.config import settings

logger = logging.getLogger("olivas.cloud_run")

# 5-minute timeout for saliency inference (DeepGaze on CPU can take ~30–60s on warm,
# but first request after cold start may take longer)
_SALIENCY_TIMEOUT = httpx.Timeout(360.0, connect=15.0)
_PROCESSING_TIMEOUT = httpx.Timeout(120.0, connect=10.0)


def _headers() -> dict[str, str]:
    if settings.CLOUD_RUN_SECRET:
        return {"X-Internal-Secret": settings.CLOUD_RUN_SECRET}
    return {}


def call_saliency(image_data: bytes, model_name: str) -> dict[str, Any]:
    """POST image to olivas-saliency and return JSON with saliency + metrics."""
    url = settings.CLOUD_RUN_SALIENCY_URL.rstrip("/") + "/predict"
    logger.info(f"Calling saliency service: model={model_name} image={len(image_data)}B")

    with httpx.Client(timeout=_SALIENCY_TIMEOUT) as client:
        response = client.post(
            url,
            files={"image": ("image.png", image_data, "image/png")},
            data={"model": model_name},
            headers=_headers(),
        )

    if response.status_code != 200:
        raise RuntimeError(
            f"Saliency service returned {response.status_code}: {response.text[:500]}"
        )

    result = response.json()
    logger.info(
        f"Saliency done: score={result.get('overall_score')} entropy={result.get('entropy_score')}"
    )
    return result


def call_processing(
    image_data: bytes,
    saliency_b64: str,
    shape: list[int],
    gaze_sequence: list[dict],
) -> dict[str, str]:
    """POST image + saliency to olivas-processing and return base64-encoded result images."""
    url = settings.CLOUD_RUN_PROCESSING_URL.rstrip("/") + "/process"
    image_b64 = base64.b64encode(image_data).decode()

    logger.info(f"Calling processing service: image={len(image_data)}B shape={shape}")

    with httpx.Client(timeout=_PROCESSING_TIMEOUT) as client:
        response = client.post(
            url,
            json={
                "image_b64": image_b64,
                "saliency_b64": saliency_b64,
                "shape": shape,
                "gaze_sequence": gaze_sequence,
            },
            headers=_headers(),
        )

    if response.status_code != 200:
        raise RuntimeError(
            f"Processing service returned {response.status_code}: {response.text[:500]}"
        )

    return response.json()