Gorilla BFCL patch update to automatize root cause detection and divergence in output between servings by dkalinowski · Pull Request #4295 · openvinotoolkit/model_server

dkalinowski · 2026-06-17T11:23:28Z

No description provided.

Copilot

Pull request overview

This PR updates the Gorilla/BFCL patch used by the demos/continuous_batching/accuracy workflow to help automate root-cause detection of output divergence between different serving modes by optionally capturing server-side verbose response details into BFCL result metadata.

Changes:

Adds a new --include-verbose-log CLI flag and threads it through BFCL generation/inference flow.
Captures selected fields from a model server’s __verbose response payload into BFCL result metadata for both multi-turn and single-turn inference.
Updates BFCL model registry entries for OVMS-backed evaluation (ovms-model, ovms-model-stream).

+    include_verbose_log: bool = typer.Option(
+        False,
+        "--include-verbose-log",
+        help="Include the __verbose field from model server responses (e.g. OVMS) in the result output; useful for debugging generation settings, prompts, and timings.",


+        if include_verbose_log and hasattr(api_response, "model_extra") and api_response.model_extra:
+            verbose_data = api_response.model_extra.get("__verbose")
+            if verbose_data:
+                metadata["__verbose"] = {k: verbose_data[k] for k in ("prompt", "content") if k in verbose_data}


+        if include_verbose_log and hasattr(api_response, "model_extra") and api_response.model_extra:
+            verbose_data = api_response.model_extra.get("__verbose")
+            if verbose_data:
+                metadata["__verbose"] = {k: verbose_data[k] for k in ("prompt", "content") if k in verbose_data}


+                if include_verbose_log and hasattr(api_response, "model_extra") and api_response.model_extra:
+                    verbose_data = api_response.model_extra.get("__verbose")
+                    if verbose_data:
+                        current_turn_verbose_log.append({k: verbose_data[k] for k in ("prompt", "content") if k in verbose_data})
+


+                if include_verbose_log and hasattr(api_response, "model_extra") and api_response.model_extra:
+                    verbose_data = api_response.model_extra.get("__verbose")
+                    if verbose_data:
+                        current_turn_verbose_log.append({k: verbose_data[k] for k in ("prompt", "content") if k in verbose_data})
+


save

599b670

Copilot AI review requested due to automatic review settings June 17, 2026 11:23

Copilot started reviewing on behalf of dkalinowski June 17, 2026 11:25 View session

Copilot AI reviewed Jun 17, 2026

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Gorilla BFCL patch update to automatize root cause detection and divergence in output between servings#4295

Gorilla BFCL patch update to automatize root cause detection and divergence in output between servings#4295
dkalinowski wants to merge 1 commit into
mainfrom
gorilla-patch

dkalinowski commented Jun 17, 2026

Uh oh!

Copilot AI left a comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

dkalinowski commented Jun 17, 2026

Uh oh!

Copilot AI left a comment

Choose a reason for hiding this comment

Pull request overview

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants