BFCL v-4 Multi-Turn

Emerging

2papers using it

2026first seen

The 'BFCL v-4 Multi-Turn' dataset/benchmark contains multi-turn interactions designed to evaluate the ability of models to recover from execution errors during tool use.

🔎 Find this dataset

Papers using BFCL v-4 Multi-Turn (2)

DecisionBench: A Benchmark for Emergent Delegation in Long-Horizon Agentic Workflows2026

Robust Tool Use via Fission-GRPO: Learning to Recover from Execution Errors2026