BFCL v-4

Emerging

2papers using it

2026first seen

The 'BFCL-V-4' dataset/benchmark contains a collection of multi-turn interaction scenarios designed to evaluate the performance of AI agents in reasoning and invoking external tools during complex tasks.

🔎 Find this dataset

Papers using BFCL v-4 (2)

SeeUPO: Sequence-Level Agentic-RL with Convergence Guarantees2026

CM2: Reinforcement Learning with Checklist Rewards for Multi-Turn and Multi-Step Agentic Tool Use2026