Fun-ASR Workbench

围绕多语言、噪声场景与批量吞吐设计的测试页

这个界面不是通用上传表单，而是按 FUN ASR 的能力去测。一次测试里可以覆盖语言切换、批量文件、热词、时间戳和 VAD 合并行为。

模型 FunAudioLLM/Fun-ASR-Nano-2512

设备 cuda:0

批量上限 8

vLLM 状态 未启用

测试面板

适合验证方言、口音、歌词、会议录音与多语言切换。

拖入或选择音频文件支持一次上传多个文件，便于测批量吞吐。

识别语言批量规模热词 / 行业词

ITN 规范化 VAD 片段合并时间戳输出

未录音

返回原始结果字段，便于直接核对时间戳与模型行为。

等待上传音频。

适合直接传 R2 外链，不必先下载到本地。

用同一批请求放入中文、英文、日文样本，看切换质量与吞吐。

会议、车载、远场录音可直测，观察文本漂移与分段表现。

这是 Fun-ASR 的一个差异化点，页面专门保留了热词和原始结果对照区。