Fun-ASR Workbench

围绕多语言、噪声场景与批量吞吐设计的测试页

这个界面不是通用上传表单,而是按 FUN ASR 的能力去测。一次测试里可以覆盖语言切换、批量文件、热词、时间戳和 VAD 合并行为。

模型 FunAudioLLM/Fun-ASR-Nano-2512
设备 cuda:0
批量上限 8
vLLM 状态 未启用

测试面板

适合验证方言、口音、歌词、会议录音与多语言切换。

未录音

结果

返回原始结果字段,便于直接核对时间戳与模型行为。

等待上传音频。

URL 转录 API

适合直接传 R2 外链,不必先下载到本地。


          

多语言切换

用同一批请求放入中文、英文、日文样本,看切换质量与吞吐。

强噪声场景

会议、车载、远场录音可直测,观察文本漂移与分段表现。

歌词与 Rap

这是 Fun-ASR 的一个差异化点,页面专门保留了热词和原始结果对照区。