ai_camera_audio_v1 backend

模型已加载: best.onnx + data.yaml
模型已就绪
监听地址
0.0.0.0:18523
公网基地址
http://124.222.37.93:18523
当前模型
best.onnx
当前标签文件
data.yaml
默认分类接口
http://124.222.37.93:18523/classify

上传模型

上传 best.onnxdata.yaml 后,网页和 ESP32 都会共用这套模型推理。

网页测试识别

这里适合先手动测模型是否正常,再让 ESP32 去调用 /classify

标签与音频

标签 音频文件
dog.wav
cat.wav
unknown unknown.wav

最近一次识别

来源
ESP32 /classify
标签
置信度
55.68%
音频链接
http://124.222.37.93:18523/audio/dog.wav
摘要
狗 置信度较高,我认为这是 狗。当前置信度为 55.68%
  • 狗 (55.68%)
  • 猫 (44.32%)

原图

original image

标注图

annotated image