轻松实现网页语音识别的 JavaScript 库:vad-web
让你的网页项目拥有语音识别功能!
你想在网页中添加语音识别功能,例如:实时显示用户说话的状态、发送用户语音片段到服务器进行处理,或者根据用户的讲话情况触发动画效果? 今天就来介绍一个轻量级且易于使用的 JavaScript 库:vad-web,它能帮你实现这些功能!
vad-web 的优势
- 精准识别: vad-web 基于强大的 Silero VAD 模型,能够准确地识别用户语音。
- 简单易用: 仅需几行代码即可配置并使用,非常适合前端开发人员。
- 浏览器和 Node.js 支持: vad-web 可以运行在浏览器中,也可以在 Node.js 环境中使用。
如何快速上手?
- 将以下脚本标签添加到你的 HTML 页面中:
<script src="https://cdn.jsdelivr.net/npm/onnxruntime-web@1.14.0/dist/ort.js"></script>
<script src="https://cdn.jsdelivr.net/npm/@ricky0123/vad-web@0.0.7/dist/bundle.min.js"></script>
- 编写 JavaScript 代码来实例化 vad-web 和配置语音识别事件:
async function main() {
const myvad = await vad.MicVAD.new({
onSpeechStart: () => {
console.log("开始说话!") // 当用户开始说话时触发
},
onSpeechEnd: (audio) => {
// audio 包含用户的语音片段,可以进行处理或上传到服务器
}
})
myvad.start() // 启动语音识别
}
main()
- 原文作者:iamdev
- 原文链接:https://blog.iamdev.cn/post/2024/%E8%BD%BB%E6%9D%BE%E5%AE%9E%E7%8E%B0%E7%BD%91%E9%A1%B5%E8%AF%AD%E9%9F%B3%E8%AF%86%E5%88%AB%E7%9A%84_JavaScript_%E5%BA%93_vad_web___/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止转载 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。