轻松实现网页语音识别的 JavaScript 库：vad-web

2024年7月19日

| 阅读

让你的网页项目拥有语音识别功能！

你想在网页中添加语音识别功能，例如：实时显示用户说话的状态、发送用户语音片段到服务器进行处理，或者根据用户的讲话情况触发动画效果？今天就来介绍一个轻量级且易于使用的 JavaScript 库：vad-web，它能帮你实现这些功能！

vad-web 的优势

精准识别: vad-web 基于强大的 Silero VAD 模型，能够准确地识别用户语音。
简单易用: 仅需几行代码即可配置并使用，非常适合前端开发人员。
浏览器和 Node.js 支持: vad-web 可以运行在浏览器中，也可以在 Node.js 环境中使用。

如何快速上手？

将以下脚本标签添加到你的 HTML 页面中：

<script src="https://cdn.jsdelivr.net/npm/onnxruntime-web@1.14.0/dist/ort.js"></script> 
<script src="https://cdn.jsdelivr.net/npm/@ricky0123/vad-web@0.0.7/dist/bundle.min.js"></script>

编写 JavaScript 代码来实例化 vad-web 和配置语音识别事件：

async function main() {
    const myvad = await vad.MicVAD.new({
        onSpeechStart: () => {
            console.log("开始说话！") // 当用户开始说话时触发 
        },
        onSpeechEnd: (audio) => {
            // audio 包含用户的语音片段，可以进行处理或上传到服务器
        }
    })

    myvad.start() // 启动语音识别
}

main()

原文作者：iamdev
原文链接：https://blog.iamdev.cn/post/2024/%E8%BD%BB%E6%9D%BE%E5%AE%9E%E7%8E%B0%E7%BD%91%E9%A1%B5%E8%AF%AD%E9%9F%B3%E8%AF%86%E5%88%AB%E7%9A%84_JavaScript_%E5%BA%93_vad_web___/
版权声明：本作品采用知识共享署名-非商业性使用-禁止转载 4.0 国际许可协议进行许可，非商业转载请注明出处（作者，原文链接），商业转载请联系作者获得授权。

See Also