让你的网页项目拥有语音识别功能!

你想在网页中添加语音识别功能,例如:实时显示用户说话的状态、发送用户语音片段到服务器进行处理,或者根据用户的讲话情况触发动画效果? 今天就来介绍一个轻量级且易于使用的 JavaScript 库:vad-web,它能帮你实现这些功能!

vad-web 的优势

  • 精准识别: vad-web 基于强大的 Silero VAD 模型,能够准确地识别用户语音。
  • 简单易用: 仅需几行代码即可配置并使用,非常适合前端开发人员。
  • 浏览器和 Node.js 支持: vad-web 可以运行在浏览器中,也可以在 Node.js 环境中使用。

如何快速上手?

  1. 将以下脚本标签添加到你的 HTML 页面中:
<script src="https://cdn.jsdelivr.net/npm/onnxruntime-web@1.14.0/dist/ort.js"></script> 
<script src="https://cdn.jsdelivr.net/npm/@ricky0123/vad-web@0.0.7/dist/bundle.min.js"></script>
  1. 编写 JavaScript 代码来实例化 vad-web 和配置语音识别事件:
async function main() {
    const myvad = await vad.MicVAD.new({
        onSpeechStart: () => {
            console.log("开始说话!") // 当用户开始说话时触发 
        },
        onSpeechEnd: (audio) => {
            // audio 包含用户的语音片段,可以进行处理或上传到服务器
        }
    })

    myvad.start() // 启动语音识别
}

main()