基于 Whisper 的说话人识别流水线
基于 OpenAI Whisper 的说话人识别流水线:精准识别每句话的说话者 https://github.com/MahmoudAshraf97/whisper-diarization 什么是这个项目? 这个仓库将 Whisper 语音识别能力与语音活动检测 (VAD) 和说话人嵌入结合起来,从而识别出 Whisper 生成的每句话的说话者。 以下是它的工作原理: 提取语音: 首先,从音频中提取语音信号,以提高说话人嵌入的准确性。 生成文字: 然后使用 Whisper 生成文本转录……