Skip to content

SoshunNaito/voice-activity-detection

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

voice-activity-detection

実装の大半は↓を参考にさせていただきました

やってること

  • マイクから音声を拾ってきて時間データとして描画する
  • スペクトル分布(エネルギーの対数っぽい?)を取ってきて描画する
  • スペクトル分布から計算した「声っぽさ」のスコアを描画する
    • [0, 2000Hz]のデータの和 - [4000Hz, 6000Hz]のデータの和 とかいう雑パラメータです
    • 物音や白色雑音はいい感じに除去できる気がします
  • 大津の閾値を使って、スコアを「声あり」「声なし」に分ける閾値をオレンジ色で描画する
    • 上下のピーク時にサンプル点を追加して、クラスタリングを行わせてます(発話区間と無音区間が1:1に近いと性能が上がるかも)
    • データ点の数が膨大になるので、近くの2点をマージしてメモリを削減してます

About

音声区間検出と呼ばれるみたいです

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published