## チケットのゴール * 現在は抽出データに対して音声認識を適用し、文字誤り率`CER<=0.33`を満たす発話のみで学習を行っている。 * 抽出データの合計時間数は最初のリリース時点で49121時間。 * うち、`CER<=0.33`を満たす発話は19039時間(38.7%) * 詳細な分布は以下のヒストグラムを参照。 * 一定の基準で足切りするのではなく、CERをタグとして学習データに組み込む。 * CERの高い(ノイズの大きい)データも学習に取り込めるようになる。 * 従来の方式に比べて頑健なモデルが得られる可能性がある。 * この方式を検証し、精度・ロバストネスが改善するか確認する。 ### 参考: 抽出データのCER分布(49121時間) 
チケットのゴール
CER<=0.33を満たす発話のみで学習を行っている。CER<=0.33を満たす発話は19039時間(38.7%)参考: 抽出データのCER分布(49121時間)