Skip to content

hetima/dataset-ui-app

Repository files navigation

dataset-ui-app

音声ファイルを聴きながらフラグを付けていき、後からまとめて削除できるアプリです。Windows用です。

インストール

リリースページからダウンロードするかScoopで入れてください

#インストール
scoop bucket add hetima https://github.com/hetima/scoop-bucket
scoop install hetima/dataset-ui-app

#launch
dataset-ui-app

#アップデート
scoop update hetima/dataset-ui-app

使い方

再生したいフォルダをウィンドウにドラッグ・アンド・ドロップします。スペースバーで再生・停止します。上下キーで選択を変更すると自動で再生開始します。

ファイルには Good と Bad のフラグを付けることができます。「←」「G」「F」キーなどで Good フラグを付けます。「→」「B」キーで Bad フラグを付けます。
「←」「→」キーは設定で挙動を変更できます。両方試して使いやすい方を設定して、最初から慣れておくことをお勧めします。

サイドバーでフラグを付けたファイルをサブフォルダに移動させることができます。

Ctrl+Sを押したときやフォルダを閉じるときに、フラグの状態を mtdt.json というファイルに保存します。これはフォルダごとにひとつ作成されます。dataset-ui でも使われている独自のファイルです。

再生モードは3つあります「L」キーかボタンで切り替えます。

  • 通常再生:普通に再生します
  • 連続再生:再生が終わったら次のファイルを自動再生します
  • 一曲リピート:同じファイルをループ再生します

ファイル名.txtmtdt.json のtranscriptを読み込んで表示します。

OpenAI互換APIサーバで書き起こし

音声入力に対応したLLMサーバでtransctiptの書き起こしを行えます。Gemma 4が一応動きますが、dataset-uiに搭載されたcli/lfm_server.pyを使えばASR専用モデルLFM2.5-Audio-1.5B-JPを利用できるのでお勧めです。

歌詞をネット検索

歌詞を YouTube Music, Genius, LRCLIB で検索しで取得できます。YouTube がいちばんつよいと思います。LRCLIB では時間情報が付いた同期歌詞も取得できます。m4a のみダグに保存できます。m4a 含めそれ以外は mtdt.json に保存されます。

Screenshot

Screenshot

Screenshot

ライセンス

MIT

About

音声データを扱うWindowsアプリ

Resources

License

Stars

Watchers

Forks

Sponsor this project

Contributors