Skip to content

Latest commit

 

History

History
101 lines (75 loc) · 3.65 KB

File metadata and controls

101 lines (75 loc) · 3.65 KB

anco (azooKey CLI)

ancoコマンドにより、AzooKeyKanaKanjiConverterをコマンドライン上で利用することができます。ancoはデバッグ用ツールの位置付けです。

ancoを利用するには、最初にinstallが必要です。/usr/local/bin/ancoが追加されます。

sudo sh install_cli.sh

Zenzaiを利用する場合は、--zenzaiオプションを付けてください。

sudo sh install_cli.sh --zenzai

例えば以下のように利用できます。

your@pc Desktop % anco にほんごにゅうりょく --disable_prediction -n 10
日本語入力
にほんご入力
2本ご入力
2本後入力
2本語入力
日本語
2本
日本
にほんご
2本後

変換API

anco runコマンドを利用して変換を行うことが出来ます。runはデフォルトコマンドなので、ancoだけでもrun相当の動作をします。

評価API

anco evaluateコマンドを利用して変換器の評価を行うことが出来ます。

以下のようなフォーマットの.tsvファイルを用意します。

しかくとさんかく	四角と三角
かんたんなさんすう	簡単な算数
しけんにでないえいたんご	試験に出ない英単語
しごととごらくとべんきょう	仕事と娯楽と勉強
しかいをつとめる	司会を務める

これを入力し、変換器を評価します。

$ anco evaluate ./evaluation.tsv --config_n_best 1

出力はJSONフォーマットです。出力内容の安定が必要な場合--stableを指定することで比較的安定した出力を得られます。ただしスコアやエントロピーは辞書バージョンに依存します。

対話的実行

少しずつ入力を進めるような実用的な場面を模した環境としてanco sessionコマンドが用意されています。

$ anco session --roman2kana -n 10 --disable_prediction

== Type :q to end session, type :d to delete character, type :c to stop composition. For other commands, type :h ==

キーを入力してEnterを押すと変換候補が表示されます。:で始まる特殊コマンドを利用することで、削除、確定、文脈の設定などの諸操作を行うことが出来ます。

辞書リーダ

anco dictコマンドを利用して辞書データを解析することが出来ます。

your@pc Desktop % anco dict read ア -d ./Sources/KanaKanjiConverterModuleWithDefaultDictionary/azooKey_dictionary_storage/Dictionary/                       
=== Summary for target ア ===
- directory: ./Sources/KanaKanjiConverterModuleWithDefaultDictionary/azooKey_dictionary_storage/Dictionary/
- target: ア
- memory?: false
- count of entry: 24189
- time for execute: 0.0378040075302124

--rubyおよび--wordオプションを利用して、正規表現でフィルターをかけることが出来ます。

your@pc Desktop % anco dict read ア -d ./Sources/KanaKanjiConverterModuleWithDefaultDictionary/azooKey_dictionary_storage/Dictionary/ --word ".*全"
=== Summary for target ア ===
- directory: ./Sources/KanaKanjiConverterModuleWithDefaultDictionary/azooKey_dictionary_storage/Dictionary/
- target: ア
- memory?: false
- count of entry: 24189
- time for execute: 0.07062792778015137
=== Found Entries ===
- count of found entry: 3
Ruby: アキラ Word: 全 Value: -11.7107 CID: (1291, 1291) MID: 424
Ruby: アンゼン Word: 安全 Value: -7.241 CID: (1287, 1287) MID: 169
Ruby: アンシンアンゼン Word: 安心安全 Value: -11.7638 CID: (1283, 1287) MID: 17

--sortオプションを使うとエントリーの並び替えが可能です。