|
2 | 2 |
|
3 | 3 | Aggregatore degli strumenti per la generazione di un modello di machine learning per la lingua Italiana del progetto Common Voice. |
4 | 4 |
|
| 5 | +* [Script (bash/python) per la generazione usando Docker, DeepSpeech, Tensorflow e Nvidia del modello](https://github.com/MozillaItalia/DeepSpeech-Italian-Model/tree/master/DeepSpeech) |
| 6 | +* Il modello generato |
| 7 | +* [Script per generare il corpus testuale per la parte predittiva del modello](https://github.com/MozillaItalia/DeepSpeech-Italian-Model/tree/master/MITADS) |
| 8 | + |
5 | 9 | ## Regole |
6 | 10 |
|
7 | 11 | * Ticket e pull requests in inglese |
8 | 12 | * Readme in Italiano |
9 | 13 |
|
| 14 | +## Utilizzare il modello |
| 15 | + |
| 16 | +Scarica [l'ultima versione](https://github.com/MozillaItalia/DeepSpeech-Italian-Model/releases) da questa pagina. |
| 17 | +Puoi provare il modello con un [bot Telegram](https://t.me/DeepSpeechItalianBot) che compara il vocale con Google Speech. |
| 18 | + |
| 19 | +``` |
| 20 | +$ virtualenv test --python=python3 |
| 21 | +$ source test/bin/activate |
| 22 | +$ pip install deepspeech-tflite==0.7.0a1 |
| 23 | +$ deepspeech --model output_graph.tflite --audio test.wav --trie trie --lm lm.binary |
| 24 | +``` |
| 25 | + |
10 | 26 | ## Generare il modello |
11 | 27 |
|
12 | 28 | ``` |
@@ -34,9 +50,9 @@ $ docker run --env-file deepspeech.env --rm --gpus all --mount type=bind,src=/ho |
34 | 50 |
|
35 | 51 | ## Risorse |
36 | 52 |
|
37 | | -* https://github.com/mozilla/voice-corpus-tool |
38 | | -* https://github.com/Common-Voice/sentence-collector |
39 | | -* https://github.com/MozillaItalia/voice-web - Il dataset primario di frasi italiane lo manteniamo qui |
40 | 53 | * https://voice.mozilla.org/it |
41 | 54 | * https://github.com/mozilla/DeepSpeech |
| 55 | +* https://github.com/mozilla/voice-corpus-tool |
| 56 | +* https://github.com/Common-Voice/sentence-collector |
42 | 57 | * https://github.com/Common-Voice/commonvoice-fr - Il repository da cui questo è derivato |
| 58 | +* https://github.com/MozillaItalia/voice-web - Il dataset primario di frasi italiane lo manteniamo qui |
0 commit comments