Update informacio.md
Browse files- informacio.md +3 -6
informacio.md
CHANGED
@@ -233,14 +233,11 @@ utilitzant score matching.
|
|
233 |
## Adaptació al català
|
234 |
|
235 |
El model original de Matcha-TTS excel·leix en anglès, però per adaptar-lo al català, hem dut a terme un procés multi-etapa.
|
236 |
-
En primer lloc, hem fet el _fine-tuning_ del model d'anglès al català central creant un Matxa-base, fent servir
|
|
|
237 |
|
238 |
-
* [La nostra versió del conjunt de dades openslr-slr69.](https://huggingface.co/datasets/projecte-aina/openslr-slr69-ca-trimmed-denoised)
|
239 |
-
|
240 |
-
* [La nostra versió del conjunt de dades Festcat.](https://huggingface.co/datasets/projecte-aina/festcat_trimmed_denoised)
|
241 |
-
|
242 |
A continuació, hem fet un altre _fine-tuning_ de Matxa-base amb el conjunt de dades LaFresCat per introduir les variants dialectals.
|
243 |
-
Aquest conjunt dades, que es publicarà aviat, té
|
244 |
|
245 |
* Balear
|
246 |
|
|
|
233 |
## Adaptació al català
|
234 |
|
235 |
El model original de Matcha-TTS excel·leix en anglès, però per adaptar-lo al català, hem dut a terme un procés multi-etapa.
|
236 |
+
En primer lloc, hem fet el _fine-tuning_ del model d'anglès al català central creant un Matxa-base, fent servir un subconjunt de 100h de la base de dades del català de [CommonVoice](https://commonvoice.mozilla.org/es/datasets) v.16.
|
237 |
+
La tria d'aquest petit conjunt de mostres s'ha realitzat de manera automàtica amb l'ajuda del sistema [UTMOS](https://arxiv.org/abs/2204.02152), un predictor de valors de la mètrica _Mean Opinion Score_ (MOS) que sol ser decidida per humans segons la qualitat de la parla.
|
238 |
|
|
|
|
|
|
|
|
|
239 |
A continuació, hem fet un altre _fine-tuning_ de Matxa-base amb el conjunt de dades LaFresCat per introduir les variants dialectals.
|
240 |
+
Aquest conjunt dades, que es publicarà aviat, té 3,5 hores d'enregistraments per a quatre variants dialectals:
|
241 |
|
242 |
* Balear
|
243 |
|