Baybars commited on
Commit
42c2a9e
1 Parent(s): 99aabf2

catalan corrections

Browse files
Files changed (2) hide show
  1. about.md +1 -1
  2. informacio.md +9 -9
about.md CHANGED
@@ -1,5 +1,5 @@
1
  ## 📄 About
2
- Natural and efficient TTS in Catalan: 🍵+🥑 .
3
 
4
  Here you can find all the information regarding our models 🍵 Matxa and 🥑 alVoCat, which have been trained with the use of deep learning. If you want specific information on how to train these model you can find it [here](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) and [here](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectively. The code we've used is also on Github [here](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
5
 
 
1
  ## 📄 About
2
+ Natural and efficient TTS in Catalan: 🍵+🥑
3
 
4
  Here you can find all the information regarding our models 🍵 Matxa and 🥑 alVoCat, which have been trained with the use of deep learning. If you want specific information on how to train these model you can find it [here](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) and [here](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectively. The code we've used is also on Github [here](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
5
 
informacio.md CHANGED
@@ -1,7 +1,7 @@
1
- ## 📄 Sobre
2
- TTS natural i eficient en català: utilitzant Matcha-TTS amb la llengua catalana.
3
 
4
- Aquí trobaràs tota la informació sobre els nostres models 🍵 Matxa i 🥑 alVoCat ,els quals han estat entrenats amb l'ús de l'aprenentatge profund. Si desitges informació específica sobre com entrenar aquests models, pots trobar-la [aquí](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) i [aquí](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectivament. El codi que hem utilitzat també es troba a Github [aquí](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
5
 
6
  ## Taula de continguts
7
  <details>
@@ -218,17 +218,17 @@ Això produeix un decodificador basat en ODE capaç de generar una alta qualitat
218
 
219
  ## Adaptació al català
220
 
221
- El model original de Matcha-TTS excel·leix en anglès, però per portar les seves capacitats al català, es va dur a terme un procés multi-etapa. En primer lloc, vam ajustar el model d'anglès a català central, el que va establir les bases per entendre els matisos del llenguatge. Aquest primer ajust es va fer utilitzant dos conjunts de dades:
222
 
223
  * [La nostra versió del conjunt de dades openslr-slr69.](https://huggingface.co/datasets/projecte-aina/openslr-slr69-ca-trimmed-denoised)
224
-
225
- * Un conjunt de dades en català central, enregistrades en estudi i que aviat es publicaran.
226
-
227
  * [La nostra versió del conjunt de dades Festcat.](https://huggingface.co/datasets/projecte-aina/festcat_trimmed_denoised)
228
 
229
- Aquest conjunt de dades que aviat es publicarà també incloïa gravacions de tres dialectes diferents:
230
-
231
  * Balear
 
 
232
 
233
  * Nord-Occidental
234
 
 
1
+ ## 📄 Informació
2
+ TTS natural i eficient en català: 🍵+🥑
3
 
4
+ Aquí trobareu tota la informació sobre els nostres models 🍵 Matxa i 🥑 alVoCat ,els quals han estat entrenats amb l'ús de l'aprenentatge profund. Si desitges informació específica sobre com entrenar aquests models, pots trobar-la [aquí](https://huggingface.co/BSC-LT/matcha-tts-cat-multiaccent) i [aquí](https://huggingface.co/BSC-LT/vocos-mel-22khz-cat) respectivament. El codi que hem utilitzat també es troba a Github [aquí](https://github.com/langtech-bsc/Matcha-TTS/tree/dev-cat).
5
 
6
  ## Taula de continguts
7
  <details>
 
218
 
219
  ## Adaptació al català
220
 
221
+ El model original de Matcha-TTS excel·leix en anglès, però per portar les seves capacitats al català, es va dur a terme un procés multi-etapa. En primer lloc, vam fer el fine-tuning del model d'anglès al català central creant un Matxa-base, fent servir dos conjunts de dades:
222
 
223
  * [La nostra versió del conjunt de dades openslr-slr69.](https://huggingface.co/datasets/projecte-aina/openslr-slr69-ca-trimmed-denoised)
224
+
 
 
225
  * [La nostra versió del conjunt de dades Festcat.](https://huggingface.co/datasets/projecte-aina/festcat_trimmed_denoised)
226
 
227
+ A continuació, vam fer un altre fine-tuning de Matxa-base amb el conjunt de dades LaFrescat per introduir les variants dialectals. Aquest conjunt dades es publicarà aviat, 8,5 hores d'enregistraments per a quatre variants dialectals:
228
+
229
  * Balear
230
+
231
+ * Central
232
 
233
  * Nord-Occidental
234