bourdoiscatie commited on
Commit
e5b04ea
1 Parent(s): 35eac48

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +14 -6
app.py CHANGED
@@ -5,8 +5,8 @@ from PIL import Image
5
  import re
6
 
7
  st.sidebar.header("**Instructions**")
8
- st.sidebar.markdown("Démonstrateur du modèle [Camembert-NER](CATIE-AQ/Camembert-NER-base-frenchNER) entraîné sur plus de 425 000 données en français. Le modèle est capable d'étiquetter les entités LOC (Localisation), PER (Personne), ORG (Organisation) dans le texte fourni. Il est disponible en version *base* (110M de paramètres) et *large* (335M de paramètres). Pour l'essayer, sélectionnez la version de votre choix ci-dessous, puis renseignez un texte. Enfin appuyez sur le bouton « Appliquer le modèle » pour observer la réponse trouvée par le modèle. Pour en savoir plus sur ce modèle, vous pouvez lire l'[article de blog](https://blog.vaniila.ai/NER/) détaillant la démarche suvie.")
9
- version = st.sidebar.radio("Choix de la version du modèle :", ["version 3 entités", "version 4 entités"])
10
  st.sidebar.markdown("---")
11
  st.sidebar.markdown("Ce modèle a été entraîné via la plateforme [*Vaniila*](https://www.vaniila.ai/) du [CATIE](https://www.catie.fr/).")
12
 
@@ -16,12 +16,20 @@ st.sidebar.image(image, caption=None, width=None, use_column_width=None, clamp=F
16
 
17
  @st.cache_resource
18
  def load_model(version,text):
19
- if version == "version base":
20
- ner = pipeline('token-classification', model='bourdoiscatie/camembert-base-frenchNER_3entities', tokenizer='bourdoiscatie/camembert-base-frenchNER_3entities', aggregation_strategy="simple")
 
 
 
 
 
 
 
 
21
  result = ner(text)
22
  return result
23
  else:
24
- ner = pipeline('token-classification', model='bourdoiscatie/camembert-base-frenchNER_4entities', tokenizer='bourdoiscatie/camembert-base-frenchNER_4entities', aggregation_strategy="simple")
25
  result = ner(text)
26
  return result
27
 
@@ -68,7 +76,7 @@ option = st.selectbox(
68
  ('Texte libre', 'Exemple'))
69
 
70
  if option == "Exemple":
71
- text = st.text_area("Votre texte", value="Assurés de disputer l'Euro 2024 en Allemagne l'été prochain (du 14 juin au 14 juillet) depuis leur victoire aux Pays-Bas, les Bleus ont fait le nécessaire pour avoir des certitudes. Avec six victoires en six matchs officiels et un seul but encaissé, Didier Deschamps a consolidé les acquis de la dernière Coupe du monde. Les joueurs clés sont connus : Kylian Mbappé, Aurélien Tchouameni, Antoine Griezmann, Ibrahima Konaté ou encore Mike Maignan.",height=175)
72
  if text:
73
  to_print = load_model(version,text)
74
  display = color_annotation(to_print,text)
 
5
  import re
6
 
7
  st.sidebar.header("**Instructions**")
8
+ st.sidebar.markdown("Démonstrateur des modèles [NERmembert](https://hf.co/collections/CATIE-AQ/french-ner-pack-658aefafe3f7a2dcf0e4dbb4) entraînés sur plus de 385 000 à 420 000 données en français en fonction de la configuration. Les modèles sont capables d'étiquetter les entités LOC (Localisations), PER (Personnalités), ORG (Organisations) et pour certains aussi MISC (Divers) dans le texte fourni. Ils sont disponibles en version *base* (110M de paramètres) et *large* (335M de paramètres). Pour les essayer, sélectionnez la version de votre choix ci-dessous, puis renseignez un texte. Enfin appuyez sur le bouton « Appliquer le modèle » pour observer la réponse trouvée par le modèle. Pour en savoir plus sur ce modèle, vous pouvez lire l'[article de blog](https://blog.vaniila.ai/NER/) détaillant la démarche suvie.")
9
+ version = st.sidebar.radio("Choix de la version du modèle :", ["version 3 entités base", "version 3 entités large", "version 4 entités base", "version 4 entités large"])
10
  st.sidebar.markdown("---")
11
  st.sidebar.markdown("Ce modèle a été entraîné via la plateforme [*Vaniila*](https://www.vaniila.ai/) du [CATIE](https://www.catie.fr/).")
12
 
 
16
 
17
  @st.cache_resource
18
  def load_model(version,text):
19
+ if version == "version 3 entités base":
20
+ ner = pipeline('token-classification', model='CATIE-AQ/NERmembert-base-3entities', tokenizer='CATIE-AQ/NERmembert-base-3entities', aggregation_strategy="simple")
21
+ result = ner(text)
22
+ return result
23
+ if version == "version 3 entités large":
24
+ ner = pipeline('token-classification', model='CATIE-AQ/NERmembert-large-3entities', tokenizer='CATIE-AQ/NERmembert-large-3entities', aggregation_strategy="simple")
25
+ result = ner(text)
26
+ return result
27
+ if version == "version 4 entités base":
28
+ ner = pipeline('token-classification', model='CATIE-AQ/NERmembert-base-4entities', tokenizer='CATIE-AQ/NERmembert-base-4entities', aggregation_strategy="simple")
29
  result = ner(text)
30
  return result
31
  else:
32
+ ner = pipeline('token-classification', model='CATIE-AQ/NERmembert-large-4entities', tokenizer='CATIE-AQ/NERmembert-large-4entities', aggregation_strategy="simple")
33
  result = ner(text)
34
  return result
35
 
 
76
  ('Texte libre', 'Exemple'))
77
 
78
  if option == "Exemple":
79
+ text = st.text_area("Votre texte", value="Le dévoilement du logo officiel des Jeux s'est déroulé le 21 octobre 2019 au Grand Rex. Ce nouvel emblème et cette nouvelle typographie ont été conçus par le designer Sylvain Boyer avec les agences Royalties & Ecobranding. Rond, il rassemble trois symboles : une médaille d'or, la flamme olympique et Marianne, symbolisée par un visage de femme mais privée de son bonnet phrygien caractéristique. La typographie dessinée fait référence à l'Art déco, mouvement artistique des années 1920, décennie pendant laquelle ont eu lieu pour la dernière fois les Jeux olympiques à Paris, en 1924. Pour la première fois, ce logo sera unique pour les Jeux olympiques et les Jeux paralympiques.",height=175)
80
  if text:
81
  to_print = load_model(version,text)
82
  display = color_annotation(to_print,text)