bourdoiscatie commited on
Commit
234613a
1 Parent(s): 3bfad63

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +20 -2
app.py CHANGED
@@ -17,11 +17,11 @@ st.sidebar.image(image, caption=None, width=None, use_column_width=None, clamp=F
17
  @st.cache_resource
18
  def load_model(version,text):
19
  if version == "version base":
20
- ner = pipeline('token-classification', model='bourdoiscatie/camembert-base-frenchNER_3entities', tokenizer='bourdoiscatie/camembert-base-frenchNER_3entities', grouped_entities=True)
21
  result = ner(text)
22
  return result
23
  else:
24
- ner = pipeline('token-classification', model='bourdoiscatie/camembert-base-frenchNER_4entities', tokenizer='bourdoiscatie/camembert-base-frenchNER_4entities', aggregation_strategy="max")
25
  result = ner(text)
26
  return result
27
 
@@ -71,6 +71,24 @@ if option == "Exemple":
71
  text = st.text_area("Votre texte", value="Assurés de disputer l'Euro 2024 en Allemagne l'été prochain (du 14 juin au 14 juillet) depuis leur victoire aux Pays-Bas, les Bleus ont fait le nécessaire pour avoir des certitudes. Avec six victoires en six matchs officiels et un seul but encaissé, Didier Deschamps a consolidé les acquis de la dernière Coupe du monde. Les joueurs clés sont connus : Kylian Mbappé, Aurélien Tchouameni, Antoine Griezmann, Ibrahima Konaté ou encore Mike Maignan.",height=175)
72
  if text:
73
  to_print = load_model(version,text)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
74
  display = color_annotation(to_print,text)
75
  list_to_display = [] # pour pouvoir afficher la couleur, on doit passer les mots à colorier de str en tuple
76
  for i in range(len(display.split('","'))):
 
17
  @st.cache_resource
18
  def load_model(version,text):
19
  if version == "version base":
20
+ ner = pipeline('token-classification', model='bourdoiscatie/camembert-base-frenchNER_3entities', tokenizer='bourdoiscatie/camembert-base-frenchNER_3entities', aggregation_strategy="simple")
21
  result = ner(text)
22
  return result
23
  else:
24
+ ner = pipeline('token-classification', model='bourdoiscatie/camembert-base-frenchNER_4entities', tokenizer='bourdoiscatie/camembert-base-frenchNER_4entities', aggregation_strategy="simple")
25
  result = ner(text)
26
  return result
27
 
 
71
  text = st.text_area("Votre texte", value="Assurés de disputer l'Euro 2024 en Allemagne l'été prochain (du 14 juin au 14 juillet) depuis leur victoire aux Pays-Bas, les Bleus ont fait le nécessaire pour avoir des certitudes. Avec six victoires en six matchs officiels et un seul but encaissé, Didier Deschamps a consolidé les acquis de la dernière Coupe du monde. Les joueurs clés sont connus : Kylian Mbappé, Aurélien Tchouameni, Antoine Griezmann, Ibrahima Konaté ou encore Mike Maignan.",height=175)
72
  if text:
73
  to_print = load_model(version,text)
74
+
75
+ dict_to_del = []
76
+ for i in range(len(to_print)-1):
77
+ if to_print[i]["end"] == to_print[i+1]["start"]:
78
+ to_print[i+1]["word"] = to_print[i]["word"]+to_print[i+1]["word"]
79
+ to_print[i+1]["score"] = (to_print[i]["score"]+to_print[i+1]["score"])/2
80
+ to_print[i+1]["start"] = to_print[i]["start"]
81
+ dict_to_del.append(i)
82
+ to_print = [j for i, j in enumerate(to_print) if i not in dict_to_del]
83
+ dict_to_del = []
84
+ for i in range(len(to_print)-1):
85
+ if (to_print[i]["end"] == to_print[i+1]["start"]-1):
86
+ to_print[i+1]["word"] = to_print[i]["word"]+" "+to_print[i+1]["word"]
87
+ to_print[i+1]["score"] = (to_print[i]["score"]+to_print[i+1]["score"])/2
88
+ to_print[i+1]["start"] = to_print[i]["start"]
89
+ dict_to_del.append(i)
90
+ to_print = [j for i, j in enumerate(to_print) if i not in dict_to_del]
91
+
92
  display = color_annotation(to_print,text)
93
  list_to_display = [] # pour pouvoir afficher la couleur, on doit passer les mots à colorier de str en tuple
94
  for i in range(len(display.split('","'))):