Spaces:

Lisibonny
/

buscador-periodicos-dominicanos

Running

Lisibonny commited on Jun 12

Commit

60b88b8

•

1 Parent(s): d7d0005

Update preprocesamiento_articulos.py

Files changed (1) hide show

preprocesamiento_articulos.py CHANGED Viewed

@@ -5,7 +5,7 @@ from nltk.tokenize import word_tokenize, RegexpTokenizer
 from nltk.corpus import stopwords
 from nltk.stem import SnowballStemmer
 import textacy
-import spacy
 from sklearn.feature_extraction.text import CountVectorizer
 import csv
@@ -102,5 +102,5 @@ def limpieza_articulos(df):
 def obtener_kpes(df):
     df_titulos=pd.DataFrame(df['titulo'], columns=['titulo'])
     all_text = ' '. join(df_titulos['titulo'])
-    titulos=textacy.make_spacy_doc(all_text, lang='es_core_web_sm')
     return textacy.extract.keyterms.textrank(titulos,topn=10)

 from nltk.corpus import stopwords
 from nltk.stem import SnowballStemmer
 import textacy
+import es_core_news_sm
 from sklearn.feature_extraction.text import CountVectorizer
 import csv
 def obtener_kpes(df):
     df_titulos=pd.DataFrame(df['titulo'], columns=['titulo'])
     all_text = ' '. join(df_titulos['titulo'])
+    titulos=textacy.make_spacy_doc(all_text, lang='es_core_news_sm')
     return textacy.extract.keyterms.textrank(titulos,topn=10)