buscador-periodicos-dominicanos / carga_articulos.py
Lisibonny's picture
Update carga_articulos.py
b5a83e0 verified
raw
history blame
No virus
808 Bytes
import pandas as pd
import streamlit as st
from dateutil.parser import parse
@st.cache_data
def cargar_articulos():
articulos = pd.read_csv('articulos.csv')
#articulos=articulos.iloc[0:250,:] # Cargando solo 250
# Eliminando la primera columna
articulos.drop("Unnamed: 0", axis=1, inplace=True)
# creando columna nueva ID
articulos['ID']=articulos.index
articulos.ID = pd.Series(["D"+str(ind) for ind in articulos.ID])
fechas=articulos['fecha'].apply(lambda x: parse(x, fuzzy=True))
fechas=fechas.astype(str)
fechas=fechas.apply(lambda x: re.match('\d{4}-\d{2}-\d{2}',x).group())
fecha_minima=fechas.min()
fecha_maxima=fechas.max()
# Retornando el dataframe con los articulos y algunos datos al respecto
return articulos, fecha_minima, fecha_maxima