Spaces:

Lisibonny
/

buscador-periodicos-dominicanos

Running

buscador-periodicos-dominicanos / carga_articulos.py

Update carga_articulos.py

b5a83e0 verified 5 months ago

No virus

808 Bytes

	import pandas as pd
	import streamlit as st
	from dateutil.parser import parse

	@st.cache_data
	def cargar_articulos():
	articulos = pd.read_csv('articulos.csv')
	#articulos=articulos.iloc[0:250,:] # Cargando solo 250
	# Eliminando la primera columna
	articulos.drop("Unnamed: 0", axis=1, inplace=True)
	# creando columna nueva ID
	articulos['ID']=articulos.index
	articulos.ID = pd.Series(["D"+str(ind) for ind in articulos.ID])
	fechas=articulos['fecha'].apply(lambda x: parse(x, fuzzy=True))
	fechas=fechas.astype(str)
	fechas=fechas.apply(lambda x: re.match('\d{4}-\d{2}-\d{2}',x).group())
	fecha_minima=fechas.min()
	fecha_maxima=fechas.max()
	# Retornando el dataframe con los articulos y algunos datos al respecto
	return articulos, fecha_minima, fecha_maxima