Spaces:

EnriqueVega1995
/

test01

Sleeping

App Files Files Community

EnriqueVega1995 commited on Mar 8

Commit

8fb43c2

•

1 Parent(s): 98d9696

test

Browse files

Files changed (2) hide show

app.py +42 -21
requirements.txt +4 -3

app.py CHANGED Viewed

@@ -1,29 +1,50 @@
-import gradio as gr
-from diffusers import DDPMPipeline
 import torch
-# Define la función para generar y mostrar la imagen de un gato
-def greet_and_generate(name):
-    # Saludo
-    greeting = "Hello " + name + "!!"
-    # Carga el modelo DDPM
-    ddpm = DDPMPipeline.from_pretrained("google/ddpm-cat-256", use_safetensors=True).to("cpu")
-    # Genera la imagen
-    with torch.no_grad():  # Desactiva el cálculo de gradientes para ahorrar memoria
-        image = ddpm(num_inference_steps=25).images[0]
-    # Convierte la imagen a un formato que Gradio puede mostrar (PIL.Image)
-    image = image.cpu().detach().convert("RGBA")
-    return greeting, image
-# Configura la interfaz de Gradio
-iface = gr.Interface(fn=greet_and_generate,
-                     inputs="text",
-                     outputs=["text", "image"],
-                     examples=[["John"], ["Jane"], ["Alex"]])
-# Lanza la interfaz de Gradio
-iface.launch()

 import torch
+import torchvision
+from torchvision import models, transforms
+import gradio as gr
+from PIL import Image
+# Cargar el modelo preentrenado
+model = models.detection.fasterrcnn_resnet50_fpn(pretrained=True)
+model.eval()
+# Función para realizar la detección de objetos
+def object_detection(image):
+    # Transformaciones necesarias para la imagen
+    transform = transforms.Compose([
+        transforms.ToTensor(),
+    ])
+    image = transform(image).unsqueeze(0)
+    preds = model(image)
+    # Procesar las predicciones
+    pred_classes = [torchvision.models.detection._utils.BoxCoder.get_class(i) for i in list(preds[0]['labels'].numpy())]  # Nombres de las clases detectadas
+    pred_boxes = [[(i[0], i[1]), (i[2], i[3])] for i in list(preds[0]['boxes'].detach().numpy())]  # Coordenadas de los cuadros de detección
+    pred_scores = list(preds[0]['scores'].detach().numpy())
+    # Filtrar las predicciones con una puntuación baja
+    pred_t = [pred_scores.index(x) for x in pred_scores if x > 0.5]  # Umbral de puntuación
+    if len(pred_t) != 0:
+        pred_t = pred_t[-1]
+        pred_boxes = pred_boxes[:pred_t+1]
+        pred_classes = pred_classes[:pred_t+1]
+        pred_scores = pred_scores[:pred_t+1]
+    else:
+        pred_boxes = []
+        pred_classes = []
+        pred_scores = []
+    return image, pred_boxes, pred_classes, pred_scores
+# Interfaz de Gradio
+gr_interface = gr.Interface(fn=object_detection,
+                            inputs=gr.inputs.Image(shape=(512, 512)),
+                            outputs=[gr.outputs.Image(type="pil"),
+                                     gr.outputs.Label(num_top_classes=3)],
+                            title="Detección de Objetos",
+                            description="Modelo de detección de objetos utilizando un Faster R-CNN ResNet50 preentrenado.")
+if __name__ == "__main__":
+    gr_interface.launch()

requirements.txt CHANGED Viewed

@@ -1,3 +1,4 @@
-diffusers==0.26.3
-gradio==4.20.1
-torchvision==0.17.1

+torch
+torchvision
+gradio
+Pillow