





Descarga ESC-50 para audio ambiental y una variante ligera de COCO o Imagenette para imágenes. Prepara espectrogramas mel y recortes centrados. Entrena un backbone auto-supervisado, añade una cabeza ligera y fusiona embeddings con atención cruzada. Evalúa con mAP, F1, STOI y SSIM. Publica resultados, errores curiosos y hallazgos; la comunidad puede sugerir mejoras, como normalizaciones distintas, mezclas de datos y pruebas en condiciones adversas.
Descarga ESC-50 para audio ambiental y una variante ligera de COCO o Imagenette para imágenes. Prepara espectrogramas mel y recortes centrados. Entrena un backbone auto-supervisado, añade una cabeza ligera y fusiona embeddings con atención cruzada. Evalúa con mAP, F1, STOI y SSIM. Publica resultados, errores curiosos y hallazgos; la comunidad puede sugerir mejoras, como normalizaciones distintas, mezclas de datos y pruebas en condiciones adversas.
Descarga ESC-50 para audio ambiental y una variante ligera de COCO o Imagenette para imágenes. Prepara espectrogramas mel y recortes centrados. Entrena un backbone auto-supervisado, añade una cabeza ligera y fusiona embeddings con atención cruzada. Evalúa con mAP, F1, STOI y SSIM. Publica resultados, errores curiosos y hallazgos; la comunidad puede sugerir mejoras, como normalizaciones distintas, mezclas de datos y pruebas en condiciones adversas.
All Rights Reserved.