Guía para proveedores de datos

Hackatón BAM BUAP

📂 Elección de conjuntos de datos visuales, sonoros y de vídeo

El éxito de un Hackathon cultural depende de la puesta a disposición de datos adecuados. Para ello, es necesario que identifique, entre sus colecciones, conjuntos de datos para los que posea los derechos de uso o, en su caso, para los que puedan obtenerse los derechos necesarios.

💡 No limite de antemano los conjuntos de datos, sino compruebe internamente cuánto tiempo puede y quiere dedicar al Hackatón. Procure dialogar con los usuarios potenciales para poner de relieve qué conjuntos de datos parecen especialmente interesantes desde el punto de vista de los usuarios.

En principio, los siguientes conjuntos de datos son de interés para el Hackatón BAM BUAP:

  •  🏷️ metadatos de objetos patrimoniales;
  •  🖼️ imágenes digitales, vídeos, grabaciones de sonido / reproducciones digitales de objetos patrimoniales;
  •  📜 textos transcritos de documentos historicos;
  •  📖 léxicos / vocabularios controlados;
  •  🏛️ ficheros de autoridad;
  •  📈 datos de la economía cultural o creativa: por ejemplo, datos relativos a eventos culturales (representaciones teatrales y de otro tipo), estadísticas que arrojan luz sobre el uso de los bienes culturales, etc.;
  •  🦖 datos sobre colecciones de historia natural.

📌 Considere que, desde el punto de vista del usuario, los metadatos suelen ser tan importantes como los propios objetos (imágenes, vídeos, textos, etc.). Lo ideal es que los metadatos estén disponibles con el material correspondiente, ya sea visual, de audio o de vídeo (sobre todo si no hay restricciones de derechos de autor).

⚖️ Cesión de derechos / elección de licencia

Compruebe quién posee los derechos de uso de los datos que ha seleccionado y elija una licencia adecuada para su publicación. Estaremos encantados de ayudarle con sus argumentos o si tiene alguna duda sobre las licencias.

✅ Licencias recomendadas:

 🔓 ● Creative Commons – Etiqueta de Dominio Público

La marca «Dominio público» se recomienda para todas las obras cuyos derechos de autor hayan expirado.

 🆓 ● Creative Commons – Transferencia al Dominio Público – «Sin derechos autorales»

Con esta licencia la persona renuncia – dentro de los límites de la legislación vigente – a todos sus derechos de autor sobre una obra. Se recomienda el uso de esta licencia, por ejemplo, al publicar metadatos, para informar a los usuarios de que no se reclamarán derechos de autor sobre estos metadatos.

 ✍️ ● Creative Commons – Atribución/Reconocimiento

Esta licencia autoriza todos los usos de una obra, siempre que se mencione al autor. Cuando se utilice esta licencia, debe mencionarse el autor o la institución. Si utiliza esta licencia, especifique el título preciso bajo el cual debe citarse al autor o a la institución. Asimismo, para poder utilizar esta licencia, las obras en cuestión deben estar protegidas por derechos de autor y la institución debe poseer los derechos de utilización de las mismas.


🔄 También se acepta:

 ♻️ ● Creative Commons – Atribución/Reconocimiento, Compartir Igual

Esta licencia obliga a los usuarios de una obra a publicar sus futuras obras basadas en la obra con una licencia idéntica a la de la obra que han utilizado. Para poder utilizar esta licencia, las obras en cuestión deben estar protegidas por derechos de autor y la institución debe poseer los derechos de uso.


⚠️ Por favor, no restrinja el uso comercial de los datos

Por regla general, las licencias que excluyen todo uso con fines comerciales son problemáticas porque también excluyen escenarios legítimos de reutilización: como la mayoría de los reportajes periodísticos o la integración en Wikipedia.

💻 Elección del formato y puesta a disposición

Para poder ser utilizados en el marco del Hackatón BAM BUAP, los datos, en particular los metadatos vinculados a los objetos patrimoniales, deben ser legibles por máquina. Los formatos conocidos por su facilidad de lectura son JSON (JavaScript Object Notation) y CSV (Comma Separated Values). La migración de datos a estos formatos mediante Excel o una función de exportación de bases de datos no suele plantear problemas. No debería tener problemas si su organización dispone de un contacto dedicado a cuestiones técnicas. Por supuesto, puede ponerse en contacto con nosotros si tiene preguntas específicas. Si es necesario, podemos ayudarle a hacer que sus datos sean legibles por máquina.

Además de los formatos mencionados, en determinados casos también pueden ser adecuados para los datos los siguientes formatos: GeoJSON, KMZ, XML, RDF o Shapefile. La comunidad de desarrolladores aprecia que los datos se pongan a disposición a través de servicios web como RESTful API, Web Feature Service (WFS) o Web Map Service (WMS).

Los datos de imagen deben ser de al menos 300 ppp y facilitarse en uno de los formatos abiertos habituales, como PNG, JPEG, SVG (y no como GIF, PDF o documento Word). A menudo es una buena idea proporcionar directamente archivos TIFF de alta resolución (por ejemplo, para subirlos a Wikimedia Commons o si sólo se espera utilizar ciertas partes de la imagen, o si desea permitir que ciertas imágenes sean retocadas – en todos estos casos, es útil disponer de datos de imagen de la mejor calidad posible).

Para los datos de audio o vídeo, son adecuados los siguientes formatos: Ogg (vinculado a los códecs FLAC, Speex, Opus o Vorbis), FLAC, WAVE y WebM.
⚙️ Es importante garantizar que los datos sean coherentes y puedan procesarse automáticamente.

Por ejemplo, los ordenadores y desarrolladores prefieren años en forma de fechas en lugar de prosa como «en tiempos de los olmecas”.

La notación unificada de nombres ayuda en el tratamiento de los datos. Para los datos tabulados, recomendamos seguir la estructura descrita en el artículo Tidy data.

Los datos se presentarán antes del evento en el sitio web del Hackatón y estarán disponibles para su descarga. Esto dará a los participantes la oportunidad de considerar su potencial y puede que ya estén pensando en explorar una u otra vía.

Pueden poner a disposición sus datos primarios o audiovisuales a través del sitio web de su institución o de un servicio externo. Wikimedia Commons y Flickr son especialmente adecuados para difundir datos audiovisuales. Póngase en contacto con nosotros si tiene alguna pregunta sobre cualquiera de estos servicios externos.

🌍 Durabilidad y sostenibilidad

A medio plazo, sería deseable que los datos y el material audiovisual se encontraran y siguieran siendo accesibles a terceros después del Hackatón. Por lo tanto, recomendamos que los datos primarios estén disponibles a través de un portal de datos abiertos oficial, como la Plataforma Nacional de Datos Abiertos, el Portal de Datos Abiertos del Estado de Puebla, o DataMéxico, así como que los datos audiovisuales (incluidos los metadatos) estén disponibles en Wikimedia Commons. Tenga en cuenta que la publicación de sus datos en estas plataformas requiere cierto tiempo de preparación.

📞 Contactos

Su contacto para cuestiones relacionadas con el suministro de datos:

beat.estermann@estermann-digi.ch

🌐 Páginas web