TL;DR para asegurar disponibilidad de los datos abiertos, necesitamos descentralizar su distribución.
En lugar de que miles de personas intenten bajar grandes conjuntos de datos de un servidor malconfigurado de gobierno, con BitTorrent los datos pueden ser distribuidos y compartidos en pequeños fragmentos y entre diferentes consumidores (y los mismos servidores originales).
La alta disponibilidad se asegura porque los datos tienen múltiples réplicas y la carga de la red se distribuye entre múltiples usuarios.
- Activar un par de seeders en servidores de gobierno y organizaciones con capacidad de cómputo para la banda (p. ej. INEGI, UNAM). Descargan el espejo y comienzan a ser seeders.
- Distribuye archivos .torrent para cada dataset en portales como datos.gob.mx, datamx.io.
- Cada vez que se utilicen clientes de BitTorrent para descargar datasets, la red obtendrá mayor capacidad de transferencia y replicabilidad.
Opcional
- Tener un espejo de todos los datasets en un servicio de alta disponibilidad como Amazon S3. Conveniente para activar seeders rápidamente.
- Instalar trackers en servidores externos a gobierno o utilizar uno ya disponible. El prototipo puede funcionar sin trackers (ver trackerless).
- dat-project - DAT Project
- OpenTracker - Wikipedia
- feross/bittorrent-tracker - github.com/feross
- maxogden/torrent - github.com/maxogden
- feross/webtorrent-desktop - github.com/feross
- BitTorrent - Wikipedia
- How DAT works - dat-data.readthedocs.io
- What are the practical limits of releasing open data via bit torrent? - StackExchange
- Recommended BitTorrent tracker/index for dataset release? - StackExchange
dat workflow
instalar
compartir
descargar
resultados