Un avance en el aprendizaje automático utiliza imágenes de satélite para mejorar vidas

¡Compártelo!

Publicado originalmente por UC Berkeley, Berkeley News.
Edward Lempinen

Más de 700 satélites de imágenes orbitan la Tierra y todos los días transmiten vastos océanos de información, incluidos datos que reflejan el cambio climático, la salud y la pobreza, a bases de datos en el terreno. Solo hay un problema: si bien los datos geoespaciales podrían ayudar a los investigadores y legisladores a abordar desafíos críticos, solo aquellos con una riqueza y experiencia considerables pueden acceder a ellos.

Ahora, un equipo con sede en UC Berkeley ha diseñado un sistema de aprendizaje automático para aprovechar el potencial de resolución de problemas de las imágenes satelitales, utilizando tecnología de bajo costo y fácil de usar que podría brindar acceso y poder analítico a investigadores y gobiernos de todo el mundo. El estudio, “Un enfoque generalizable y accesible para el aprendizaje automático con imágenes satelitales globales, ”Fue publicado hoy (martes 20 de julio) en la revista Comunicaciones de la naturaleza.

Solomon Hsiang (foto de UC Berkeley)

“Estamos entrando en un régimen en el que nuestras acciones están teniendo un impacto verdaderamente global”, dijo el coautor. Salomón Hsiang, director de la Laboratorio de políticas globales en la Escuela de Políticas Públicas Goldman. “Las cosas se están moviendo más rápido de lo que nunca se movieron en el pasado. Estamos cambiando las asignaciones de recursos más rápido que nunca. Estamos transformando el planeta. Eso requiere un sistema de gestión más receptivo que sea capaz de ver que suceden estas cosas, de modo que podamos responder de manera oportuna y eficaz “.

Esther Rolf (Foto de Andrea Bajcsy)

“Las imágenes de satélite contienen una cantidad increíble de datos sobre el mundo, pero el truco es cómo traducir los datos en información útil sin tener que peinar cada imagen”, dijo el coautor. Esther Rolf, un doctorado de último año. estudiante de informática. “Diseñamos nuestro sistema para la accesibilidad, de modo que una persona pueda ejecutarlo en una computadora portátil, sin capacitación especializada, para abordar sus problemas locales”.

Todos estaban en Berkeley cuando comenzó el proyecto. Su colaboración ha sido notable por reunir disciplinas que a menudo miran el mundo de diferentes maneras y hablan diferentes idiomas: informática, ciencias ambientales y climáticas, estadísticas, economía y políticas públicas. El proyecto fue una colaboración entre el Laboratorio de políticas globales, que dirige Hsiang, y De Benjamin Recht equipo de investigación del departamento de Ingeniería Eléctrica e Informática. Otros coautores son Berkeley Ph.D. graduados Tamma Carleton, ahora en la Universidad de California, Santa Bárbara; Jonathan Proctor, ahora en el Centro para el Medio Ambiente y la Iniciativa de Ciencia de Datos de Harvard; Ian Bolliger, ahora en el Rhodium Group; y Vaishaal Shankar, ahora en Amazon; y Berkeley Ph.D. estudiante Miyabi Ishihara.

Pero se han guiado por un interés común en crear una herramienta de acceso abierto que democratice el poder de la tecnología, haciéndola utilizable incluso por comunidades y países que carecen de recursos y habilidades técnicas avanzadas. “Es como el Modelo T de Ford, pero con aprendizaje automático y satélites”, dijo Hsiang. “Es lo suficientemente barato como para que ahora todos puedan acceder a esta nueva tecnología”.

MOSAIKS: Mejorando vidas, protegiendo el planeta

El sistema que surgió de la investigación basada en Berkeley se llama MOSAIKS, abreviatura de Observación multitarea usando imágenes de satélite y fregaderos de cocina. En última instancia, podría tener el poder de analizar cientos de variables extraídas de datos satelitales, desde las condiciones del suelo y el agua hasta la vivienda, la salud y la pobreza, a escala mundial.

En el estado indio de Andhra Pradesh, una imagen de satélite muestra cientos de estanques de acuicultura verdes donde los agricultores locales cultivan peces y camarones. Las imágenes geoespaciales tienen un enorme potencial para que las naciones en desarrollo aborden los desafíos relacionados con la agricultura, la pobreza, la salud y la migración humana, dicen los académicos de UC Berkeley. Pero hasta ahora, la tecnología y la experiencia necesarias para acceder y analizar de manera eficiente los datos satelitales generalmente se han limitado a los países desarrollados. (Imágenes del Observatorio de la Tierra de la NASA de Joshua Stevens, utilizando datos de Landsat del Servicio Geológico de EE. UU.)

El documento de investigación detalla cómo MOSAIKS pudo replicar con una precisión razonable los informes preparados a un gran costo por la Oficina del Censo de EE. UU. También tiene un enorme potencial para abordar los desafíos del desarrollo en los países de bajos ingresos y para ayudar a los científicos y los responsables de la formulación de políticas a comprender el cambio ambiental general.

“El cambio climático es difuso y difícil de ver en cualquier lugar, pero cuando retrocedes y miras a gran escala, realmente ves lo que está sucediendo alrededor del planeta”, dijo Hsiang, quien también se desempeña como codirector de la multi-institución Laboratorio de impacto climático.

Por ejemplo, dijo, los datos satelitales podrían brindar a los investigadores nuevos conocimientos profundos sobre áreas extensas de pastizales como las Grandes Llanuras en los EE. UU. Y el Sahel en África, o en áreas como Groenlandia o la Antártida que pueden estar desprendiendo icebergs a medida que aumentan las temperaturas.

“Estas áreas son tan grandes, y tener gente sentada allí mirando fotografías y contando icebergs es realmente ineficiente”, explicó Hsiang. Pero con MOSAIKS, dijo, “podría automatizar eso y rastrear si estos glaciares en realidad se están desintegrando más rápido, o si esto ha estado sucediendo todo el tiempo”.

Para un gobierno en el mundo en desarrollo, la tecnología podría ayudar a guiar incluso las decisiones de rutina, como dónde construir carreteras.

“Un gobierno quiere construir carreteras donde esté la mayoría de la gente y la mayor actividad económica”, dijo Hsiang. “Es posible que desee saber qué comunidad está desatendida o el estado de la infraestructura existente en una comunidad. Pero a menudo es muy difícil obtener esa información “.

El desafío: organizar billones de bytes de datos satelitales sin procesar

La creciente flota de satélites de imágenes envía datos a la Tierra las 24 horas del día, los 7 días de la semana: unos 80 terabytes al día, según la investigación, un número que seguramente crecerá en los próximos años.

Pero a menudo, los satélites de imágenes se construyen para capturar información sobre temas limitados: el suministro de agua dulce, por ejemplo, o el estado de los suelos agrícolas. Y los datos no llegan como imágenes nítidas y ordenadas, como instantáneas de una tienda de fotografía. Son datos en bruto, una masa de información binaria. Los investigadores que acceden a los datos deben saber lo que buscan.

El simple hecho de almacenar tantos terabytes de datos requiere una gran inversión. Destilar las capas de datos incrustadas en las imágenes requiere un poder de cómputo adicional y experiencia humana avanzada para desentrañar hebras de información que sean coherentes y útiles para otros investigadores, legisladores o agencias de financiamiento.

Inevitablemente, la explotación de imágenes satelitales se limita en gran medida a académicos o agencias en países ricos, dijeron Rolf y Hsiang.

“Si eres un profesor de élite, puedes conseguir que alguien te construya tu satélite”, dijo Hsiang. “Pero no hay forma de que una agencia de conservación en Kenia pueda acceder a la tecnología y los expertos para hacer este trabajo.

“Queríamos encontrar una forma de empoderarlos. Decidimos crear una navaja suiza, una herramienta práctica a la que todos pueden acceder “.

Como Google para imágenes de satélite, una especie de

Especialmente en los países de bajos ingresos, una dimensión de la pobreza es la pobreza de datos. Pero incluso las comunidades en los EE. UU. Y otros países desarrollados generalmente no tienen acceso inmediato a los datos geoespaciales en un formato conveniente y utilizable para abordar los desafíos locales.

El aprendizaje automático abre la puerta a las soluciones.

Las ilustraciones muestran cómo el sistema de aprendizaje automático MOSAIKS desarrollado en UC Berkeley predice, con gran detalle, la cubierta forestal (arriba, en verde) y la población (abajo). (Imagen cortesía de Esther Rolf, Jonathan Proctor, Tamma Carleton, Ian Bolliger, Miyabi Ishihara, Vaishaal Shankar, Benjamin Recht y Solomon Hsiang)

En un sentido general, el aprendizaje automático se refiere a sistemas informáticos que utilizan algoritmos y modelos estadísticos para aprender por sí mismos, sin la intervención humana paso a paso. Lo que describe la nueva investigación es un sistema que puede reunir datos entregados por muchos satélites y organizarlos de manera que sean accesibles y útiles.

Existen precedentes de tales sistemas: Motor de Google Earth y Computadora planetaria de Microsoft son plataformas para acceder y analizar datos geoespaciales globales, con un enfoque en la conservación. Pero, dijo Rolf, incluso con estas tecnologías, a menudo se requiere una experiencia considerable para convertir los datos en nuevos conocimientos.

El objetivo de MOSAIKS no es desarrollar sistemas de aprendizaje automático más complejos, dijo Rolf. Más bien, su innovación consiste en hacer que los datos satelitales sean ampliamente utilizables para abordar los desafíos globales. El equipo hizo esto haciendo que los algoritmos fueran radicalmente más simples y eficientes.

MOSAIKS comienza aprendiendo a reconocer patrones minúsculos en las imágenes: Hsiang lo compara con un juego de Scrabble, en el que el algoritmo aprende a reconocer cada letra. En este caso, sin embargo, los mosaicos son piezas minúsculas de imagen de satélite, 3 píxeles por 3 píxeles.

Pero MOSAIKS no concluye “esto es un árbol” o “esto es pavimento”. En cambio, reconoce patrones y los agrupa, dijo Proctor. Aprende a reconocer patrones similares en diferentes partes del mundo.

Cuando se analizan y organizan miles de terabytes de cientos de fuentes, los investigadores pueden elegir una aldea, un país o una región y extraer datos organizados que pueden tocar temas tan variados como la humedad del suelo, las condiciones de salud, la migración humana y los valores de las casas.

En cierto sentido, dijo Hsiang, MOSAIKS podría hacer por las bases de datos satelitales lo que Google en los primeros días hizo por Internet: mapear los datos, hacerlos accesibles y fáciles de usar a bajo costo, y tal vez hacer que se puedan buscar. Pero Rolf, un estudioso del aprendizaje automático con sede en Berkeley Ingeniería Eléctrica y Ciencias de la Computación departamento, dijo que la comparación de Google sólo llega hasta cierto punto.

MOSAIKS “se trata de traducir una cantidad difícil de manejar en información utilizable”, explicó. “Quizás una mejor analogía sería que el sistema toma información muy densa, digamos, un artículo muy grande, y produce un resumen”.

Creando un atlas viviente de datos globales

Tanto Hsiang como Rolf ven el potencial de MOSAIKS para evolucionar en direcciones poderosas y elegantes.

Hsiang imagina que los datos se recopilan en atlas informáticos que evolucionan continuamente. Vaya a cualquier “página” y un usuario podría acceder a datos amplios y profundos sobre las condiciones en un país o una región.

Rolf imagina un sistema que puede tomar el flujo de datos de la flota de satélites de imágenes y sensores remotos de la humanidad y transformarlo en un retrato fluido y en tiempo real de la Tierra y sus habitantes, continuamente en un estado de cambio. Podríamos ver el pasado y el presente, y así discernir los desafíos emergentes y abordarlos.

“Hemos enviado muchas cosas al espacio”, dice Hsiang. “Es un logro asombroso. Pero podemos sacar mucho más provecho de nuestra inversión con todos estos datos que ya estamos obteniendo. Dejemos que el mundo lo use de manera útil. Usémoslo para siempre “.

.
Es el momento, nos vemos en la próxima noticia. ¡Un saludo!

¡Compártelo!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *