El zócalo universal: una mejor manera de comprender las redes neuronales artificiales

¡Compártelo!

Parece que hay un debate interminable sobre los vehículos autónomos. Si bien las opiniones varían ampliamente, muchos caen en los campos optimista y pesimista. Los más optimistas de los optimistas no solo creen que construir un vehículo autónomo es posible, sino que un vehículo autónomo es consciente y vivo de alguna manera, o piensan que la verdadera inteligencia artificial general no está tan lejos. Los pesimistas piensan que Tesla no solo fracasará en la creación de la conducción autónoma completa, sino que todos los que lo intenten fracasarán. Incluso los pesimistas que piensan que Tesla y otras empresas pueden tener éxito a menudo señalan fallas pasadas o preocupaciones de seguridad actuales.

Un diagrama de una red neuronal artificial muy simple. Imagen de Glosser.ca, licencia CC-BY-SA 3.0.

Como sucede a menudo cuando vemos los extremos discutiendo, la verdad está en algún punto intermedio. Para llegar a esa verdad, realmente necesitamos despegar algo del misticismo y ver qué son realmente las redes neuronales artificiales.

Para los científicos de datos, sé que esto será una simplificación excesiva, pero en esencia, una red neuronal artificial es una gran cantidad de funciones autoajustables en capas. En otras palabras, muchos pedacitos de matemática estadística se ajustan por sí mismos para adaptarse a los datos de entrenamiento (con diferentes niveles de supervisión) para producir los resultados correctos.

Por ejemplo, cada píxel de una imagen podría ser una entrada y la red neuronal artificial decide si la imagen es una cosa u otra, pero solo si los datos de entrenamiento que se utilizaron para hacer esto reflejan bien el mundo real. En pocas palabras, una red neuronal artificial es tan buena como sus datos de entrenamiento.

A diferencia del ejemplo simple de la derecha, una red neuronal artificial que está haciendo algo útil puede tener millones o incluso miles de millones de entradas, incluso más nodos que realizan el cálculo y una gran cantidad de salidas. Luego, se programan varias redes para que funcionen juntas de modo que diferentes redes neuronales puedan realizar varias tareas juntas.

Pero, en su esencia, cada red neuronal sigue siendo solo un grupo de nodos que se ajustan para producir los resultados correctos para los datos de entrenamiento y luego no se pueden ajustar sobre la marcha para adaptarse a situaciones mínimamente novedosas. Tomemos estas redes neuronales, por ejemplo:

Tan grandes y complejos como son, solo están diseñados para decidir qué número (0–9) es un dígito dado. Si les presenta un caso extremo, no producirán la respuesta correcta o no producirán ninguna respuesta. Pero, los casos extremos ocurren todo el tiempo en el mundo real, incluso con números.

Por ejemplo, está el común “nueve al revés” en las poblaciones chinas. Si bien hay otros sistemas de numeración chinos, el sistema de numeración hindú-árabe que es común en Occidente se abrió camino por la Ruta de la Seda y ahora es de uso común en el este de Asia, pero con algunos cambios. El más notable es el nueve “al revés” (es la forma correcta para ellos), o una versión de “bucle en un palo” del nueve. Las poblaciones chinas también usan otros sistemas numéricos, como los caracteres chinos para los números (que es como nosotros cuando escribimos un número como “setenta y tres” en lugar de “73”, como cuando escribimos un cheque) y sistemas antiguos menos comunes basados ​​en contando varillas. Pero esa es otra historia más allá del alcance de este artículo.

Incluso si asumimos que solo se usarán números hindúes-arábigos, las variantes chinas como el nueve al revés no son un caso marginal, globalmente hablando. Los idiomas chinos son, con mucho, los más comunes en la tierra, y eso es antes de considerar otras culturas del este de Asia que podrían tener usos algo diferentes de los números hindúes-arábigos. El caso extremo puede, de hecho, ser más común a nivel mundial que la norma occidental.

Pero, si construye y entrena una red neuronal que no conoce los nueves al revés, se encontrará con problemas cuando los encuentre. Claro, puede hacer una versión mejorada con mejores datos de entrenamiento que incorpore todos los sistemas numéricos y todas las variantes regionales comunes de esos, pero el original construido para uso occidental simplemente no puede adaptarse o aprender en función del contexto de la manera que podemos.

Por ejemplo, si hizo clic en el enlace sobre nueves al revés, es obvio en el cheque del restaurante que es un nueve. Nuestros cerebros pueden adaptarse e improvisar en función del contexto y averiguarlo. Somos seres conscientes, no “computadoras de carne”, por lo que no estamos indefensos cuando nos encontramos con algo ligeramente diferente o inusual.

El zócalo universal: la mejor manera de comprender la verdadera utilidad de las redes neuronales artificiales

No me malinterpretes. Las redes neuronales artificiales son realmente asombrosas. Pueden hacer muchas cosas asombrosas, como sabe cualquier propietario de Tesla. No estoy tratando de menospreciarlos o burlarme de ellos. Lo que estoy tratando de hacer es ponerlos en contexto para que podamos apreciarlos por las cosas maravillosas que son y no decepcionarnos cuando no cumplan con las expectativas poco realistas.

Si esperamos niveles de inteligencia humana o incluso animal de las redes neuronales artificiales, nos decepcionarán constantemente. No pueden adaptarse, considerar el contexto, comparar con los valores culturales o improvisar de la manera que podemos. Simplemente no están diseñados para hacer realmente lo que hacemos, que es básicamente lo siguiente:

Una visualización del coronel John Boyd Concepto de bucle OODA. Imagen de Edwin Moran, licencia CC-BY.

Las redes neuronales artificiales probablemente pueden hacer algunas de las cosas en el Bucle OODA, pero no pueden hacerlo todo. Si esperamos que hagan eso, nos decepcionarán.

En cambio, propongo que los comparemos con el “Dado universal”, una herramienta que se ajusta automáticamente para adaptarse a diferentes tuercas y pernos.

Obviamente, hay muchas tareas que el “Universal Socket”, el “Magic Socket” o como lo llames no pueden realizar, pero eso no significa que no sea extremadamente útil. Es la única forma de utilizar una herramienta eléctrica para conducir un gancho o bucle, por ejemplo. El hecho de que tenga límites no significa que no valga la pena.

La programación normal “si-entonces” es como una llave de tubo normal. Cada enchufe se ajusta a un tamaño específico de tuerca o perno, al igual que un programa de computadora tradicional no puede ajustarse a nada que no sea para lo que fue construido. Las redes neuronales artificiales son como el “Universal Socket”. Son más adaptables que la programación normal, pero no infinitamente adaptables a casi todas las situaciones como lo es la mente humana.

Como dije, las redes neuronales artificiales son increíbles, pero son aún más útiles y sorprendentes si las apreciamos por lo que son en lugar de esperar que hagan cosas que están más allá de su alcance. Aún se debate si conducir un automóvil en casi todas las condiciones y ubicaciones está fuera de su alcance, y realmente no creo que nadie lo sepa con certeza, pero ya sabemos que ciertamente pueden hacer un buen trabajo ayudándonos cuando se usan. responsablemente.

.
Si ha sido una lectura de tu agrado, te invitamos a compartir la noticia con esa persona aficionada a la electricidad.

¡Compártelo!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *