Cómo el equipo de piloto automático de Tesla refina una cantidad insondable de datos es bastante bueno

¡Compártelo!

Tiempo asistiendo al evento del Día de la IA de Tesla, Aprendí, junto con el resto del mundo que ve el evento en la transmisión en vivo, que el equipo de piloto automático de Tesla ve una cantidad insondable de datos. Junto con Elon Musk, el equipo de piloto automático de Tesla presentó los últimos logros de Tesla en el campo de la inteligencia artificial, los datos y las supercomputadoras.

Tesla está trabajando para dar vida a los autos totalmente autónomos que ayudarán a prevenir los millones de accidentes que ocurren todos los días. Esto requiere grandes cantidades de datos de imágenes y videos obtenidos de la conducción en el mundo real. Los videos y las imágenes necesitan etiquetas para mostrar qué objetos están presentes y cómo debería responder la IA. Además, la IA necesita aprender a enseñarse a sí misma cómo responder a diferentes imágenes y videos (si eso tiene sentido).

Conjuntos de datos masivos

Andrej Karpathy, director de inteligencia artificial de Tesla, explicó que las redes neuronales no eran suficientes y que Tesla necesitaba conjuntos de datos masivos para generar los algoritmos correctos que se encuentran dentro de las redes neuronales. Más específicamente, Tesla necesita que estos conjuntos de datos estén dentro del espacio vectorial. Esto llevó a la pregunta de cómo se pueden acumular cientos de millones de parámetros y ejemplos de espacios vectoriales. Karpathy señaló que Tesla tenía millones de estas redes.

Parando aquí solo por un momento, eso es mucho def datos. Karpathy señaló que, con el tiempo, el equipo de etiquetado de datos de Tesla había crecido a más de 1,000 etiquetadoras profesionales que trabajan con los ingenieros del equipo. Incluso hay un equipo para desarrollar y mantener toda la infraestructura para el etiquetado de datos. Explicó que hoy, los equipos están etiquetando directamente en el espacio vectorial y no en las imágenes individuales con las que comenzaron hace años, y ahora están etiquetando videos. Sin embargo, incluso esto no fue suficiente. Karpathy explicó que tanto las computadoras como las personas tienen sus defectos y beneficios. Un ejemplo es que las computadoras son buenas en la reconstrucción de geometrías y el seguimiento de la triangulación, mientras que las personas son excelentes en semántica.

“Realmente, para nosotros, se está convirtiendo en una historia de cómo los humanos y las computadoras colaboran para crear estos conjuntos de datos espaciales vectoriales”.

Karpathy mencionó que antes de trasladar el etiquetado de datos de Tesla internamente, había estado trabajando con un tercero. Sin embargo, esto no estaba funcionando del todo. La alta latencia y la baja calidad fueron problemas importantes. Entonces, Tesla integró verticalmente el etiquetado de datos moviéndolo internamente (como se sabe que hace Tesla). El equipo de etiquetado de datos de Tesla tiene su sede en EE. UU. Esto es algo que muchos pasan por alto. Muchas empresas subcontratarían estos trabajos y pagarían precios muy bajos en el extranjero por los etiquetadores humanos. Tesla contrata gente en California. Esta es solo una razón más para admirar a Tesla, especialmente como empresa estadounidense y como proveedora de empleo.

Más datos que las etiquetadoras humanas

Ashok Elluswamy, director de software de piloto automático de Tesla, también participó en la presentación. Explicó que a pesar de que Tesla tiene muchos etiquetadores humanos, la cantidad de datos de entrenamiento que se necesitan para entrenar con las redes supera en número a los etiquetadores humanos. Para resolver esto, explicó, están creando una enorme tubería de etiquetado automático. Mostró un ejemplo de cómo el equipo etiqueta un solo clip. Estos clips tienen una gran cantidad de datos, como videos, datos IMU, GPS, odometría y pueden tener una duración de 45 segundos a un minuto.

Los clips se recopilan de los automóviles de los clientes o de los automóviles de ingeniería y luego se envían a los servidores donde ejecutan muchas de sus redes neuronales fuera de línea para producir resultados intermedios, como el mapeo de puntos. Después de esto, el clip pasa por la robótica y un algoritmo que produce un conjunto final de etiquetas que se pueden usar para entrenar las redes.

Parece que el equipo de inteligencia artificial de Tesla habla un idioma completamente diferente a veces, pero en pocas palabras, Tesla ha desarrollado un proceso para ordenar y organizar sus datos automáticamente. Esto se hace a través de la colaboración de personas y computadoras, como mencionó Karpathy.

Simulación en un videojuego

Elluswamy también explicó otra forma en que se etiquetan los datos. Su sistema de simulación es un videojuego con Autopilot como jugador. Mostró la simulación y un automóvil dentro que tenía un logotipo encima, que significaba piloto automático. Hizo un giro a la izquierda. Explicó que, dado que se trataba de una simulación, partía del espacio vectorial, por lo que tenía etiquetas perfectas. Algunas de esas etiquetas producidas fueron cuboides de vehículos con cinemática y profundidad. Lo bueno es que si Karpathy quisiera agregar una nueva tarea, el equipo podría producirla rápidamente, ya que ya tienen el espacio vectorial y pueden escribir el código para producir nuevas etiquetas.

.
Si ha sido una lectura de tu agrado, comparte esta noticia con esa persona interesada.

¡Compártelo!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *