Anonim

El algoritmo AI enseña a un automóvil a conducir desde cero en 20 minutos

Automotor

Loz Blain

6 de julio de 2018

6 imágenes

La startup del Reino Unido, Wayve, cree que el aprendizaje automático de prueba y error, al igual que la forma en que los humanos aprenden, es la clave para los autos autónomos (Crédito: Wayve)

Un par de Ph.Ds de inteligencia artificial de la Universidad de Cambridge se enfocan en el aprendizaje automático como la base de los autos autónomos. Su compañía, Wayve, acaba de lanzar el video de un Renault Twizy equipado para aprender a seguir un carril desde cero, en el transcurso de unos 20 minutos.

Amar Shah y Alex Kendall, de Wayve, creen que ha habido demasiada ingeniería manual mientras las personas intentan resolver el problema del auto-manejo.

"La pieza faltante del rompecabezas de auto conducción es algoritmos inteligentes, no más sensores, reglas y mapas", dice Shah, cofundador y CEO de Wayve. "Los seres humanos tienen una capacidad fascinante para realizar tareas complejas en el mundo real, porque nuestros cerebros nos permiten aprender rápidamente y transferir conocimientos a través de nuestras muchas experiencias. Queremos darle a nuestros vehículos mejores cerebros, no más hardware".

Con ese enfoque en mente, el equipo tomó un Renault Twizy, equipado con una sola cámara en la parte frontal y modificado con la capacidad de operar con la computadora la dirección, el gas y los frenos. Lo conectaron a una unidad de procesamiento de gráficos capaz de analizar de forma inteligente los datos de la cámara en tiempo real, y ejecutaron un programa de aprendizaje basado en la experimentación, la optimización y la evaluación.

Pusieron el Twizy en un carril estrecho y suavemente curvado. Un conductor humano se sentó en el asiento del conductor, luego le entregó el control total al automóvil, sin decirle cuál era su tarea, y lo dejó experimentar con los controles.

Cada vez que el coche salía de la carretera, lo detenían y lo corrigían. El algoritmo "penalizó" al auto por cometer errores, y "lo recompensó" en función de la distancia recorrida sin intervención humana. En 20 minutos, lo que representaba menos de 20 intentos, el automóvil había descubierto cómo seguir un carril de forma más o menos indefinida.

Wayve cree que la calidad de los sistemas de aprendizaje será el factor clave para determinar quién domina el mercado autónomo de automóviles en la próxima década.

"DeepMind nos ha demostrado que los métodos de aprendizaje de refuerzo profundo pueden llevar a un rendimiento sobrehumano en muchos juegos, como Go, Chess y juegos de computadora, que casi siempre superan a cualquier sistema basado en reglas", lee una publicación del blog de Wayve. "Aquí mostramos que una filosofía similar también es posible en el mundo real, y en particular, en los vehículos autónomos.

"Imagine desplegar una flota de autos autónomos, con un algoritmo de manejo que inicialmente es del 95% de la calidad de un conductor humano. Un sistema así no sería tan inestable como el modelo aleatorio en nuestro video de demostración, sino que sería casi capaz de tratar con semáforos, rotondas, intersecciones, etc. Después de un día completo de manejo y mejora en línea de la toma de control del conductor humano, tal vez el sistema mejoraría al 96%. Después de una semana, el 98%. Después de un mes, 99%. Después de unos meses, el sistema puede ser superhumano, habiéndose beneficiado de la retroalimentación de muchos conductores de seguridad diferentes ".

Ciertamente, hay elementos de aprendizaje, y elementos de aprendizaje de red, presentes en las operaciones actuales de conducción autónoma. El Autopliot de Tesla, por ejemplo, registra cualquier error que un conductor deba asumir y corregir, y lo usa para ayudar a educar a otros Teslas que se dirigen a través de la misma área. Pero la idea de dejar que un auto auto-conductor construya su propio modelo completo de cómo operar en el mundo, de la misma manera que lo hace un conductor humano, es fascinante.

El proceso de aprendizaje se demuestra en el video de dos minutos a continuación.

Fuente: Wayve

Un par de Renault Twizys, equipados como bancos de pruebas automáticos (Crédito: Wayve)

Los cofundadores de Wayve, Alex Kendall y Amar Shah (Crédito: Wayve)

Dada la complejidad de la tarea de aprender a conducir, ¿podría el aprendizaje automático hacer un mejor trabajo que llenar un sistema con reglas? (Crédito: Wayve)

La startup del Reino Unido, Wayve, cree que el aprendizaje automático de prueba y error, al igual que la forma en que los humanos aprenden, es la clave para los autos autónomos (Crédito: Wayve)

Al dejar que el auto experimentara con sus controles, corrigiéndolo donde fue necesario y recompensándolo por un tiempo máximo antes de que fuera necesario corregirlo, Wayve dejó que Twizy se enseñara a sí mismo cómo seguir un carril (Crédito: Wayve)

Estos Twizys son capaces de un aprendizaje automático sofisticado (Crédito: Wayve)

Recomendado La Elección Del Editor