Apple mantuvo en secreto su investigación de conducción autónoma durante años, pero ahora la compañía ha publicado algunas de sus técnicas de software de conducción autónoma que mejoran la detección de obstáculos..
Publicado el 17 de noviembre en el repositorio científico preimpreso moderado arXiv por los expertos en inteligencia artificial y aprendizaje automático de Apple Yin Zhou y Oncel Tuzel, el documento describe la detección de pequeños obstáculos utilizando el método de detección de detección de luz y rango (LiDAR).
En lugar de confiar en representaciones de características hechas a mano (por ejemplo, una proyección a vista de pájaro), los científicos de Apple proponen una nueva arquitectura profunda entrenable de extremo a extremo para la detección 3D basada en la nube de puntos. Llamado VoxelNet, puede operar directamente en puntos 3D dispersos y capturar información de formas 3D de manera efectiva.
La experimentación temprana con la tecnología VoxelNet ha demostrado que supera con creces los métodos de detección 3D basados en LiDAR de última generación. En tareas más desafiantes, como la detección en 3D de peatones y ciclistas, el enfoque VoxelNet demostró resultados alentadores, demostrando que proporciona una mejor representación y detección en 3D.
Los cuadros verdes en 3D indican posibles obstáculos detectados con LiDAR
La capacidad de detectar objetos con precisión en nubes de puntos 3D es crucial para evitar obstáculos.
Del periódico:
VoxelNet divide una nube de puntos en vóxeles 3D igualmente espaciados y transforma un grupo de puntos dentro de cada vóxel en una representación de características unificadas a través de la nueva capa de codificación de características de vóxeles (VFE). De esta manera, la nube de puntos se codifica como una representación volumétrica descriptiva, que luego se conecta a un RPN para generar detecciones.
Los experimentos en el punto de referencia de detección de automóviles KITTI muestran que VoxelNet supera los métodos de detección 3D basados en LiDAR de vanguardia por un amplio margen. Además, nuestra red aprende una representación discriminativa efectiva de objetos con varias geometrías, lo que lleva a resultados alentadores en la detección 3D de peatones y ciclistas, basada solo en LiDAR.
La arquitectura VoxelNet, ilustrada en la parte superior de la publicación, presenta una red de aprendizaje que toma una nube de puntos sin procesar como entrada, luego divide el espacio en vóxeles y transforma los puntos dentro de cada vóxel en una representación vectorial que caracteriza la información de forma.
Es genial que Apple esté comenzando a abrirse cuando se trata de su investigación de conducción autónoma, que se dice que está dirigida al mercado de transporte de pasajeros y al servicio de transporte interno del campus de la compañía.
El fabricante de iPhone aparentemente hizo una gran inversión en conducción autónoma y tiene "un gran proyecto en marcha" en ese espacio, según el CEO Tim Cook.