Aprendizaje automático: ¿Qué significa para la innovación tecnológica?

0
333

La democratización del estos sistemas tendrá un impacto similar al que tuvo la apertura de internet a fines del siglo pasado.

Al parecer, el mundo de la innovación de alta tecnología puede cambiar el destino de varias industrias de la noche a la mañana. Ahora estamos cerca de dar un nuevo salto cualitativo gracias a la democratización del aprendizaje automático, una forma de inteligencia artificial que permite a los computadores aprender sin ser programados de forma explícita para hacerlo. El proceso de democratización ya está en marcha, según el siguiente artículo de Kartik Hosanagar (@khosanagar), profesor de las Operaciones, Informaciones y Decisiones de Wharton y fundador de Yodle Inc. y Apoorv Saxena (@apoorvsaxena1), director de producto de Google y uno de los presidentes del reciente congreso Fronteras de IA.

El mes pasado, durante el congreso CloudNext en San Francisco, Google anunció la adquisición de Kaggle, una comunidad en línea para los científicos de datos y competiciones de aprendizaje automático. A pesar de que el gesto puede parecer muy alejado de la actividad principal de la empresa, es evidente el enorme interés de la industria por el aprendizaje automático (AM). Kaggle no sólo da acceso a Google a una comunidad de científicos de datos con talento, sino también a uno de los mayores depósitos de conjuntos de datos que ayudarán a entrenar a la próxima generación de algoritmos de aprendizaje automático.

A medida que los algoritmos de AM resuelven problemas cada vez mayores y más complejos, tales como la traducción de idiomas y la comprensión de las imágenes, entrenarlos puede requerir una cantidad colosal de datos preetiquetados. Para ampliar el acceso a estos datos, Google había publicado anteriormente un conjunto de datos etiquetados creados a partir de más de 7 millones de videos de YouTube como parte de su desafío YouTube-8M en Kaggle. El siguiente paso fue la adquisición de Kaggle.

El acceso a los datos y algoritmos basados en el mercado disminuirá las barreras de entrada y dará lugar a una explosión de nuevas aplicaciones de IA. No hace mucho tiempo, en 2015, sólo las grandes empresas como Google, Amazon y Apple tenían acceso a datos en grandes cantidades y a los recursos informáticos necesarios para entrenar y poner en marcha algoritmos de inteligencia artificial avanzada. Las pequeñas empresas de nueva creación y las personas simplemente no tenían acceso a ellos y se les impedía de hecho entrar en este mercado. Ahora bien, esto va a cambiar. La democratización de la AP da a las personas y a las empresas de nueva creación la oportunidad de poner en práctica sus ideas y poner a prueba sus conceptos antes de conseguir los fondos necesarios para ganar escala.

Sin embargo, el acceso a los datos es sólo una manera mediante la cual se está democratizando la AM. Hay todo un esfuerzo en marcha en el sentido de estandarizar y mejorar el acceso a todos los niveles de aprendizaje automático, incluyendo conjuntos de chips informáticos, plataformas escalables, estructuras de software, herramientas y algoritmos de AM.

1. Conjunto de chips especializados

Los algoritmos complejos para el aprendizaje automático requieren una enorme cantidad de capacidad computacional, tanto para entrenar modelos como para aplicarlos en tiempo real. En lugar de utilizar procesadores para diversos fines, capaces de cubrir muchos tipos de tareas, la atención se ha centrado en la creación de hardware especializado hecho a medida para las tareas de AM. La TPU (Unidad de Procesamiento Tensor) de Google y el DGX-1, NVIDIA, ahora nos permite tener un hardware robusto diseñado específicamente para AM.

2. Plataformas de computación altamente escalables

Incluso si hay procesadores especializados disponibles, no todas las empresas tienen el capital y los conocimientos necesarios para hacer frente a una plataforma de computación a gran escala necesaria para ejecutar regularmente las tareas de aprendizaje automático avanzadas. Aquí es donde la nube de servicios públicos, como Amazon Web Services (AWS), Google Cloud Platform, Microsoft Azure y otros entran en juego. Estos servicios proporcionan a los desarrolladores el alquiler de una infraestructura escalable optimizada para AM a una fracción del costo de adquisición de una estructura propia.

3. Estructuras de código abierto y el software de aprendizaje profundo

Una de las principales dificultades para la adopción del aprendizaje automático a gran escala es que hay muchas estructuras diferentes de software disponibles. Las grandes empresas están abriendo el código de sus estructuras centrales de AM para tratar de lograr con ello cierta normalización. Al igual que el coste de desarrollo de aplicaciones móviles se fue reduciendo drásticamente cuando apareció el iOS y Android como los dos ecosistemas predominantes, también el aprendizaje de las máquinas será más accesible a medida que haya una estandarización de las herramientas y plataformas alrededor de algunas estructuras. Algunas de estas herramientas notables de código abierto son: Tensor Flow, de Google; MXNet, de Amazon; y Torch, de Facebook.

4. Herramientas amigables para desarrolladores

El paso final para la democratización del aprendizaje automático será el desarrollo de estructuras para arrastrar y soltar accesibles a cualquiera que no tenga un doctorado o una formación en la ciencia de los datos profundos. Microsoft Azure ML Studio proporciona acceso a muchos modelos sofisticados de AM a través de una interfaz sencilla y clara de usuario. Amazon y Google también dieron a conocer un software similar en sus plataformas en la nube.

5. Mercados para algoritmos de AM y conjunto de datos

No solo tenemos la infraestructura bajo demanda necesaria para la creación y funcionamiento de algoritmos de AM también tenemos, inclusive, los mercados para los propios algoritmos. ¿Es necesario un algoritmo para el reconocimiento de rostros en imágenes o se necesita añadir color a las fotografías en blanco y negro? Mercados como Algorithimia permiten descargar el algoritmo de su elección. Además, los sitios como Kaggle proporcionan conjuntos de datos en cantidades necesarias para la formación continua de estos algoritmos.

Todas estos cambios significan que el mundo del aprendizaje automático ya no se limita a los laboratorios universitarios y centros de investigación corporativos con acceso a los datos de entrenamiento en grandes cantidades y la infraestructura de computación.

¿Cuáles son las implicaciones?

A mediados de los años 90, y al final de esa década, el desarrollo de Internet lo hacían expertos y era accesible sólo a las empresas con amplios recursos. Ahora, con herramientas simples como WordPress, Medium y Shopify, cualquier persona puede estar presente en Internet. La democratización del aprendizaje automático tendrá un impacto similar para reducir las barreras de entrada para los individuos y las empresas de nueva creación.

Además, el ecosistema emergente de mercados de datos, los algoritmos y la infraestructura de computación también permitirá que los desarrolladores adquieran más fácilmente habilidades AM. El resultado final será reducir los costes de formación y contratación de los buenos profesionales. Creemos que los dos factores anteriores serán impactantes sobre todo en el caso de uso vertical (específico para la industria), como la previsión del tiempo, la evaluación de las condiciones de salud/enfermedades, descubrimiento de fármacos de diagnóstico y evaluación de riesgo financiero cuyo costo siempre ha sido prohibitivo.

Así cómo la computación en la nube marcó el comienzo de la actual explosión de nuevas empresas, la creación sistemática de plataformas AM posiblemente alimentará la próxima generación de clientes y herramientas de negocio. La plataforma del PC nos ha dado acceso a las aplicaciones de productividad como Word y Excel y, por último, las aplicaciones de Internet como búsquedas y redes sociales. La plataforma móvil nos ha dado las aplicaciones de mensajería y servicios basados en la localización. La democratización sistemática de la AM, al parecer, nos dará una serie fantástica de software inteligente y dispositivos que van a mover nuestro mundo.