El arte no está muerto, es solo inteligencia de datos PlatoBlockchain generada por máquinas. Búsqueda vertical. Ai.

El arte no está muerto, solo es generado por máquinas

Por qué los modelos de IA reemplazarán a los artistas mucho antes de que reemplacen a los programadores

Quizás la implicación más alucinante que estamos viendo de la IA generativa es que, contrariamente a la opinión común de que la creatividad será el último bastión del ingenio humano frente a la automatización, en realidad parece ser mas facil automatizar tareas creativas bastante difíciles que automatizar tareas de programación relativamente simples. Para tener una idea de esto, comparamos dos de los casos de uso más populares para la IA generativa: generación de código y generación de imágenes. Pero creemos que la afirmación se mantiene de manera más general, incluso cuando los modelos generativos se expanden a aplicaciones más complejas.

La versión corta del argumento (que abordamos con más detalle a continuación) es que aunque un producto como Copiloto de GitHub, en su forma actual, puede hacer que la codificación sea un poco más eficiente, no elimina la necesidad de desarrolladores de software capacitados con conocimientos de programación. Una gran razón es que, cuando se trata de construir un programa, la corrección realmente importa. Si AI genera un programa, aún requiere un ser humano para verificar que sea correcto, un esfuerzo casi al mismo nivel que crearlo para empezar.

Por otro lado, cualquier persona que pueda escribir puede usar un modelo como Difusión estable para producir imágenes únicas de alta calidad en minutos, a un costo mucho menor en muchos órdenes de magnitud. Los productos de trabajo creativo a menudo no tienen restricciones estrictas de corrección y los resultados de los modelos son asombrosamente completos. Es difícil no ver un cambio de fase completo en las industrias que dependen de imágenes creativas porque, para muchos usos, las imágenes que AI puede producir ahora ya son suficientes, y todavía estamos en las primeras etapas de la tecnología.

Reconocemos plenamente que es difícil tener confianza en cualquier predicción al ritmo que se mueve el campo. En este momento, sin embargo, parece que es mucho más probable que veamos aplicaciones llenas de imágenes creativas creadas estrictamente por programadores que aplicaciones con arte diseñado por humanos y construidas estrictamente por creadores. 

¿Por qué el bombo y por qué ahora?

Antes de entrar en los detalles de la generación de código versus la generación de imágenes, es útil tener una idea de cuán popular es la IA en general y la IA generativa, específicamente, en este momento.

La IA generativa está experimentando la aceptación más rápida por parte de los desarrolladores que jamás hayamos visto. Mientras escribimos esto, Stable Diffusion encabeza fácilmente las listas de tendencias de los repositorios de GitHub por un amplio margen.. Su crecimiento está muy por delante de cualquier tecnología reciente en infraestructura o criptografía (consulte la figura anterior). Hay anuncios de lanzamiento y financiación casi diarios de nuevas empresas que utilizan la tecnología, y las redes sociales en línea se están inundando con contenido creado por modelos generativos.

El nivel general de inversión en IA durante la última década también es difícil de exagerar. Hemos visto un aumento exponencial solo en las publicaciones desde mediados de la década de 2010 (consulte la figura a continuación). Hoy, alrededor del 20% de todos los artículos publicados en arXiv son sobre IA, ML y PNL. Es importante destacar que los resultados teóricos han cruzado un umbral crítico en el que se han vuelto fácilmente consumibles y desencadenaron una explosión cámbrica de nuevas técnicas, software y nuevas empresas. 

El arte no está muerto, es solo inteligencia de datos PlatoBlockchain generada por máquinas. Búsqueda vertical. Ai.

El pico más reciente en la figura anterior se debe en gran parte a la IA generativa. En una sola década, hemos pasado de modelos de IA exclusivos para expertos que podían clasificar imágenes y crear incrustaciones de palabras a modelos de uso público que pueden escribir código efectivo y crear imágenes notablemente precisas utilizando indicaciones en lenguaje natural. No sorprende que el ritmo de la innovación se haya acelerado, y no debería sorprender que los modelos generativos comiencen a incursionar en otras áreas que alguna vez estuvieron dominadas por humanos.

IA generativa y programación

Uno de los primeros usos de la IA generativa ha sido como ayuda para programadores. La forma en que funciona es que un modelo se entrena en un gran corpus de código (por ejemplo, todos los repositorios públicos en GitHub) y luego hace una sugerencia a un programador mientras codifica. Los resultados son sobresalientes. Tanto es así que es razonable que este enfoque se convierta en sinónimo de programación en el futuro.

El arte no está muerto, es solo inteligencia de datos PlatoBlockchain generada por máquinas. Búsqueda vertical. Ai.
Código generado: seguro contra ataques que no usan punto y coma.

Sin embargo, las ganancias de productividad han sido modestas en relación con la generación de imágenes, que cubrimos a continuación. Parte de la razón de esto, como se mencionó anteriormente, es que la corrección es fundamental en la programación (y, de hecho, en los problemas de ingeniería en general, pero nos centramos en la programación en esta publicación). Por ejemplo, un estudio reciente encontró que para escenarios que coincidan con alto riesgo CWE (enumeraciones de debilidades comunes), el 40% del código generado por IA contenía vulnerabilidades.

Por lo tanto, el usuario debe lograr un equilibrio entre generar suficiente código para proporcionar un aumento significativo de la productividad y, al mismo tiempo, limitarlo para que sea posible verificar la corrección. Como resultado, Copilot ha ayudado mejorar la productividad de los desarrolladores: estudios recientes (esta página y esta página) ponga ganancias del orden de 2x o menos, pero a un nivel a la par con lo que hemos visto en avances anteriores de lenguajes y herramientas de desarrollador. El salto de ensamblaje a C, por ejemplo, mejoró la productividad de 2 a 5 veces según algunas estimaciones.

Para los programadores más experimentados, las preocupaciones pueden extenderse más allá de la corrección del código y la calidad general del código. Como rápido.aies Jeremy Howard ha explicado con respecto a las versiones recientes del modelo OpenAI Codex, “[I] t escribe código detallado porque está generando promedio código. Para mí, tomar el código promedio y convertirlo en el código que me gusta y sé que es correcto es mucho más lento que simplemente escribirlo desde cero, al menos en los idiomas que conozco bien”.

Entonces, si bien está claro que la programación generativa es una función escalonada en la productividad del desarrollador, no está claro que la mejora sea radicalmente diferente de las que hemos visto antes. La IA generativa hace mejores programadores, pero aun así deben programar.

IA generativa y efectos visuales

Por otro lado, el impacto de los modelos generativos en el resultado del trabajo creativo, como la generación de imágenes, es extremo. Ha resultado en mejoras de muchos órdenes de magnitud en la eficiencia y el costo, y es difícil no verlo marcando el comienzo de un cambio de fase en toda la industria.

La forma en que funciona la IA generativa en este espacio es tomar entradas de texto simples del usuario, llamadas indicaciones, y luego el modelo genera una salida visual. Actualmente, existen modelos para crear muchos formatos de salida, incluidas imágenes, videos, modelos 3D y texturas.

Lo que es particularmente interesante es cómo estos modelos se pueden ampliar para generar imágenes nuevas o específicas de un dominio casi sin intervención creativa. Por ejemplo, Guido (uno de los autores) tomó un modelo de imagen previamente entrenado y lo volvió a entrenar en unas pocas docenas de fotos de sí mismo. A partir de ahí, pudo generar imágenes usando en el aviso. A continuación se muestran fotos generadas a partir de las siguientes indicaciones: ” como capitan america, en París, en una pintura.

El arte no está muerto, es solo inteligencia de datos PlatoBlockchain generada por máquinas. Búsqueda vertical. Ai.
Donde la generación de imágenes es una desviación masiva de la generación de código en un contexto empresarial es la medida en que la IA generativa cambia el cálculo económico. Para crear las imágenes de arriba, Guido entrenó al modelo en un puñado de fotos que cuestan alrededor de $.50 en recursos de infraestructura.. Una vez entrenado, generar imágenes cuesta alrededor de $0.001 en recursos informáticos y se puede hacer en la nube o en un portátil de última generación. Además, generar la imagen lleva solo unos segundos. 

Sin IA generativa, la única forma de obtener una imagen personalizada es contratar a un artista o hacerlo usted mismo. Incluso si comenzamos con la suposición de que una persona podría crear una imagen fotorrealista completamente personalizada en una hora por $ 10, el enfoque de IA generativa es fácilmente cuatro órdenes de magnitud más barato y un orden de magnitud más rápido. De manera más realista, cualquier obra de arte personalizada o proyecto de diseño gráfico probablemente llevará días o semanas y costará cientos, si no miles, de dólares. 

Similar a las ayudas de programación anteriores, la IA generativa será adoptada como herramienta por artistas y ambos requieren cierto grado de supervisión por parte del usuario. Pero es difícil exagerar la diferencia económica creada por la capacidad de un modelo de imagen para imitar la producción completa del artista. Usando un modelo de generación de código, escribir incluso un programa funcional muy básico que realiza una tarea informática estándar requiere revisar, editar y agregar pruebas para muchos fragmentos de código. Pero para una imagen básica, ingresar un aviso y elegir una imagen de una docena de sugerencias se puede hacer en menos de un minuto.

Tomemos como ejemplo a nuestra propia dibujante (y socia inversora) Yoko Li (@simplyokodraws). Entrenamos a una modelo usando 70 de sus imágenes anteriores, y la modelo pudo generar imágenes con un inquietante nivel de imitación. Cada artista tiene que averiguar qué crear a continuación, e incluso descubrió que los modelos capacitados pueden presentar más opciones de las que ella tenía en mente, al menos cuando se les presiona para producir algo en un período de tiempo determinado. Hay cientos de formas de dibujar el mismo objeto, pero los modelos generativos hicieron evidente de inmediato qué caminos vale la pena explorar. 

Entonces, cuando se trata de tales tareas, no estamos argumentando que las computadoras son necesariamente mejor que los humanos en una base de 1:1. Pero como con tantas otras tareas, cuando las computadoras pueden producir una salida de trabajo completa, simplemente nos matan en escala

Intenta adivinar cuáles de los dibujos a continuación fueron dibujados directamente por Yoko y cuáles fueron generados. 

El arte no está muerto, es solo inteligencia de datos PlatoBlockchain generada por máquinas. Búsqueda vertical. Ai.
Respuesta: El modelo de IA generó las imágenes con un fondo no blanco.

La mejora masiva en la economía, la flexibilidad para poder crear nuevos estilos y conceptos, y la capacidad de generar resultados de trabajo completos o casi completos nos sugiere que estamos preparados para ver un cambio marcado en todas las industrias donde los activos creativos son un gran parte del negocio. Y esto no se limita a las imágenes, sino que se aplica a todo el campo del diseño. Por ejemplo:

  • La IA generativa puede crear arte 2D, texturas, modelos 3D y ayudar con el diseño de niveles para juegos. 
  • En marketing, parece estar preparado para reemplazar el arte de archivo, la fotografía de productos y la ilustración. 
  • Ya estamos viendo aplicaciones en diseño web, diseño de interiores y diseño de paisajes.

Y realmente estamos justo en el comienzo. Si un caso de uso requiere la generación creativa de contenido, es difícil ver el argumento de por qué la IA generativa no lo interrumpirá o al menos se convertirá en parte del proceso.

-

OK, entonces, ¿cuál es el punto de esta publicación? Si bien se centra un poco en la generación de código y la generación de imágenes, sospechamos que los resultados son más generales. En particular, es probable que la IA interrumpa los esfuerzos creativos en todos los ámbitos, ya sean visuales, textuales o musicales, mucho antes de que se construyan los sistemas. 

Además del argumento de corrección que usamos anteriormente, también puede darse el caso de que combinar y recombinar todo el estado de la técnica sea suficiente para la gama práctica de productos creativos. Las industrias de la música y el cine, por ejemplo, históricamente han producido innumerables imitaciones de álbumes y películas populares. Es completamente concebible que los modelos generativos puedan ayudar a automatizar esas funciones con el tiempo. Sin embargo, lo notable de muchas de las imágenes producidas por Stable Diffusion y DALL-E 2 es que son muy buenos y realmente interesante. No es difícil imaginar un modelo de IA que produzca fusiones genuinamente interesantes de estilos musicales o incluso “escriba” largometrajes que sean intrigantes en la forma en que unen conceptos y estilos. 

Por el contrario, es difícil imaginar que los sistemas anteriores contendrán todas las herramientas que necesitaríamos para desarrollar todos los sistemas futuros. O incluso que los sistemas complejos podrían combinarse tan fácilmente como varios estilos de arte o música. Muy a menudo, el valor de un sistema, y ​​por qué son tan difíciles de construir, se encuentra en la larga lista de detalles: todas las compensaciones, soluciones alternativas, optimizaciones para un espacio de diseño determinado y el conocimiento institucional/latente que contienen. Así que seguir construyendo debemos.

Resistiremos la tentación de predecir exactamente cómo la IA generativa impactará en la industria creativa. Sin embargo, la historia sugiere que las nuevas herramientas tienden a expandir en lugar de contraer la definición de arte, y hacerlo accesible a nuevos tipos de artistas. En este caso, los nuevos artistas son constructores de sistemas. Asi que, para los fundadores de tecnología, creemos que la IA generativa es estrictamente una herramienta positiva para extender el alcance del software: los juegos serán más hermosos, el marketing más convincente, el contenido escrito más atractivo, las películas más inspiradoras.

Quién sabe: un día, un archivo de Internet de finales de 2022 puede ser un tesoro como uno de los últimos repositorios de contenido generado en su mayoría por humanos. El texto de este artículo, al menos, fue generado en su totalidad por humanos. 

El arte no está muerto, es solo inteligencia de datos PlatoBlockchain generada por máquinas. Búsqueda vertical. Ai.
Este artículo fue escrito por el equipo de infraestructura de a16z, con los autores principales Guido Appenzeller, Matt Bornstein, Martin Casado y Yoko Li, y una gran contribución del resto del equipo.

***

Las opiniones expresadas aquí son las del personal individual de AH Capital Management, LLC ("a16z") citado y no son las opiniones de a16z o sus afiliados. Cierta información contenida aquí se ha obtenido de fuentes de terceros, incluso de compañías de cartera de fondos administrados por a16z. Si bien se tomó de fuentes que se consideran confiables, a16z no ha verificado de forma independiente dicha información y no hace declaraciones sobre la precisión actual o duradera de la información o su idoneidad para una situación determinada. Además, este contenido puede incluir anuncios de terceros; a16z no ha revisado dichos anuncios y no respalda ningún contenido publicitario incluido en ellos.

Este contenido se proporciona solo con fines informativos y no debe considerarse como asesoramiento legal, comercial, de inversión o fiscal. Debe consultar a sus propios asesores sobre estos asuntos. Las referencias a cualquier valor o activo digital son solo para fines ilustrativos y no constituyen una recomendación de inversión ni una oferta para proporcionar servicios de asesoramiento de inversión. Además, este contenido no está dirigido ni destinado a ser utilizado por ningún inversionista o posible inversionista, y bajo ninguna circunstancia se puede confiar en él al tomar una decisión de invertir en cualquier fondo administrado por a16z. (Una oferta para invertir en un fondo a16z se realizará solo mediante el memorando de colocación privada, el acuerdo de suscripción y otra documentación relevante de dicho fondo y debe leerse en su totalidad). Cualquier inversión o compañía de cartera mencionada, referida o descritos no son representativos de todas las inversiones en vehículos administrados por a16z, y no puede garantizarse que las inversiones serán rentables o que otras inversiones realizadas en el futuro tendrán características o resultados similares. Una lista de inversiones realizadas por fondos administrados por Andreessen Horowitz (excluyendo inversiones para las cuales el emisor no ha otorgado permiso para que a16z divulgue públicamente, así como inversiones no anunciadas en activos digitales que cotizan en bolsa) está disponible en https://a16z.com/investments /.

Los cuadros y gráficos proporcionados en el interior tienen únicamente fines informativos y no se debe confiar en ellos al tomar cualquier decisión de inversión. El rendimiento pasado no es indicativo de resultados futuros. El contenido habla sólo a partir de la fecha indicada. Todas las proyecciones, estimaciones, pronósticos, objetivos, perspectivas y/u opiniones expresadas en estos materiales están sujetas a cambios sin previo aviso y pueden diferir o ser contrarias a las opiniones expresadas por otros. Consulte https://a16z.com/disclosures para obtener información adicional importante.

Sello de tiempo:

Mas de Andreessen Horowitz