728 x 90 px

Cuando a los diseñadores de la empresa de juguetes Mattel se les pidió hace poco que crearan un nuevo modelo de automóvil Hot Wheels, buscaron inspiración en DALL∙E 2, un sistema de IA desarrollado por OpenAI que crea imágenes y arte personalizados basados en lo que la gente describe en un lenguaje sencillo.
Con la herramienta, los diseñadores pueden escribir un mensaje como «Un modelo a escala de un automóvil clásico» y DALL∙E 2 generará una imagen de un automóvil antiguo de juguete, quizás de color plateado y con llantas de banda blanca.
Como siguiente paso, el diseñador podría borrar la parte superior del automóvil y luego escribir «Hazlo convertible» y DALL∙E 2 actualizará la imagen del automóvil como convertible. El diseñador puede seguir con ajustes en el diseño, pidiéndole a DALL∙E 2 que lo pruebe en rosa o azul, con la capota puesta, y más y más.
(Automático aquí)
DALL∙E 2 llegará al servicio Azure OpenAI de Microsoft, por invitación, lo que permitirá a clientes selectos de Azure AI generar imágenes personalizadas a través de texto o imágenes, anunció la compañía hoy en Microsoft Ignite, una conferencia para desarrolladores y profesionales de TI.
La disponibilidad de DALL∙E 2 a través del servicio Azure OpenAI proporciona a los clientes, como Mattel, una infraestructura de IA en la nube que combina la innovación de vanguardia de la generación de texto a imagen con las protecciones y certificaciones de IA responsable y de cumplimiento que ofrece Azure, dice Microsoft.
Los diseñadores de Mattel pudieron generar docenas de imágenes, cada iteración despertó y refinó ideas que podrían ayudar a diseñar una representación final completa de un nuevo modelo de automóvil Hot Wheels.
«Se trata de decir, ‘¡Oh, no pensé en eso!’», dijo Carrie Buse, directora de diseño de productos en Mattel Future Lab en El Segundo, California. Ella ve la tecnología de IA como una herramienta para ayudar a los diseñadores a generar más ideas. “En última instancia, la calidad es lo más importante”, señaló. “Pero a veces la cantidad puede ayudarte a encontrar la calidad”.
Microsoft también integra DALL∙E 2 en sus aplicaciones y servicios para el consumidor y comienza con la aplicación Microsoft Designer, anunciada de manera reciente, y pronto se integrará en Image Creator en Microsoft Bing. El lanzamiento de DALL∙E 2 en los productos y servicios de Microsoft refleja cómo la inversión de la empresa en investigación de IA infunde IA en todo lo que construye, produce y entrega para ayudar a todos a impulsar la productividad y la innovación.
La tendencia es el resultado de los avances no lineales en las capacidades de IA logrados al llevar más cómputo a más datos para entrenar modelos más ricos y poderosos, según Eric Boyd, vicepresidente corporativo de Microsoft, AI Platform.
“El poder de los modelos ha cruzado este umbral de calidad y ahora son útiles en más aplicaciones”, dijo. “La otra tendencia que vemos es que todos los desarrolladores de productos piensan y entienden las formas en que pueden usar la IA en sus productos tanto para facilitar su uso como para decir: ‘Oh, puedo hacer que mi producto funcione mejor si Yo uso IA’”.
DALL∙E 2 se entrenó en una supercomputadora alojada en Azure que Microsoft construyó en exclusiva para OpenAI. La misma supercomputadora Azure también se usó para entrenar los modelos de lenguaje natural GPT-3 de OpenAI y Codex, el modelo que impulsa a GitHub Copilot y ciertas funciones en Microsoft Power Apps que se ejecutan en Azure OpenAI Service. Azure también hace posible que estas herramientas de IA generen sugerencias de imágenes, texto o código con rapidez para que una persona las revise y considere usarlas.
La incorporación de DALL∙E 2 se basa en la asociación continua de Microsoft y OpenAI y amplía la variedad de casos de uso dentro de Azure OpenAI Service, el más nuevo de la familia Azure Cognitive Services en la actualidad en versión preliminar, que ofrece seguridad, confiabilidad, cumplimiento, privacidad de datos y otras capacidades de nivel empresarial integradas en Microsoft Azure.
Otras tecnologías de IA desarrolladas por Microsoft y disponibles a través de Azure Cognitive Services, como la traducción de idiomas, la transcripción de voz, el reconocimiento óptico de caracteres y el resumen de documentos, han comenzado a aparecer en productos y servicios como Microsoft Teams, Microsoft Power Platform y Microsoft 365.
“Durante los últimos 18 meses, hemos visto esta transición en la tecnología de demostrar que se puede hacer cosas con IA a mapearlo en escenarios y procesos reales donde es útil para el usuario final”, dijo Charles Lamanna, vicepresidente corporativo de Microsoft de aplicaciones y plataforma de negocios. “Es la producción de estos modelos de lenguaje muy grandes”.
Estas capacidades de IA tienen como objetivo eliminar el trabajo tedioso y permitir que los empleados se concentren en tareas de mayor valor, como liberar a los asociados de ventas para entablar conversaciones con los clientes sin tener que tomar notas, dijo Lamanna. Estas nuevas herramientas también pueden automatizar procesos que en la actualidad consumen horas de la jornada laboral de las personas, como escribir resúmenes de llamadas de ventas y agregarlos a una base de datos de clientes.
«Ahora podemos inyectar IA que escuche nuestra conversación y ayude a las personas a ser más productivas al crear transcripciones, capturar elementos de acción, resumir la reunión, identificar frases comunes o hacer análisis sobre ‘¿Soy un buen oyente?’», dijo Lamanna. “Eso requería el avance de la IA de última generación y el avance de estas herramientas de colaboración digital”.
Lamanna se centra en la creación de herramientas que permitan a cualquier persona con un dispositivo informático crear sus propias aplicaciones impulsadas por IA a través de Microsoft Power Platform. Por ejemplo, su equipo implementa una función en Power Automate con capacidades de copiloto impulsadas por IA que permiten a las personas usar lenguaje natural para crear procesos de flujo de trabajo que conectan varios servicios que se ejecutan en la nube de Microsoft.
«Los usuarios pueden decir en un lenguaje normal: ‘Oye, cada vez que reciba un correo electrónico de mi jefe, envía un mensaje de texto a mi teléfono y pon una tarea en mi Outlook’», explicó Lamanna. “Pueden tan solo decir eso, y se genera en automático”.
Esta capacidad de convertir una oración en un flujo de trabajo amplía de manera drástica la cantidad de personas que pueden crear soluciones de software impulsadas por IA, dijo. Las personas con un poco más de conocimientos técnicos pueden personalizar y refinar aún más sus aplicaciones con herramientas de código bajo e interfaces gráficas disponibles en Power Platform, como la tecnología de procesamiento inteligente de documentos en AI Builder, agregó.
Un abogado podría usar esta tecnología para crear una aplicación personalizada que se activa cada vez que se carga un nuevo contrato en el sitio de SharePoint de la empresa. Esta aplicación podría extraer información clave como quién redactó el contrato, las partes involucradas y el sector de la industria y luego enviar por correo electrónico un resumen del contrato con estos detalles a los abogados de la firma que cubren el sector o los clientes.
“Eso es un poco como magia”, dijo Lamanna, que contrasta este tipo de flujo de trabajo automatizado de IA con la forma en que tales tareas se realizan por lo general en la actualidad. “Revisas el sitio de SharePoint, abres un archivo nuevo, lo hojeas y tratas de resumirlo para ver si tienes que hacer algo con él. La AI saca a la gente de esta monotonía y hace que las computadoras hagan lo que es mejor para ellos de todos modos”.

Amante de la tecnología con 7 años de experiencia en el cubrimiento informativo de este sector en temas como telecomunicaciones, tecnología de consumo, dispositivos móviles y plataformas en Colombia.
Mi opinión sobre tecnología ha sido tomada por medios como La República o AS. Soy especialista productos de consumo masivo y reviews de hardware. Soy director de tecnogus.com.co