Inteligência artificial cria imagens e textos a partir de descrições simples
A técnica de “engenharia de prompt” tem sido utilizada cada vez mais na criação de imagens e textos através da inteligência artificial (IA). Ferramentas como o software Dall-E e o ChatGPT, desenvolvidos pela OpenAI, têm fascinado o público com suas interpretações quase perfeitas de sugestões simples.
No início deste ano, a OpenAI disponibilizou em edição limitada o software Dall-E, que permitia aos usuários inserir uma descrição simples de uma imagem que tinham em mente. Após uma breve pausa, o software produzia uma interpretação quase perfeita de sua sugestão. Quando lançado globalmente, os usuários enlouqueceram com as criações estranhas e maravilhosas produzidas pela ferramenta.
A técnica de engenharia de prompt consiste em estruturar instruções de forma clara para que o sistema entenda corretamente as expectativas e atenda às necessidades do usuário. Espera-se que essa técnica seja uma descrição almejada e rentável no futuro “no code” (sem necessidade de programar).
Outras ferramentas surgiram seguindo os passos do Dall-E, como Dall-E mini (posteriormente renomeado Craiyon), Midjourney (independente) e Stable Diffusion (código aberto) usaram abordagens diferentes para classificar e gerar imagens seguindo fins semelhantes aos do Dall-E sobre curtos vídeos e modelos 3D etc.
De modo geral, podemos dizer que essa nova onda de IA capturou a imaginação popular juntamente com outros interesses similares vinculados à divulgação da tecnologia na atualidade. A IA já havia sido experimentada nas formas precisas desajeitadas na época dos chatbots Eliza em 1964 entre outros. A maior diferença dos dias atuais está nos dados disponíveis coletados pelas companhias da Tecnologia ao longo dos anos. Estados Unidos e Alemanha fornecem vasta base informativa para treinar grandes modelos de IA.
Ferramentas de IA precisam ser trabalhadas por meio do aprendizado profundo
Em suma, os geradores de visuais com IA precisam ser trabalhados por meio do aprendizado profundo inicial conectando bilhões de dados rotulados referente às metadados text.
Notícia | Laboratório OpenAI disponibiliza software Dall-E, que permite criar imagens a partir de descrições simples |
---|---|
Data | Início de janeiro de 2021 |
Funcionamento | Usuário insere descrição simples de uma imagem e o software produz uma interpretação quase perfeita |
Outros produtos | Dall-E mini (Craiyon), Midjourney e Stable Diffusion surgiram posteriormente |
Engenharia de prompt | Técnica de estruturar instruções para que o sistema entenda corretamente as expectativas |
Futuro | Expectativa de que a engenharia de prompt seja rentável no futuro “no code” |
Com informações do The Guardian.