A inteligência artificial enfrenta desafios na criação de mãos realistas
A inteligência artificial tem mostrado avanços significativos na geração de imagens foto-realistas e na replicação de rostos de celebridades em diferentes estilos artísticos. No entanto, quando se trata de desenhar mãos, as ferramentas acessíveis, como Midjourney, Stable Diffusion e DALL-E, falham em criar apêndices convincentes.
O desafio de desenhar mãos é um dos maiores na arte figurativa, e a inteligência artificial enfrenta problemas semelhantes ao tentar reproduzi-las. As imagens geradas pelas máquinas resultam em apêndices assustadores, com dúzias de dedos ou polegares em ângulos impossíveis, lembrando diagramas em livros de medicina ou algo extraterrestre.
Essa inadequação das máquinas para essa tarefa se deve em parte à sua capacidade limitada para extrapolar informações dos conjuntos de dados nos quais foram treinados e entender formas orgânicas complexas holisticamente. Além disso, a A.I ainda é limitada a padrões prévios que aprendeu em seus dados prévios e pode criar algo próximo ao real, mas imperfeito. É difícil para as máquinas identificarem elementos complexos e pouco familiares, como uma imagem de “mãos descascando uma laranja espiral debaixo d’água no estilo alienígena Picasso”.
Propostas para melhorar o aprendizado das máquinas
Uma proposta para melhorar o aprendizado das máquinas seria treiná-las com conjuntos especializados estatísticos criados especificamente para determinado resultado. Outra opção seria adicionar representações tridimensionais aos conjuntos de dados de A.I., já que atualmente não existe nenhum equivalente 3D tão bem rotulado quanto o arquivo livre Getty Images treinado na convenção do 2D. Em dezembro do ano passado, a startup OpenAI divulgou um artigo provocando uma ferramenta que cria modelos tridimensionais.
Ao escrever prompts (linguagem natural) para geradores A.I., muitas vezes os usuários são muito vagos sobre que tipo de imagens estão procurando e como gostariam que elas aparecessem. Algumas sugestões incluem imaginar o rótulo nas imagens usadas no treinamento da rede neural ou nomear gestos reconhecíveis (como um punho cerrado). No entanto, muitas vezes é necessário inserir intervenção humana na figuração final, caso necessário fornecer mais detalhes específicos da imagem solicitada.
Conclusão
Apesar dos avanços das ferramentas geradoras de deep fake, a criação de mãos realistas ainda é um desafio para a inteligência artificial. É necessário continuar explorando novas abordagens e técnicas para melhorar o aprendizado das máquinas e torná-las capazes de reproduzir com mais precisão formas orgânicas complexas, como as mãos humanas.
Notícia | O exercício clássico nas aulas de arte do ensino médio consiste em desenhar uma mão com um lápis de carvão, enquanto a outra mão fica na frente da pessoa com os dedos relaxados. |
---|---|
Desafios da inteligência artificial | Ferramentas acessíveis, como Midjourney, Stable Diffusion e DALL-E, são capazes de renderizar paisagens foto-realistas e copiar rostos celebridades ou personalidades em qualquer estilo de artista. No entanto, quando se trata de mãos, essas ferramentas geram apêndices assustadores: mãos com dúzias de dedos ou polegares em ângulos impossíveis. |
Causas da inadequação das máquinas | A capacidade limitada das máquinas para extrapolar informações dos conjuntos de dados maciços nos quais foram treinados e entender formas orgânicas complexas holisticamente. |
Propostas para melhorar o aprendizado das máquinas | Treinar as ferramentas com conjuntos especializados estatísticos criados especificamente para determinado resultado ou adicionar representações tridimensionais aos conjuntos de dados de A.I. |
Intervenção humana | Muitas vezes é necessário inserir intervenção humana na figuração final, caso necessário fornecer mais detalhes específicos da imagem solicitada. |
Com informações do The New Yorker.