IA está disponível para clientes do Google Cloud Vertex; nova geração traz “fotos” mais realistas e pode mostrar futuro do Bard
O Google anunciou nesta quarta-feira (13) o Imagen 2, nova (e segunda) geração do seu modelo de IA para criação de imagens. Essa inteligência artificial só está disponível para os clientes do Vortex AI, um serviço disponível do Google Cloud. Nas prévias mostradas pela big tech, o Imagen 2 entrega resultados ultrarrealistas.
O Google também afirma que o Imagen 2 teve a sua compreensão de prompts melhoradas, o que deve levar o usuário a atingir os resultados desejados (ou o mais próximo possível disso).
Imagens 2 treinou com a leitura de legendas
No anúncio oficial do Imagen 2, feito no site do DeepMind, subsidiária do Google, a empresa revela que para aprimorar o entendimento dos prompts, trabalhou em ampliar a descrição das imagens usadas no treinamento da IA. Segundo o Google, isso permitiu ao Imagen 2 melhorar a compreensão do contexto e nuances dos comandos.
O modelo de IA usado na ferramenta recebeu ainda um “treinamento especializado” em estética baseado nas preferências humanas. O Google criou uma escala de estética (o popular instagramável) para cada imagem, levando em consideração fatores como iluminação, tempo de exposição, enquadramento e nitidez. A empresa afirma que isso permite que o Imagen 2 gere imagens de qualidade ainda maior.
Essa habilidade, somado ao exemplo dado pelo Google, levanta uma questão: em quanto tempo as IAs estarão presente nos feeds das rede sociais através das belas imagens instagrameáveis? Imagens de pessoas estão cada vez mais realista, mas por que alguém se interessaria em publicar uma foto de outra pessoa ou alguém parecido? Imagens de belas paisagens seguem mais atrativas para likes.
Imagen conta com ferramenta para reconhecer suas imagens
Um diferencial da IA do Imagen é que ela possui uma marca d’água que reconhece imagens feita por ela mesmo. Essa tecnologia do Google cria um identificador nos pixels das fotos e artes criadas pela inteligência artificial e, segundo a empresa, não pode ser removido de nenhuma maneira. Assim, um usuário pode subir uma imagem para o Imagen e ele identificará se foi feito por IA ou não.
O ponto negativo para o Imagen é que ele segue restrito aos clientes do Google. O Bard ainda não é capaz de gerar imagens (apesar dele dizer que sim, ele apenas pesquisa por elas no Google). A IA generativa do Google utiliza o LLM Gemini, mas os planos do Google para levar a criação de imagens para o Bard são desconhecidos. Todavia, o Imagen já dá uma prévia do que podemos ver no futuro (distante ou próximo).
Fonte: Tecnoblog