Accueil High-Tech Google dévoile IMAGE, une nouvelle IA pour créer des images ultra-réalistes

Google dévoile IMAGE, une nouvelle IA pour créer des images ultra-réalistes

140
0

PARIS, 25 Mai (Bénin Actu/EP) –

Google a dévoilé une nouvelle technologie appelée IMAGE, un modèle basé sur l’intelligence artificielle (IA) capable de créer des images très réalistes à partir de courtes descriptions textuelles.

IMAGE est capable de convertir en images des mots ou de courtes descriptions, comme « un petit cactus avec un chapeau de paille et des lunettes de soleil fluo dans le désert du Sahara » ou « un chien poméranien assis sur le trône du roi avec une couronne et deux soldats tigres à ses côtés ».

A cette fin utilise le transformateur de transfert de texte à texte (T5).un modèle introduit en 2020 et capable à l’origine d’unifier l’entrée et la sortie de chaînes de texte. Aujourd’hui, cependant, il a été modifié pour effectuer la synthèse d’images.

S’il est vrai que, à l’origine, l’IA produit des images d’une résolution de 64 x 64 pixelssa technologie est capable de les mettre à l’échelle d’abord à 256 x 256 pixels, puis à 1024 x 1024 pixels, générant ainsi un modèle de diffusion en cascade.

Lire aussi:  Le realme GT Neo 3 promet de charger 50% de la batterie en 5 minutes grâce à son système UltraDart de 150W.

L’une des prémisses d’IMAGE est de fournir des résultats avec un niveau de détail plus précis par rapport à d’autres systèmes similaires de conversion texte-image, tels que. VQ-GAN+CLIP y DALL-E 2.

À cette fin, elle a présenté « un test de référence complet et exigeant pour les modèles texte-image » appelé. DrawBenchqui compare le modèle de Google avec ceux mentionnés ci-dessus.

Ce repère sert à tester comment les aspects relatés dans le texte, tels que la composition, sont amenés aux images, fidélité, cardinalité, et les relations spatiales des objets.

L’entreprise a mis en évidence certains points forts de la recherche en imagerie effectuée pour développer cette IA, notamment le développement de la nouvelle architecture propriétaire Efficient U-Netqui est plus efficace en termes de calcul et de mémoire.


TOUJOURS EN COURS DE DÉVELOPPEMENT

Google a annoncé que, pour l’instant, cette IA n’est ni open source ni accessible à tous. Cette décision découle de la risques potentiels d’une mauvaise utilisation par les utilisateurs.

Ce faisant, elle a reconnu que les premiers tests effectués avec cette IA ont permis des avancées algorithmiques rapides. grâce à des données extraites de l’Internet et qu’il y a encore beaucoup de place pour l’amélioration.

Lire aussi:  Cyberpunk 2077 recevra une nouvelle histoire dans une extension majeure à venir.

À cet égard, il a souligné que ces données ne reflètent pas la diversité, mais se sont concentrées sur « les stéréotypes sociaux, des vues oppressives et des associations désobligeantes ou nuisibles avec des groupes d’identité marginalisés ».

Il a également souligné que, bien qu’ils aient gardé un contrôle pour filtrer les données qu’ils ont recueillies pour leurs premiers tests avec IMAGE, l’ensemble des données LAION-400M utilisé maintient « un contenu inapproprié, notamment des images pornographiques, des insultes racistes et des stéréotypes sociaux nuisibles ».

Il convient de rappeler qu’il y a quelques semaines, la société de recherche en IA à but non lucratif OpenAI a présenté DALL-Eson nouveau système d’IA qui peut également convertir des mots en images réalistes.

Cette technologie permet de modifier des photographies sur la base d’une demande écrite. Dans le cadre de cette fonction, il est possible de supprimer des éléments tels que les ombresles reflets et les textures.

Article précédentAu moins un mort et deux blessés à Lumaco pendant l’état d’urgence dans le sud du Chili
Article suivantBadosa balaie Ferro pour ses débuts à Paris