L’intelligence artificielle dans la création d’images
L’intelligence artificielle (IA) fascine une certaine partie de la population par l’imaginaire qu’elle suscite. Elle est utilisée dans la retouche d’image pour améliorer et automatiser certains aspects du processus. Voici quelques exemples d’utilisation de l’IA dans ce domaine :
Restauration automatique d’images
L’IA peut être utilisée pour restaurer automatiquement des images endommagées, vieillies ou de mauvaise qualité. Les algorithmes d’IA peuvent analyser les défauts de l’image, tels que les rayures, les taches ou les décolorations, et les corriger de manière intelligente. Cela permet de récupérer des détails perdus, d’améliorer la clarté et la qualité générale de l’image.
Suppression automatique d’objets indésirables
L’IA peut aider à supprimer automatiquement des objets indésirables d’une image. Par exemple, si une personne ou un objet gêne l’arrière-plan d’une photo, l’IA peut analyser l’image, détecter l’objet indésirable et le supprimer de manière intelligente tout en conservant la cohérence visuelle de l’image.
Amélioration automatique des couleurs et de l’éclairage
Les algorithmes d’IA peuvent ajuster automatiquement les couleurs et l’éclairage d’une image pour obtenir un rendu plus attrayant. Ils peuvent équilibrer les tons, améliorer la saturation des couleurs, ajuster les niveaux de contraste et optimiser la luminosité globale de l’image.
Reconnaissance et classification automatiques d’objets :
L’IA peut être utilisée pour reconnaître automatiquement les objets présents dans une image. Les algorithmes d’apprentissage automatique peuvent être entraînés à détecter et à classifier différents types d’objets, tels que des personnes, des animaux, des bâtiments, des véhicules, etc. Cette fonctionnalité peut être utilisée dans des applications telles que le tri automatique d’images en fonction de leur contenu ou la recherche d’images basée sur des objets spécifiques.
Génération automatique d’images :
1- Unbound.ai et Assembo.ai se valent. Elles sont 2 IA en ligne fonctionnant par moteur de recherche par prompt replace un photographe et son studio photo.
L’art du «prompting» est une suite d’ instructions données au logiciel pour la génération d’une image. Un champs de saisie permet de décrire le sujet. Exemple de la simplicité de l’outil :
- 1- Upload de la photo de votre choix (produit, personne,…) dans l’application pilotée par l’algorithme, une verre par exemple
- 2- l’application va reconnaitre le verre et supprimer le fond derrière
- 3- On créé un prompt « sur une table au bord de l’eau », l’image est génèrée en quelques secondes
Voici le rendu sur Assembo.ai, une très bonne alternative lorsque l'on a pas les moyens de s'offrir un shooting photo.
2- Midjourney (payant)
Midjourney, un outil d’IA très puissant basé sur Discord (logiciel propriétaire gratuit de VoIP et de messagerie instantanée), s’avère très pratique pour la création de publicités et la mise en place de campagnes SEO. Les développeurs de jeux vidéo peuvent eux aussi se servir de la plateforme pour générer, par exemple, des images de synthèse photoréalistes des décors, des objets et même des personnages.
3- Lexica.art (payant)
permet de dessiner depuis un prompt une illustration, de n’importe quel sujet, dans n’importe quel style, d’une manière déconcertante et super léchée.
L’algorithme propose également l’IA de Stable Diffusion.
4- Stable diffusion XL de Clipdrop by stability.ai permet de générer les images à partir d’un simple texte (gratuit)
- Open-source : De nombreux passionnés ont créé des outils et des modèles gratuits.
- Conçu pour les ordinateurs à faible consommation d’énergie : son fonctionnement est gratuit ou bon marché.
- Stable Diffusion est gratuit lorsque vous l’exécutez sur vos propres machines Windows ou Mac . Un service en ligne vous coûtera probablement des frais modestes car quelqu’un doit vous fournir le matériel sur lequel fonctionner.
Ci-dessous, photo générée par l'IA de Stable diffusion avec le prompt "voiture sous l'eau"
Ci-dessous, photo générée par l'IA de Stable diffusion avec le prompt "mi-poisson, mi-chien
Ci-dessous, photo générée par l'IA de Lexica Aperture V3 avec le prompt "inondation dans la salle de bain, poisson, enfant nage". On constate une légère anomalie de la main droite du bébé.
Ci-dessous, photo générée par l'IA de Stable diffusion avec le prompt "mi-poisson, mi-chien
Le retoucheur d’images :
1- Produit d’Adobe, Photoshop Generative Fill est la première version avec l’IA. Le champs des possibles est plus limité que ses concurrents. Toutefois, on peut compter sur Adobe, société d’excellence dans les logiciels des arts graphiques pour faire évoluer son logiciel de retouche d’image emblématique lancé en 1990. Quelques fonctions intéressantes émergent :
Le remplissage génératif d’un objet avec un calque :
- on importe sa photo
- on sélectionne la zone de la photo qui nous intéresse à modifier
- une fenêtre surgissante avec un champs de saisie apparait pour donner les instructions (prompt), par exemple photo d’un paysage, on veut y ajouter une ville. On rentre en anglais « City », IA va proposer 3 propositions, on choisi celle que l’on veut garder. Celle-ci apparait sur un nouveau calque.
Le remplissage génératif d’un fond :
La photo est verticalisée, on souhaite avoir une image en 16/9 à l’horizontal mais le fond sur les côté n’existe pas. L’AI va le recréer pour nous.
- 1- On agrandi donc la « taille du plan de travail de l’image » ce qui créera 2 zones transparentes de part et d’autre de l’image centrée
- 2- On sélectionne la zone de la photo et intervertit la sélection pour que les 2 zones transparentes soient sélectionnées
- 3- On appuie sur générer sur la fenêtre surgissante où se trouve un champs de saisie (prompt) sans rien saisir.
- 4- On finalise avec l’outil supprimer
2- Concurrent de Photoshop generative fill, l’IA Dragan se montre plus puissante et est gratuite. En effet, elle est développée par la communauté Open source Hugging Face.
- La retouche de photos en quelques clics sans aucune compétence.
- Dragan peut changer des expressions du visage pour exprimer des émotions différentes, modifier des postures du corps humain, changer d’angle le visage…
- On peut tout retoucher. Pour un magazine de mode, par exemple, l’IA permet de changer la longueur de la robe, la position du bras du manequin sans aucune compétence,…
Génération automatique de vidéos :
1- Wonder dynamics est un outil qui permet de faire des animations complexes en quelques secondes à partir de personnages entièrement
2- ControlNet v1.1 de huggingface.co qui permet d’animer des images en seulement quelques secondes pour générer des images pour en faire du contenu marketing. Exemple placer l’isotype du logo Nike en forme de virgule inversée.
3- D-ID.com
chat.D-ID est une application Web d’un avatar. Elle utilise l’animation faciale en temps réel et la synthèse vocale avancée pour créer une expérience d’IA conversationnelle immersive et humaine.
Exemple de création d'une image animée de 60 secondes d'un avatar 3D ultra réaliste sur la base d'un prompt
1- Vous êtes habitué avec l’IA de Midjourney. Ne changez rien. Faites votre partir d’une description textuelle, la photo de l’avatar est générée « un jeune homme brun avec les yeux bleu » . Par défaut l’outil travaille à l’horizontal. Pour choisir un format d’une image verticale, il est nécessaire d’entrer un paramètre de ratio 16/9 e dans le prompt « –ar 9:16 »
2- Rendez-vous sur D-ID.com, à partir d’un simple texte ou audio, en 6 étapes et quelques secondes, l’humain numérique parle avec un naturel déconcertant !
- 1- Créer une vidéo
- 2- uploder/Télécharger l’ image du personnage généré sur Midjourney ou choisissez en un depuis D-ID
- 3- Télécharger un enregistrement audio ou saisir le texte
- 4- Choix de la langue
- 5- Choix d’une voix existante ou choix de sa propre voix
- 6- tester l’aperçu puis générer la vidéo. L’avatar prend vie ! L’IA créé un mouvement labial, produit le clignement des paupières, génère une émotion en fournissant une expression faciale et réalise des rotations légères du visage.
Cet outil est de plus en plus utilisé pour des supports de formation, du contenu marketing. L’outil devient très intéressant pour des présentations multilangues. Les coûts et les tracas de production sont fortement réduits, la vidéo est personnalisée à grande échelle, dans plus de 100 langues, sans aucune connaissance technique.
Il est possible dans les fonctions avancées de cloner sa propre voix.