Dans la deuxième partie … « Hart » produit des images de haute qualité avec l’intelligence artificielle

La production efficace d’images de haute qualité est un défi très important pour les applications telles que l’auto-édition de formation automobile, les environnements de conception de jeux vidéo ou la simulation de scénarios du monde réel. Les modèles d’intelligence artificielle font de grands progrès dans la production d’images, tandis que les routes existantes sont toujours une comparaison entre la vitesse et la qualité.
Les modèles de diffusion utilisés dans « Dall-E » et « STABLE Diffusion » produisent des images incroyablement réalistes, mais nécessitent une grande puissance informatique et longtemps. D’un autre côté, des modèles autorisés similaires à ceux utilisés dans des modèles de grande langue tels que le chatppt produisent rapidement des images, mais sont souvent exposés à de beaux détails, ce qui conduit à des résultats déformés ou brumeux. Maintenant, un nouveau modèle d’intelligence artificielle, un nouveau modèle d’intelligence artificielle qui combine les avantages des deux méthodes pour fournir des images de haute qualité à des vitesses sans précédent, une équipe de chercheurs du Massachusetts Institute of Technology (MIT) et « Nvidia » Company « Hart ».
Meilleur de deux manières
« Hart » fonctionne sur un principe simple mais puissant. Tout d’abord, le modèle dessine rapidement le brouillon de l’image, puis une petite propagation annule les détails du modèle, alors qu’est-ce que cela signifie?
« Imaginez comme des dessins. » «Si la plaque entière est couverte à la fois, le résultat peut sembler brut. Cependant, si vous commencez par un dessin général, si vous le révisez avec un pinceau plus petit et plus précis, la dernière image devient plus de maîtrise. «
Les modèles de propagation traditionnels fonctionnent en faisant l’image pas à pas jusqu’à ce qu’une image claire apparaisse. Ce processus garantit une grande précision, mais consomme des sources lentes et importantes. D’un autre côté, les modèles Hart prédisent de petites pièces à la fois en produisant des photos dans une série. Bien que plus rapide, il perd généralement des détails importants en raison de la pression.
« Hart » comble cet écart à l’aide d’un modèle d’auto-échange pour faire face à la plus grande partie de la production d’image, puis applique un léger modèle de propagation pour améliorer les détails restants, c’est-à-dire pour développer les bons éléments tels que la texture des cheveux, l’éclat oculaire ou les bords minces des corps.
Vitesse sans sacrifier la qualité
L’une des réalisations les plus impressionnantes « Hart » est sa productivité. Les modèles d’expansion modernes nécessitent des dizaines d’étapes pour des milliards de paramètres et de révisions, tandis que « Hart » obtient des résultats similaires ou meilleurs avec une partie simple du coût de l’ordinateur.
Dans les tests, « Hart » a produit des photos neuf fois plus rapides que les principaux modèles de prolifération, tout en conservant le niveau de détail. Il est plus excitant, en utilisant 31% d’énergie informatique en moins, ce qui lui permet de fonctionner sur des appareils de consommation normaux tels que des ordinateurs portables ou des smartphones.
« La propagation du (Hart) a une tâche beaucoup plus simple … pas seulement toute l’image qui rend le processus plus efficace, il doit simplement corriger les détails », dit-il.
Ouvrir de nouveaux horizons
Les effets de « Hart » ne s’étendent qu’au-delà de la production d’images plus rapides. La conception hybride peut être adaptée à l’intégration avec des systèmes d’intelligence multimédia tels que la vision et les modèles de langage qui peuvent expliquer et produire du texte et des images ensemble.
Lors de l’installation d’un assistant intelligent, lors de l’installation d’un meuble, considérez-vous pour vous guider avec un écran visuel pour chaque étape en temps réel, ou pour éviter les risques inattendus avant d’atteindre la route. La vitesse et la précision de « HART » ont fait ces pratiques non seulement un processus, mais aussi un processus.
À l’avenir, les chercheurs prévoient d’élargir leurs capacités « Hart » pour inclure la production vidéo et l’installation audio et bénéficier de la conception d’expansion pour des tâches plus complexes.
Un pas vers l’intelligence intelligente
« Hart » représente un saut majeur dans le domaine de l’intelligence obstétricale, indiquant que la vitesse et la qualité ne devraient pas être contradictoires. Grâce à la combinaison intelligente des aspects forts des modèles auto-protecteurs et des modèles de propagation, les chercheurs ouvrent de nouvelles portes pour produire des images haute résolution en temps réel et nous rapprocher d’un avenir dans lequel l’intelligence artificielle peut intégrer la créativité et l’efficacité sans aucun problème.
Pour l’intelligence artificielle, cette recherche, soutenue par le Laboratoire « MIT-IBM Watson », « MIT » et « Amazon Sciences » et l’American National Science Foundation, sera présentée à la Conférence internationale des représentants de l’éducation. Avec plus de développement, « Hart » peut bientôt être la pierre angulaire des pratiques d’intelligence artificielle de la génération future, et recrée un moyen d’interagir et de bénéficier de l’intelligence artificielle.