2024 sera l'année de l'IA générative pour Apple : de nombreuses nouvelles fonctions basées sur l'intelligence artificielle sont attendues intégrées dans iOS 18 et, en plus des spéculations habituelles dans la presse, même Tim Cook lui-même a confirmé que cette année il y aurait beaucoup de nouveautés dans ce sens. Nous ne savons pas s'il fera partie de cette révolution basée sur l'IA, mais il y a quelques jours, Apple a publié un nouveau modèle d'intelligence artificielle open source qui permet d' éditer des photos via une requête texte . Le modèle en question, appelé MGIE (MLLM-Guided Image Editing) est un projet de recherche d'Apple en collaboration avec l'Université de Californie, qui permet de recadrer, redimensionner, ajouter des filtres et même modifier le sujet d'une image simplement en écrivant le résultat que vous souhaitez atteindre. Le modèle en question fusionne deux types de modèles différents : dans un premier temps, il interprète le langage de l'utilisateur et comprend ce qu'il souhaite réaliser, puis il « imagine » le résultat et applique les changements. Dans le document avec lequel MGIE a été présenté, il y a plusieurs exemples assez explicatifs, que vous pouvez voir résumés dans l'image ci-dessous. Par exemple, la demande de rendre une pizza au salami « plus saine » est très intéressante, ce qui donne une pizza aux tomates et aux légumes (s'agirait-il de brocoli ou de pesto ?).
MGIE est disponible en projet open source sur GitHub ; De plus, une démo en ligne est disponible pour essayer d'expérimenter, même s'il s'agit d'une version très limitée. Pour le moment, il est peu probable que MGIE soit mis en œuvre dans l’immédiat par Apple, mais il est intéressant d’imaginer ce que cela pourrait conduire dans le futur. Par exemple, il est possible d'imaginer un scénario pas trop lointain dans lequel pour éditer une photo il suffirait de demander à Siri : supprimer un arrière-plan, augmenter la luminosité ou éliminer une voiture supplémentaire d'un beau panorama pourrait devenir une demande immédiate, non trop différent de Hey Siri, règle une alarme sur dix . Cet avenir n'est pas encore imminent, mais il est certainement possible : en attendant, rendez-vous est fixé à la WWDC en juin, pour voir ce qu'Apple nous réserve avec les premières innovations basées sur l'IA d'iOS 18.
MGIE est disponible en projet open source sur GitHub ; De plus, une démo en ligne est disponible pour essayer d'expérimenter, même s'il s'agit d'une version très limitée. Pour le moment, il est peu probable que MGIE soit mis en œuvre dans l’immédiat par Apple, mais il est intéressant d’imaginer ce que cela pourrait conduire dans le futur. Par exemple, il est possible d'imaginer un scénario pas trop lointain dans lequel pour éditer une photo il suffirait de demander à Siri : supprimer un arrière-plan, augmenter la luminosité ou éliminer une voiture supplémentaire d'un beau panorama pourrait devenir une demande immédiate, non trop différent de Hey Siri, règle une alarme sur dix . Cet avenir n'est pas encore imminent, mais il est certainement possible : en attendant, rendez-vous est fixé à la WWDC en juin, pour voir ce qu'Apple nous réserve avec les premières innovations basées sur l'IA d'iOS 18.
Liens
Lien (341 Clics)
Plus d'actualités dans cette catégorie