» » Gemini, le nouveau modèle de langage par Google DeepMind

Gemini, le nouveau modèle de langage par Google DeepMind



 

Nous côtoyons tous des intelligences artificielles dans notre quotidien. Que cela soit à travers notre GPS ou les recommandations Netflix. Pourtant, depuis l’ouverture au grand public des intelligences artificielles génératives* comme ChatGPT d'OpenAI à la fin de l’année 2022, tout semble s’accélérer dans ce domaine. C’est avec un rythme effréné que le nombre d’IA de ce type ne cesse d’augmenter. C’est dans ce contexte que le 6 décembre 2023, Google a annoncé le lancement de Gemini, sa dernière création en la matière. Celle-ci est décrite comme étant le modèle le plus avancé et le plus polyvalent jamais conçu par Google. Voyons cela de plus près…

Qu’est-ce que Gemini ?

Gemini est un modèle d’intelligence artificielle qui marque une étape importante dans le domaine de l’IA multimodale. Ce système se distingue des autres par sa flexibilité et sa grande polyvalence. Il serait capable de gérer de nombreuses tâches complexes. En effet, son approche multimodale lui permet de traiter et de comprendre des informations, qu’elles soient de type texte, code, audio, image et même vidéo !

Cette IA se décline en trois versions différentes afin de s’adapter à divers besoins. Commençons par la première : Gemini Ultra. Il s’agit de la plus grande et de la plus performante des trois, elle est conçue pour des tâches hautement complexes. Ensuite, vient Gemini Pro, une version optimisée pour s’adapter à une vaste gamme de tâches tout en offrant un niveau de performance conséquent. Et pour finir, nous avons Gemini Nano. La version la plus compacte qui a été conçue dans le but d’une utilisation mobile afin de pouvoir s’en servir plus aisément dans la vie de tous les jours.

Ces différentes versions montrent que Google souhaite rendre l’IA encore plus accessible par une intuitivité et une utilité accrue.

Les performances et capacités de ce modèle de langage

Pousser les limites de ce qui est techniquement possible semble faire partie intégrante de l’identité de Google. Avec des projets tels que TensorFlow ou des initiatives comme Google Brain, le géant s’inscrivait déjà comme  référence en matière d’IA. Gemini vient apporter sa brique à l’édifice de l’innovation dans ce domaine et représente l’aboutissement de recherches et de développements antérieurs.

La synergie créée par la collaboration entre plusieurs équipes au sein de l’entité a permis de développer un modèle de langage qui intègre une compréhension avancée du langage naturel, mais également une capacité à traiter et à combiner différents types d’informations comme nous vous l’exposions précédemment. Ce fonctionnement multimodal a permis la création d’un système d’IA qui peut comprendre et interagir avec le monde de façon plus naturelle et intuitive.

En termes de comparaison avec d’autres modèles de langage à grande échelle comme GPT-4, Gemini montrerait des performances supérieures dans plusieurs domaines suivant ses différentes versions : des scores plus élevés sur des tests de compréhension de l’image naturelle, une supériorité dans le domaine de la traduction automatique de la parole, des résultats impressionnants dans la compréhension vidéo, etc. Ces avancées semblent suggérer une évolution significative des capacités des IA dans le traitement et la compréhension de données complexes. Et ce, de manière plus naturelle et intuitive.

Vers une intégration du modèle aux offres Google

Ce nouveau modèle de langage est déjà disponible via le chatbot Bard. En effet, celui-ci s’est déjà vu amélioré par Gemini Pro. Toutefois, ce Bard « upgradé » n’est pas encore disponible en Europe. Eh oui, pour le moment, seuls 170 pays et territoires anglais peuvent y accéder. Il faudra donc s’armer de patience pour pouvoir le tester. Mais le chatbot n’est pas le seul à y avoir le droit : c’est aussi le cas du smartphone Google Pixel 8 Pro qui embarque désormais la version Gemini Nano dans certaines applications et services de messagerie.

Le géant du web ne compte pas s’arrêter en si bon chemin et prévoit l’intégration du modèle, dès 2024, dans d’autres de ses services comme Ads, Chrome ou Search. Il est également prévu un « Bard Advanced » qui embarquerait Gemini Ultra. En somme, l’année prochaine s’annonce riche en nouveautés ! Notamment en ce qui concerne les résultats de recherche et les publicités, où pertinence, personnalisation et précision accrues sont attendues.

En ce qui concerne la pertinence, sachez que nos services de rédaction web sont optimisés pour le référencement naturel. En d’autres termes, nous vous proposons des contenus de qualité qui pourront améliorer votre SEO. Alors, si vous souhaitez voir grimper votre site dans les résultats de recherche, contactez-nous !

*Intelligence artificielle générative : il s’agit d’un type d’IA en mesure de créer du contenu (texte, image, voire vidéo) en s’appuyant sur des prompts ou messages que l’utilisateur lui transmet.

Auteur de l'article
SHOP RÉDACTION