
Avis éditorial : En tant que musicien électronique de longue date (et ancien rédacteur en chef des magazines Electronic Musician et Music Technology), j’ai toujours été fasciné par les synthétiseurs musicaux. Utilisant un ensemble spécialisé de circuits, ces instruments sont conçus pour générer une énorme quantité de sons intéressants à partir de matériel audio brut relativement basique. L’ensemble d’outils d’IA génératifs en croissance rapide d’aujourd’hui partage des similitudes intéressantes à plusieurs égards en ce sens qu’ils peuvent synthétiser un contenu très impressionnant à partir de combinaisons de simples « jetons » de mots (bien que sur des milliards !). Les outils d’IA générative sont, dans un sens très réel, des synthétiseurs de contenu.
La dernière entrée dans la mêlée de synthèse de contenu vient de Google, qui apporte une gamme impressionnante nouvelles capacités du marché via des mises à jour de Google Cloud et de sa suite de productivité Google Workspace (Workspace, anciennement connu sous le nom de G Suite, comprend Gmail, Google Calendar, Google Drive, Google Docs et Google Meet).
Après avoir laissé Microsoft prendre une grande partie du Attention ces dernières semaines avec le partenariat ChatGPT d’OpenAI – au point où des articles remettant en question les ambitions génératives de Google en matière d’IA ont même commencé à apparaître – il est clair que l’entreprise longtemps considérée comme un leader de l’IA ne s’est pas reposée sur ses lauriers. Les débuts d’aujourd’hui proposent un ensemble complet d’applications, de services et de nouvelles approches passionnantes qui montrent clairement que Google n’a pas l’intention de laisser le marché de l’IA générative à qui que ce soit.
La société a introduit plusieurs nouvelles fonctionnalités pour Google Cloud, une nouveauté Générateur d’applications d’IA générative pour les développeurs professionnels, fonctionnalités à venir pour toutes les applications de productivité dans Google Workspace, Maker Suite pour les “développeurs citoyens” moins expérimentés, nouveauté Palmier grand modèle de langue (LLM) et la possibilité d’intégrer des applications tierces et LLM dans sa collection d’offres.
Franchement, c’est une quantité écrasante d’informations à assimiler sur une seule configuration, mais si rien d’autre, cela prouve que beaucoup de gens chez Google travaillent là-dessus depuis longtemps.
(intégré)https://www.youtube.com/watch?v=Q1zF9pF6flw(/intégré)
Cependant, toutes les fonctionnalités ne seront pas disponibles immédiatement. Google a défini une vision pour certaines des choses qu’il a maintenant et a partagé où il se dirigeait à l’avenir, mais dans le marché incroyablement dynamique qu’est l’IA générative, la société s’est clairement sentie obligée de faire une déclaration.
Certains des aspects les plus intéressants de la vision de Google en matière d’IA générative impliquent l’ouverture et la capacité de collaborer avec d’autres entreprises. Par exemple, Google a évoqué l’idée d’un modèle “zoo” de base où différents LLM pourraient être connectés à différentes applications. Ainsi, bien que vous puissiez certainement utiliser les nouveaux modèles de texte Pathways Language Model (PaLM) de Google ou les modèles de chat PaLM dans les applications d’entreprise via des appels d’API, par exemple, vous pouvez également utiliser d’autres LLM tiers ou même open source à la place.
Le niveau de flexibilité avec les différents LLM était impressionnant, même si je ne pouvais pas m’empêcher de penser que les services informatiques des entreprises pourraient rapidement être submergés par la gamme d’options disponibles. Compte tenu des exigences inévitables en matière de test et de conformité, il pourrait être utile de limiter le nombre d’options que les organisations peuvent utiliser (au moins au début).
Google a mis l’accent sur la capacité des organisations à intégrer leurs propres données au-dessus du LLM de Google pour les adapter aux besoins uniques de l’organisation. Par exemple, les entreprises pourraient injecter une partie de leur propre contenu original, images, styles, etc. dans un LLM existant, et ce modèle personnalisé pourrait alors être utilisé comme principal moteur de génération d’IA pour les applications de synthèse de contenu de l’organisation. Ces personnalisations pourraient s’avérer particulièrement attrayantes pour de nombreuses organisations.
Il y a également eu de nombreuses annonces concernant les partenariats que Google a avec une variété de fournisseurs, des startups d’IA peu connues comme AI21Labs et Osmo aux développeurs à croissance rapide comme le fabricant d’outils de génération de code Replit ou les développeurs LLM Anthropic et Cohere. Du côté des images génératives, ils ont mis en avant le travail avec Midjourney, qui permet non seulement la création initiale d’images à l’aide de descriptions textuelles, mais aussi l’édition et le réglage fin du texte.
Google s’est également assuré de mettre l’accent sur la personnalisation dans les modèles existants. La société a montré comment les individus peuvent ajuster divers paramètres de modèle dans le cadre de leur requête initiale pour définir le niveau de précision, de créativité et plus qu’ils peuvent attendre de la sortie. Malheureusement, dans le style classique de Google, des termes très techniques ont été utilisés pour certains de ces paramètres, ce qui ne permet pas de savoir si les utilisateurs ordinaires peuvent réellement les comprendre. Cependant, le concept est génial et heureusement, la formulation des paramètres peut être ajustée.
Il est vrai que d’autres outils d’IA générative ont montré ce genre de capacités, mais le modèle d’interface utilisateur et l’expérience globale que Google a montrés semblaient très intuitifs.
Certaines des démos de contenu les plus intéressantes illustrées par Google pour Workspace incluaient la possibilité de modifier le contenu existant (disons d’un ton écrit plus formel à un ton plus décontracté) ou d’extrapoler à partir d’une invite de saisie relativement limitée. Il est vrai que d’autres outils d’IA générative ont déjà montré ce type de capacités, mais le modèle d’interface utilisateur et l’expérience globale que Google a montrés semblaient très intuitifs.
(intégré)https://www.youtube.com/watch?v=6DaJVZBXETE(/intégré)
Parmi les principales fonctionnalités d’IA à venir dans Workspace, Google met en avant :
- suggérer, répondre, résumer et hiérarchiser votre Gmail
- brainstorming, relecture, écriture et réécriture dans Documents
- donnez vie à votre vision créative avec des images, du son et de la vidéo générés automatiquement dans Slides
- passez des données brutes aux informations et à l’analyse avec l’auto-complétion, la génération de formules et la catégorisation contextuelle dans les tableaux
- créer de nouveaux arrière-plans et enregistrer des notes dans Meet
- activer les flux de travail pour faire des choses dans le chat
En plus des logiciels, Google a abordé le côté matériel de l’infrastructure Google Cloud, qui est capable de prendre en charge tous ces efforts pour Vertex AI et Workspace. La société a noté combien de ces charges de travail sont entraînées par différentes combinaisons leur propre TPU Ainsi que GPU Nvidia puissant. Alors qu’une grande partie de l’accent mis sur les applications d’IA générative a été uniquement logicielle, il ne fait aucun doute que les innovations matérielles dans les semi-conducteurs et les serveurs continueront d’avoir un impact majeur sur le développement de l’IA.
Revenant à l’analogie du synthétiseur, le LLM avance que les nouvelles offres de Google mettent en évidence à bien des égards la variété des différents moteurs audio et architectures utilisés pour les concevoir. Tout comme il existe de nombreux types de synthés dont les principales différences proviennent du matériau source brut utilisé dans le moteur sonore et du flux de signal qu’ils traversent, je m’attends à plus de variété dans les LLM de base. Il y aura probablement une variété de matériaux sources utilisés pour différents modèles et différentes architectures à travers lesquels ils seront traités. De même, le degré de “programmabilité” est susceptible de varier considérablement, d’un nombre modeste d’options prédéfinies à la flexibilité totale (mais potentiellement écrasante) de la modularité – tout comme dans le monde des synthés.
En termes de disponibilité, de nombreuses nouvelles fonctionnalités de Google sont initialement limitées à un ensemble de testeurs de confiance, et les prix (et même les options d’achat) de ces services ne sont toujours pas annoncés.
Pour les utilisateurs occasionnels, certains des outils de génération de contenu textuel dans Docs et Gmail seront probablement le premier aperçu de l’IA générative pilotée par Google que beaucoup connaîtront probablement. ET comme MicrosoftLes futures itérations et améliorations viendront sans aucun doute à un rythme très rapide.
Il ne fait aucun doute que nous sommes entrés dans une nouvelle ère extrêmement passionnante et compétitive dans le domaine de l’informatique d’entreprise et du monde technologique en général. Les outils d’IA générative ont alimenté un éventail impressionnant de nouvelles applications potentielles et d’améliorations de la productivité auxquelles nous commençons à peine à réfléchir. Comme pour de nombreuses grandes tendances technologiques, il y a une surmultiplication inévitable. Mais il est également clair que Google a maintenant fermement implanté sa participation dans le monde en évolution rapide des outils et services d’IA générative. Ce qui se passera ensuite n’est pas clair, mais ce sera incroyablement excitant à regarder.
Bob O’Donnell est le fondateur et analyste principal de la société TECHnalysis Research, LLC une société de conseil en technologie qui fournit des services de conseil stratégique et d’étude de marché à l’industrie technologique et à la communauté financière professionnelle. Vous pouvez le suivre sur Twitter @bobodtech.