La technologie Wolfram devient un outil fondamental pour les systèmes LLM

par Stephen Wolfram
Article original

Les modèles fondamentaux ont besoin d’un outil fondamental

Les LLM ne font pas, et ne peuvent pas faire, tout. Ce qu’ils font est très impressionnant et utile. C’est vaste. Et à bien des égards, c’est semblable à l’humain. Mais ce n’est pas précis. Et au final, il ne s’agit pas de calcul profond.
Alors, comment pouvons-nous complémenter les modèles fondamentaux LLM ? Nous avons besoin d’un outil fondamental : un outil large et général qui fait ce que les LLM ne font pas eux-mêmes : fournir un calcul approfondi et des connaissances précises.
Et, de manière fort pratique, c’est exactement ce que je suis en train de construire depuis 40 ans ! Mon objectif avec Wolfram Language a toujours été de rendre calculable tout ce que nous pouvons concernant le monde ; de réunir de façon cohérente et unifiée les algorithmes, les méthodes et les données afin d’effectuer des calculs précis chaque fois que cela est possible. Cela a représenté un travail colossal, mais je pense qu’il est juste de dire que cela a été un immense succès qui a alimenté d’innombrables découvertes et inventions (y compris les miennes) dans un éventail remarquable de domaines de la science, de la technologie et au-delà.
Mais désormais, ce ne sont plus seulement les humains qui peuvent tirer parti de cette technologie ; ce sont aussi les IA, et en particulier les LLM. Les modèles fondamentaux des LLM sont puissants. Mais les modèles fondamentaux des LLM associés à notre outil fondamental le sont encore davantage. Et avec la maturation des LLM, nous sommes enfin maintenant en mesure de fournir aux LLM un accès à la technologie Wolfram de manière standard et généralisée.
C’est, je crois, un moment important de convergence. Mon concept au fil des décennies a été de construire une technologie très large et généralisée qui convient désormais parfaitement à l’étendue des modèles de base des LLM. Les LLM peuvent appeler des outils spécialisés spécifiques, et ce sera utile pour de nombreux objectifs spécialisés particuliers. Mais ce que Wolfram Language représente de manière unique, c’est un outil général, avec un accès général à la grande puissance que procurent les calculs précis et les connaissances.
Mais il y a en réalité bien plus encore. J’ai conçu Wolfram Language dès le départ comme un médium puissant non seulement pour effectuer des calculs, mais aussi pour représenter et réfléchir aux choses de manière computationnelle. J’avais toujours supposé que je faisais cela pour les humains. Mais il s’avère désormais que les IA ont besoin des mêmes choses, et que Wolfram Language fournit le médium parfait pour que les IA puissent « penser » et « raisonner » de manière computationnelle.
Il y a également un autre point. Dans son effort pour rendre calculable le plus de choses possible, Wolfram Language ne contient pas seulement une quantité immense d’éléments en son sein, mais fournit aussi un centre unifié unique pour se connecter à d’autres systèmes et services. Et c’est en partie pour cela qu’il est désormais possible d’établir une connexion aussi efficace entre les modèles fondamentaux des LLM et l’outil fondamental qu’est Wolfram Language.

Voici la technologie pour utiliser notre outil fondamental

Le 9 janvier 2023, quelques semaines seulement après que ChatGPT a fait irruption sur la scène, j’ai publié un article intitulé « Wolfram|Alpha, le moyen d’apporter les super pouvoirs de la connaissance computationnelle à ChatGPT ». Deux mois plus tard, nous avons publié le premier plugin Wolfram pour ChatGPT (et, entre-temps, j’ai écrit ce qui est rapidement devenu un petit livre plutôt populaire intitulé Que fait ChatGPT… et pourquoi cela fonctionne-t-il ?). Le plugin constituait un début modeste mais solide. Mais à l’époque, les LLM et l’écosystème qui les entourait n’étaient pas vraiment prêts pour une histoire plus ambitieuse.
Les LLM auraient-ils, au bout du compte, réellement besoin d’outils ? Ou, malgré les problèmes fondamentaux qui me semblaient, du moins selon moi, scientifiquement assez clairs dès le départ, les LLM trouveraient-ils d’une manière ou d’une autre, comme par magie, un moyen d’effectuer eux-mêmes des calculs approfondis ? Ou de garantir l’obtention de résultats précis et fiables ? Et même si les LLM devaient utiliser des outils, comment ce processus serait-il conçu, et quel en serait le modèle de déploiement ?
Trois années se sont désormais écoulées, et beaucoup de choses se sont clarifiées. Les capacités fondamentales des LLM sont apparues avec davantage de netteté (même si, scientifiquement, nous ignorons encore beaucoup de choses à leur sujet). Et il est devenu beaucoup plus clair que, du moins pour les modalités auxquelles les LLM s’attaquent actuellement, la majeure partie de la croissance de leur valeur pratique dépendra de la manière dont ils sont exploités et connectés. Et cette compréhension met plus que jamais en évidence l’importance considérable de fournir aux LLM l’outil fondamental que représente notre technologie.
Et la bonne nouvelle, c’est qu’il existe désormais des moyens rationalisés pour y parvenir, en utilisant des protocoles et des méthodes qui ont émergé autour des LLM, ainsi que de nouvelles technologies que nous avons développées. Plus l’intégration entre les modèles fondamentaux et notre outil fondamental est étroite, plus la combinaison sera puissante. En fin de compte, il s’agira d’aligner le pré-entraînement et l’ingénierie de base des LLM avec notre outil fondamental. Mais une approche qui est immédiatement et largement applicable aujourd’hui, et pour laquelle nous lançons plusieurs nouveaux produits, repose sur ce que nous appelons la génération augmentée par le calcul, ou CAG.
L’idée clé de CAG est d’injecter en temps réel les capacités de notre outil fondamental dans le flux de contenu que les LLM génèrent. Dans la génération augmentée par récupération traditionnelle, ou RAG, on injecte du contenu qui a été récupéré à partir de documents existants. La CAG est comme une extension infinie de la RAG, dans laquelle une quantité infinie de contenu peut être générée à la volée, au moyen du calcul, afin d’alimenter un LLM. En interne, la CAG est une technologie quelque peu complexe dont le développement nous a pris longtemps. Mais dans son déploiement, c’est quelque chose dont nous avons facilité l’intégration dans les systèmes et flux de travail existants liés aux LLM. Et aujourd’hui, nous le lançons, afin qu’à l’avenir tout système LLM, et tout modèle de base des LLM, puisse compter sur la possibilité d’accéder à notre outil fondamental et de compléter ses capacités grâce à la superpuissance d’un calcul et d’un savoir précis et approfondis.

Les aspects pratiques

Aujourd’hui, nous lançons trois méthodes principales pour accéder à notre outil de base, toutes basées sur la génération augmentée par le calcul (CAG) et exploitant toutes notre ensemble technologique d’ingénierie logicielle particulièrement vaste.

MCP Service

Service MCP

Appelez immédiatement notre outil de base depuis n’importe quel système basé sur un LLM compatible MCP. La plupart des systèmes basés sur un LLM destinés au grand public prennent désormais en charge MCP, ce qui rend sa configuration extrêmement simple. Notre principal service de MCP est une API web, mais il existe également une version pouvant utiliser Wolfram Engine.

API Agent One

Un « agent universel » tout-en-un combinant un modèle de base LLM avec notre outil de base. Conçu pour remplacer directement les API traditionnelles des LLM.

API des composantes de la CAG

Accès direct et granulaire aux technologies Wolfram pour les systèmes LLM, prenant en charge une intégration optimisée et personnalisée dans des systèmes LLM de toute taille. (Toutes les technologies Wolfram sont disponibles à la fois en version hébergée et sur site.)
Liste des capacités de l’outil de base de Wolfram »
Pour obtenir plus d’informations sur les options d’accès et d’intégration, contactez notre groupe de partenariats »