ChatGPT : OpenAI réduit de moitié les prix d'accès à ses API et corrige le problème de « paresse » dans les réponses de GPT-4

L'entreprise présente de nouveaux modèles aux développeurs

Le 26 janvier 2024 à 16:59, par Stéphane le calme

35PARTAGES

ChatGPT : OpenAI réduit de moitié les prix de GPT et corrige le problème de « paresse » dans les réponses de GPT-4,
l'entreprise présente de nouveaux modèles aux développeurs

OpenAI a annoncé plusieurs nouveautés concernant ses modèles et ses tarifs. Ces changements intéressent principalement les développeurs qui utilisent l’API d’OpenAI, mais ils servent également d'indicateurs pour les futures options disponibles pour les utilisateurs non-développeurs. L'entreprise a également fait de gros efforts pour résoudre les problèmes techniques qui ont conduit certains utilisateurs à affirmer que GPT-4 avait commencé à devenir "paresseux" dans ses réponses à certaines questions de codage, ne répondant effectivement pas à ces questions.

Bien que ChatGPT continue de régner en maître en tant que chatbot de choix dans le monde des affaires, il existe d'autres options, et elles commencent à fournir des options plus axées sur les affaires également.

Mise à jour de l'API GPT-3.5 Turbo ainsi que de la tarification

GPT-3.5 Turbo est le modèle avec lequel la plupart des gens interagissent, généralement par l'intermédiaire de ChatGPT, et il sert en quelque sorte de norme industrielle. C'est également une API populaire, moins coûteuse et plus rapide que GPT-4 pour de nombreuses tâches. Les utilisateurs payants seront donc heureux d'apprendre que les prix d'entrée baissent de 50 % et les prix de sortie de 25 %, à 0,0005 $ par millier de jetons en entrée et 0,0015 $ par millier de jetons en sortie.

Cela permet aux utilisateurs de réaliser des applications plus gourmandes en texte, comme l’analyse de documents ou de livres entiers, sans se ruiner. OpenAI doit en effet faire face à la concurrence croissante de modèles open source ou auto-gérés, qui rattrapent son avance technologique. D'où la baisse régulière des prix, qui est aussi le résultat naturel de la rationalisation des modèles et de l'amélioration de l'infrastructure.

GPT-3.5 Turbo reçoit également une nouvelle version de modèle, 0125 (c'est-à-dire la date du 25 janvier) qui inclut « diverses améliorations », mais apparemment peu de choses qu'OpenAI a jugé utile de mentionner. La dernière version était 0613 (c'est-à-dire la date du 13 juin), il est donc un peu surprenant qu'ils n'en mentionnent pas plus.

Envoyé par OpenAI

La semaine prochaine, nous introduirons un nouveau modèle GPT-3.5 Turbo, gpt-3.5-turbo-0125, et pour la troisième fois en un an, nous diminuerons les prix de GPT-3.5 Turbo pour aider nos clients à passer un cap. Les prix d'entrée pour le nouveau modèle sont réduits de 50 % à 0,0005 $ /1K tokens et les prix de sortie sont réduits de 25 % à 0,0015 $ /1K tokens. Ce modèle comportera également diverses améliorations, notamment une plus grande précision de réponse dans les formats demandés et la correction d'un bogue qui causait un problème d'encodage de texte pour les appels de fonction en langues autres que l'anglais.

Les clients qui utilisent l'alias de modèle gpt-3.5-turbo seront automatiquement mis à niveau de gpt-3.5-turbo-0613 à gpt-3.5-turbo-0125 deux semaines après le lancement de ce modèle.

Mise à jour de GPT-4 Turbo, le modèle le plus avancé d'OpenAI

GPT-4 Turbo, le modèle le plus avancé d’OpenAI, qui intègre la vision en plus du langage, a lui aussi droit à une nouvelle version en prévisualisation, également appelée 0125. Cette version corrige un problème surprenant : le GPT-4 “paresseux” qui refusait de travailler. En effet, certains utilisateurs avaient remarqué que le modèle ne terminait pas certaines tâches, comme la génération de code, et se contentait de réponses minimales ou vides. OpenAI a donc amélioré la capacité du modèle à compléter les tâches demandées, sans pour autant expliquer la cause de cette “paresse” artificielle. GPT-4 Turbo avec vision (GPT-4 V) devrait être disponible pour tous « dans les prochains mois » :

Envoyé par OpenAI

Mise à jour de la Preview de GPT-4 Turbo

Plus de 70 % des demandes des clients de l'API GPT-4 sont passées à la GPT-4 Turbo depuis sa sortie, car les développeurs profitent de la mise à jour du seuil de connaissance, de fenêtres contextuelles plus grandes de 128k et de prix plus bas.

Aujourd'hui, nous publions un modèle de prévisualisation GPT-4 Turbo mis à jour, gpt-4-0125-preview. Ce modèle accomplit des tâches telles que la génération de code de manière plus complète que le modèle précédent et vise à réduire les cas de "paresse" où le modèle n'accomplit pas une tâche. Le nouveau modèle inclut également la correction du bogue affectant les générations UTF-8 non anglaises.

Pour ceux qui souhaitent être automatiquement mis à jour vers les nouvelles versions de GPT-4 Turbo, nous introduisons également un nouvel alias de nom de modèle gpt-4-turbo-preview, qui pointera toujours vers notre dernier modèle de GPT-4 Turbo.

Nous prévoyons de lancer GPT-4 Turbo avec vision en disponibilité générale dans les mois à venir.

Autres améliorations

Modèle de modération mis à jour

La société a publié une nouvelle version de son API de modération gratuite, qui identifie les textes potentiellement dangereux. Recherchez la version 007 si vous souhaitez utiliser cette API pour répondre à vos besoins en matière de modération :

L'API de modération gratuite permet aux développeurs d'identifier les textes potentiellement dangereux. Dans le cadre de notre travail continu sur la sécurité, nous publions text-moderation-007, notre modèle de modération le plus robuste à ce jour. Les alias text-moderation-latest et text-moderation-stable ont été mis à jour pour pointer vers ce modèle. Pour en savoir plus sur la création de systèmes d'IA sûrs, consultez notre guide des meilleures pratiques en matière de sécurité.

Nouveaux modèles d'intégration avec des prix plus bas

Il existe également une poignée de modèles d'intégration de texte nouveaux et améliorés, qui s'adressent davantage aux techniciens.

Nous introduisons deux nouveaux modèles d'intégration : un modèle text-embedding-3-small, plus petit et très efficace, et un modèle text-embedding-3-large, plus grand et plus puissant.

Un embedding est une séquence de nombres qui représente les concepts au sein d'un contenu tel qu'un langage naturel ou un code. Les embeddings permettent aux modèles d'apprentissage automatique et à d'autres algorithmes de comprendre les relations entre les contenus et d'effectuer des tâches telles que le regroupement ou la recherche. Ils alimentent des applications telles que la recherche de connaissances dans ChatGPT et l'API Assistants, ainsi que de nombreux outils de développement de la génération augmentée de recherche (RAG).

Un nouveau modèle d'incorporation de texte de petite taille

text-embedding-3-small est notre nouveau modèle d'incorporation très efficace et constitue une amélioration significative par rapport à son prédécesseur, le modèle text-embedding-ada-002 publié en décembre 2022.

Des performances accrues. En comparant le modèle text-embedding-ada-002 au modèle text-embedding-3-small, le score moyen sur un benchmark couramment utilisé pour la recherche multilingue (MIRACL) est passé de 31,4 % à 44,0 %, tandis que le score moyen sur un benchmark couramment utilisé pour les tâches en anglais (MTEB) est passé de 61,0 % à 62,3 %.

Prix réduit. text-embedding-3-small est également beaucoup plus efficace que notre modèle text-embedding-ada-002 de la génération précédente. Le prix du text-embedding-3-small a donc été divisé par 5 par rapport au text-embedding-ada-002, passant d'un prix pour 1k tokens de 0,0001 $ à 0,00002 $.

Nous ne supprimons pas le text-embedding-ada-002, donc bien que nous recommandions le nouveau modèle, les clients peuvent continuer à utiliser le modèle de la génération précédente.

Un nouveau modèle d'intégration de texte de grande taille : text-embedding-3-large

text-embedding-3-large est notre nouveau modèle d'incorporation de texte de grande taille de nouvelle génération et crée des incorporations jusqu'à 3072 dimensions.

Une meilleure performance. text-embedding-3-large est notre nouveau modèle le plus performant. En comparant text-embedding-ada-002 à text-embedding-3-large : sur MIRACL, le score moyen est passé de 31,4 % à 54,9 %, tandis que sur MTEB, le score moyen est passé de 61,0 % à 64,6 %.

Conclusion

Ces annonces montrent que OpenAI continue d’innover et de s’adapter dans le domaine de l’intelligence artificielle, en proposant des modèles toujours plus puissants et accessibles. Mais elles soulèvent aussi des questions sur les limites éthiques et techniques de ces technologies, qui peuvent avoir des impacts importants sur la société

En attendant, à l'occasion d'un entretien, le PDG d'OpenAI a évoqué les évolutions de GPT-5 auxquelles ont pourrait s'attendre cette année. Sam Altman a également parlé d'une façon différente d'utiliser son ordinateur grâce à l'IA :

Je pense que ce vers quoi nous nous dirigeons, et je ne parle pas de cette année, c'est que nous nous dirigeons vers une façon différente d'utiliser un ordinateur où vous "parlez" au système d'exploitation comme vous le feriez avec une expérience de chat ou d'une expérience d'IA. Plutôt que d'ouvrir un navigateur et de taper Gmail et de regarder vos emails ou quoi que ce soit d'autre, vous pourriez juste dire "quels étaient mes emails les plus importants aujourd'hui ? Peux-tu répondre à tous ceux-là ? Trouve ceci envoie le là". Je pense qu'à chaque grande révolution technologique, nous avons l'occasion d'utiliser un ordinateur d'une nouvelle manière et nous n'y arriverons pas cette année, mais je pense que nous verrons les gens faire de plus en plus de leur flux de travail à l'intérieur d'un modèle de langage.

Source : OpenAI

Et vous ?

Quelle(s) est/sont la/les nouveauté(s) qui vous intéresse(nt) le plus ?

Que pensez-vous de la baisse des prix d’OpenAI ? Est-ce une bonne nouvelle pour les développeurs et les utilisateurs ?

Quelles sont les applications potentielles du GPT-4 Turbo avec vision ? Quels sont les défis techniques et éthiques qu’il pose ?

Comment pouvez-vous expliquer le phénomène du GPT-4 “paresseux” ?

Quelles alternatives à ChatGPT connaissez-vous ? Laquelle avez-vous essayé ou voulez-vous essayer ? Si vous l'avez essayé, qu'en pensez-vous ?

Vous avez lu gratuitement 42 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

ChatGPT : OpenAI réduit de moitié les prix d'accès à ses API et corrige le problème de « paresse » dans les réponses de GPT-4

L'entreprise présente de nouveaux modèles aux développeurs

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

ChatGPT : OpenAI réduit de moitié les prix d'accès à ses API et corrige le problème de « paresse » dans les réponses de GPT-4 L'entreprise présente de nouveaux modèles aux développeurs

ChatGPT : OpenAI réduit de moitié les prix d'accès à ses API et corrige le problème de « paresse » dans les réponses de GPT-4

L'entreprise présente de nouveaux modèles aux développeurs