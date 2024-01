Mise à jour de l'API GPT-3.5 Turbo ainsi que de la tarification

Envoyé par OpenAI Envoyé par La semaine prochaine, nous introduirons un nouveau modèle GPT-3.5 Turbo, gpt-3.5-turbo-0125, et pour la troisième fois en un an, nous diminuerons les prix de GPT-3.5 Turbo pour aider nos clients à passer un cap. Les prix d'entrée pour le nouveau modèle sont réduits de 50 % à 0,0005 $ /1K tokens et les prix de sortie sont réduits de 25 % à 0,0015 $ /1K tokens. Ce modèle comportera également diverses améliorations, notamment une plus grande précision de réponse dans les formats demandés et la correction d'un bogue qui causait un problème d'encodage de texte pour les appels de fonction en langues autres que l'anglais.



Les clients qui utilisent l'alias de modèle gpt-3.5-turbo seront automatiquement mis à niveau de gpt-3.5-turbo-0613 à gpt-3.5-turbo-0125 deux semaines après le lancement de ce modèle.

Mise à jour de GPT-4 Turbo, le modèle le plus avancé d'OpenAI

Envoyé par OpenAI Envoyé par Mise à jour de la Preview de GPT-4 Turbo



Plus de 70 % des demandes des clients de l'API GPT-4 sont passées à la GPT-4 Turbo depuis sa sortie, car les développeurs profitent de la mise à jour du seuil de connaissance, de fenêtres contextuelles plus grandes de 128k et de prix plus bas.



Aujourd'hui, nous publions un modèle de prévisualisation GPT-4 Turbo mis à jour, gpt-4-0125-preview. Ce modèle accomplit des tâches telles que la génération de code de manière plus complète que le modèle précédent et vise à réduire les cas de "paresse" où le modèle n'accomplit pas une tâche. Le nouveau modèle inclut également la correction du bogue affectant les générations UTF-8 non anglaises.



Pour ceux qui souhaitent être automatiquement mis à jour vers les nouvelles versions de GPT-4 Turbo, nous introduisons également un nouvel alias de nom de modèle gpt-4-turbo-preview, qui pointera toujours vers notre dernier modèle de GPT-4 Turbo.



Nous prévoyons de lancer GPT-4 Turbo avec vision en disponibilité générale dans les mois à venir.

Autres améliorations

L'API de modération gratuite permet aux développeurs d'identifier les textes potentiellement dangereux. Dans le cadre de notre travail continu sur la sécurité, nous publions text-moderation-007, notre modèle de modération le plus robuste à ce jour. Les alias text-moderation-latest et text-moderation-stable ont été mis à jour pour pointer vers ce modèle. Pour en savoir plus sur la création de systèmes d'IA sûrs, consultez notre guide des meilleures pratiques en matière de sécurité. L'API de modération gratuite permet aux développeurs d'identifier les textes potentiellement dangereux. Dans le cadre de notre travail continu sur la sécurité, nous publions text-moderation-007, notre modèle de modération le plus robuste à ce jour. Les alias text-moderation-latest et text-moderation-stable ont été mis à jour pour pointer vers ce modèle. Pour en savoir plus sur la création de systèmes d'IA sûrs, consultez notre guide des meilleures pratiques en matière de sécurité.

Nous introduisons deux nouveaux modèles d'intégration : un modèle text-embedding-3-small, plus petit et très efficace, et un modèle text-embedding-3-large, plus grand et plus puissant.



Un embedding est une séquence de nombres qui représente les concepts au sein d'un contenu tel qu'un langage naturel ou un code. Les embeddings permettent aux modèles d'apprentissage automatique et à d'autres algorithmes de comprendre les relations entre les contenus et d'effectuer des tâches telles que le regroupement ou la recherche. Ils alimentent des applications telles que la recherche de connaissances dans ChatGPT et l'API Assistants, ainsi que de nombreux outils de développement de la génération augmentée de recherche (RAG).





Un nouveau modèle d'incorporation de texte de petite taille



text-embedding-3-small est notre nouveau modèle d'incorporation très efficace et constitue une amélioration significative par rapport à son prédécesseur, le modèle text-embedding-ada-002 publié en décembre 2022.



Des performances accrues. En comparant le modèle text-embedding-ada-002 au modèle text-embedding-3-small, le score moyen sur un benchmark couramment utilisé pour la recherche multilingue (MIRACL) est passé de 31,4 % à 44,0 %, tandis que le score moyen sur un benchmark couramment utilisé pour les tâches en anglais (MTEB) est passé de 61,0 % à 62,3 %.



Prix réduit. text-embedding-3-small est également beaucoup plus efficace que notre modèle text-embedding-ada-002 de la génération précédente. Le prix du text-embedding-3-small a donc été divisé par 5 par rapport au text-embedding-ada-002, passant d'un prix pour 1k tokens de 0,0001 $ à 0,00002 $.



Nous ne supprimons pas le text-embedding-ada-002, donc bien que nous recommandions le nouveau modèle, les clients peuvent continuer à utiliser le modèle de la génération précédente.



Un nouveau modèle d'intégration de texte de grande taille : text-embedding-3-large



text-embedding-3-large est notre nouveau modèle d'incorporation de texte de grande taille de nouvelle génération et crée des incorporations jusqu'à 3072 dimensions.



Une meilleure performance. text-embedding-3-large est notre nouveau modèle le plus performant. En comparant text-embedding-ada-002 à text-embedding-3-large : sur MIRACL, le score moyen est passé de 31,4 % à 54,9 %, tandis que sur MTEB, le score moyen est passé de 61,0 % à 64,6 %.



Nous introduisons deux nouveaux modèles d'intégration : un modèle text-embedding-3-small, plus petit et très efficace, et un modèle text-embedding-3-large, plus grand et plus puissant.Un embedding est une séquence de nombres qui représente les concepts au sein d'un contenu tel qu'un langage naturel ou un code. Les embeddings permettent aux modèles d'apprentissage automatique et à d'autres algorithmes de comprendre les relations entre les contenus et d'effectuer des tâches telles que le regroupement ou la recherche. Ils alimentent des applications telles que la recherche de connaissances dans ChatGPT et l'API Assistants, ainsi que de nombreux outils de développement de la génération augmentée de recherche (RAG).text-embedding-3-small est notre nouveau modèle d'incorporation très efficace et constitue une amélioration significative par rapport à son prédécesseur, le modèle text-embedding-ada-002 publié en décembre 2022.En comparant le modèle text-embedding-ada-002 au modèle text-embedding-3-small, le score moyen sur un benchmark couramment utilisé pour la recherche multilingue (MIRACL) est passé de 31,4 % à 44,0 %, tandis que le score moyen sur un benchmark couramment utilisé pour les tâches en anglais (MTEB) est passé de 61,0 % à 62,3 %.text-embedding-3-small est également beaucoup plus efficace que notre modèle text-embedding-ada-002 de la génération précédente. Le prix du text-embedding-3-small a donc été divisé par 5 par rapport au text-embedding-ada-002, passant d'un prix pour 1k tokens de 0,0001 $ à 0,00002 $.Nous ne supprimons pas le text-embedding-ada-002, donc bien que nous recommandions le nouveau modèle, les clients peuvent continuer à utiliser le modèle de la génération précédente.text-embedding-3-large est notre nouveau modèle d'incorporation de texte de grande taille de nouvelle génération et crée des incorporations jusqu'à 3072 dimensions.Une meilleure performance. text-embedding-3-large est notre nouveau modèle le plus performant. En comparant text-embedding-ada-002 à text-embedding-3-large : sur MIRACL, le score moyen est passé de 31,4 % à 54,9 %, tandis que sur MTEB, le score moyen est passé de 61,0 % à 64,6 %.

Conclusion

Je pense que ce vers quoi nous nous dirigeons, et je ne parle pas de cette année, c'est que nous nous dirigeons vers une façon différente d'utiliser un ordinateur où vous "parlez" au système d'exploitation comme vous le feriez avec une expérience de chat ou d'une expérience d'IA. Plutôt que d'ouvrir un navigateur et de taper Gmail et de regarder vos emails ou quoi que ce soit d'autre, vous pourriez juste dire "quels étaient mes emails les plus importants aujourd'hui ? Peux-tu répondre à tous ceux-là ? Trouve ceci envoie le là". Je pense qu'à chaque grande révolution technologique, nous avons l'occasion d'utiliser un ordinateur d'une nouvelle manière et nous n'y arriverons pas cette année, mais je pense que nous verrons les gens faire de plus en plus de leur flux de travail à l'intérieur d'un modèle de langage. Je pense que ce vers quoi nous nous dirigeons, et je ne parle pas de cette année, c'est que nous nous dirigeons vers une façon différente d'utiliser un ordinateur où vous "parlez" au système d'exploitation comme vous le feriez avec une expérience de chat ou d'une expérience d'IA. Plutôt que d'ouvrir un navigateur et de taper Gmail et de regarder vos emails ou quoi que ce soit d'autre, vous pourriez juste dire "quels étaient mes emails les plus importants aujourd'hui ? Peux-tu répondre à tous ceux-là ? Trouve ceci envoie le là". Je pense qu'à chaque grande révolution technologique, nous avons l'occasion d'utiliser un ordinateur d'une nouvelle manière et nous n'y arriverons pas cette année, mais je pense que nous verrons les gens faire de plus en plus de leur flux de travail à l'intérieur d'un modèle de langage.

GPT-3.5 Turbo est le modèle avec lequel la plupart des gens interagissent, généralement par l'intermédiaire de ChatGPT, et il sert en quelque sorte de norme industrielle. C'est également une API populaire, moins coûteuse et plus rapide que GPT-4 pour de nombreuses tâches. Les utilisateurs payants seront donc heureux d'apprendre que les prix d'entrée baissent de 50 % et les prix de sortie de 25 %, à 0,0005 $ par millier de jetons en entrée et 0,0015 $ par millier de jetons en sortie.Cela permet aux utilisateurs de réaliser des applications plus gourmandes en texte, comme l’analyse de documents ou de livres entiers, sans se ruiner. OpenAI doit en effet faire face à la concurrence croissante de modèles open source ou auto-gérés, qui rattrapent son avance technologique. D'où la baisse régulière des prix, qui est aussi le résultat naturel de la rationalisation des modèles et de l'amélioration de l'infrastructure.GPT-3.5 Turbo reçoit également une nouvelle version de modèle, 0125 (c'est-à-dire la date du 25 janvier) qui inclut « diverses améliorations », mais apparemment peu de choses qu'OpenAI a jugé utile de mentionner. La dernière version était 0613 (c'est-à-dire la date du 13 juin), il est donc un peu surprenant qu'ils n'en mentionnent pas plus.GPT-4 Turbo, le modèle le plus avancé d’OpenAI, qui intègre la vision en plus du langage, a lui aussi droit à une nouvelle version en prévisualisation, également appelée 0125. Cette version corrige un problème surprenant : le GPT-4 “paresseux” qui refusait de travailler. En effet, certains utilisateurs avaient remarqué que le modèle ne terminait pas certaines tâches, comme la génération de code, et se contentait de réponses minimales ou vides. OpenAI a donc amélioré la capacité du modèle à compléter les tâches demandées, sans pour autant expliquer la cause de cette “paresse” artificielle. GPT-4 Turbo avec vision (GPT-4 V) devrait être disponible pour tous « dans les prochains mois » :La société a publié une nouvelle version de son API de modération gratuite, qui identifie les textes potentiellement dangereux. Recherchez la version 007 si vous souhaitez utiliser cette API pour répondre à vos besoins en matière de modération :Il existe également une poignée de modèles d'intégration de texte nouveaux et améliorés, qui s'adressent davantage aux techniciens.Ces annonces montrent que OpenAI continue d’innover et de s’adapter dans le domaine de l’intelligence artificielle, en proposant des modèles toujours plus puissants et accessibles. Mais elles soulèvent aussi des questions sur les limites éthiques et techniques de ces technologies, qui peuvent avoir des impacts importants sur la sociétéEn attendant, à l'occasion d'un entretien, le PDG d'OpenAI a évoqué les évolutions de GPT-5 auxquelles ont pourrait s'attendre cette année. Sam Altman a également parlé d'une façon différente d'utiliser son ordinateur grâce à l'IA :Source : OpenAI Quelle(s) est/sont la/les nouveauté(s) qui vous intéresse(nt) le plus ?Que pensez-vous de la baisse des prix d’OpenAI ? Est-ce une bonne nouvelle pour les développeurs et les utilisateurs ?Quelles sont les applications potentielles du GPT-4 Turbo avec vision ? Quels sont les défis techniques et éthiques qu’il pose ?Comment pouvez-vous expliquer le phénomène du GPT-4 “paresseux” ?Quelles alternatives à ChatGPT connaissez-vous ? Laquelle avez-vous essayé ou voulez-vous essayer ? Si vous l'avez essayé, qu'en pensez-vous ?