
Bien que ChatGPT continue de régner en maître en tant que chatbot de choix dans le monde des affaires, il existe d'autres options, et elles commencent à fournir des options plus axées sur les affaires également.
Mise à jour de l'API GPT-3.5 Turbo ainsi que de la tarification
GPT-3.5 Turbo est le modèle avec lequel la plupart des gens interagissent, généralement par l'intermédiaire de ChatGPT, et il sert en quelque sorte de norme industrielle. C'est également une API populaire, moins coûteuse et plus rapide que GPT-4 pour de nombreuses tâches. Les utilisateurs payants seront donc heureux d'apprendre que les prix d'entrée baissent de 50 % et les prix de sortie de 25 %, à 0,0005 $ par millier de jetons en entrée et 0,0015 $ par millier de jetons en sortie.
Cela permet aux utilisateurs de réaliser des applications plus gourmandes en texte, comme l’analyse de documents ou de livres entiers, sans se ruiner. OpenAI doit en effet faire face à la concurrence croissante de modèles open source ou auto-gérés, qui rattrapent son avance technologique. D'où la baisse régulière des prix, qui est aussi le résultat naturel de la rationalisation des modèles et de l'amélioration de l'infrastructure.
GPT-3.5 Turbo reçoit également une nouvelle version de modèle, 0125 (c'est-à-dire la date du 25 janvier) qui inclut « diverses améliorations », mais apparemment peu de choses qu'OpenAI a jugé utile de mentionner. La dernière version était 0613 (c'est-à-dire la date du 13 juin), il est donc un peu surprenant qu'ils n'en mentionnent pas plus.

GPT-4 Turbo, le modèle le plus avancé d’OpenAI, qui intègre la vision en plus du langage, a lui aussi droit à une nouvelle version en prévisualisation, également appelée 0125. Cette version corrige un problème surprenant : le GPT-4 “paresseux” qui refusait de travailler. En effet, certains utilisateurs avaient remarqué que le modèle ne terminait pas certaines tâches, comme la génération de code, et se contentait de réponses minimales ou vides. OpenAI a donc amélioré la capacité du modèle à compléter les tâches demandées, sans pour autant expliquer la cause de cette “paresse” artificielle. GPT-4 Turbo avec vision (GPT-4 V) devrait être disponible pour tous « dans les prochains mois » :

Modèle de modération mis à jour
La société a publié une nouvelle version de son API de modération gratuite, qui identifie les textes potentiellement dangereux. Recherchez la version 007 si vous souhaitez utiliser cette API pour répondre à vos besoins en matière de modération :
L'API de modération gratuite permet aux développeurs d'identifier les textes potentiellement dangereux. Dans le cadre de notre travail continu sur la sécurité, nous publions text-moderation-007, notre modèle de modération le plus robuste à ce jour. Les alias text-moderation-latest et text-moderation-stable ont été mis à jour pour pointer vers ce modèle. Pour en savoir plus sur la création de systèmes d'IA sûrs, consultez notre guide des meilleures pratiques en matière de sécurité.
Il existe également une poignée de modèles d'intégration de texte nouveaux et améliorés, qui s'adressent davantage aux techniciens.
[QUOTE]Nous introduisons deux nouveaux modèles d'intégration : un modèle text-embedding-3-small, plus petit et très efficace, et un modèle text-embedding-3-large, plus grand et plus puissant.
Un embedding est une séquence de nombres qui représente les concepts au sein d'un contenu tel qu'un langage naturel ou un code. Les embeddings permettent aux modèles d'apprentissage automatique et à d'autres algorithmes de comprendre les relations entre les contenus et d'effectuer des tâches telles que le regroupement ou la recherche. Ils alimentent des applications telles que la recherche de connaissances dans ChatGPT et l'API Assistants, ainsi que de nombreux outils de développement de la génération augmentée de recherche (RAG).
Un nouveau modèle d'incorporation de texte de petite taille
text-embedding-3-small est notre nouveau modèle d'incorporation très efficace et constitue une amélioration significative par rapport à son prédécesseur, le modèle text-embedding-ada-002 publié en décembre 2022.
Des performances accrues. En comparant le modèle text-embedding-ada-002 au modèle text-embedding-3-small, le score moyen sur un benchmark couramment utilisé pour la recherche multilingue (MIRACL) est passé de 31,4 % à 44,0 %, tandis que le score moyen sur un benchmark couramment utilisé pour les tâches en anglais (MTEB) est passé de 61,0 % à 62,3 %.
Prix réduit. text-embedding-3-small est également beaucoup plus efficace que notre modèle text-embedding-ada-002 de la génération précédente. Le prix du text-embedding-3-small a donc été...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.