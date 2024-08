Cosine obtient des résultats de pointe référencés "état-de-l'art" (SOTA) sur le benchmark SWE-bench



Genie de Cosine est un assistant d'ingénierie logicielle IA capable d'identifier et de résoudre les bogues de manière autonome, de développer des fonctionnalités et de remanier le code en collaboration avec les utilisateurs. Il est capable de raisonner sur des problèmes techniques complexes et d'apporter des modifications au code avec une plus grande précision et moins de jetons.



Genie est alimenté par un modèle GPT-4o finement ajusté, formé à partir d'exemples de véritables ingénieurs logiciels au travail, ce qui permet au modèle d'apprendre à répondre d'une manière spécifique. Le modèle a également été entraîné à produire des données dans des formats spécifiques, tels que des correctifs qui peuvent être facilement intégrés dans des bases de code.



Avec un modèle GPT-4o finement ajusté, Genie atteint un score SOTA de 43,8 % sur le nouveau benchmark SWE-bench Verified. Genie obtient également un score SOTA de 30,08 % sur SWE-bench Full, dépassant son score SOTA précédent de 19,27 %, ce qui représente la plus grande amélioration jamais enregistrée sur ce benchmark.





Distyl, un partenaire de solutions d'IA pour les entreprises Fortune 500, s'est récemment classé 1er sur le benchmark BIRD-SQL, le principal benchmark text-to-SQL. GPT-4o de Distyl a atteint une précision d'exécution de 71,83 % dans le classement et a excellé dans des tâches telles que la reformulation de requêtes, la classification d'intentions, la chaîne de pensée et l'auto-correction, avec des performances particulièrement élevées dans la génération SQL.





Aujourd'hui, nous lançons le réglage fin pour GPT-4o, l'une des fonctionnalités les plus demandées par les développeurs. Nous offrons également 1 million de jetons de formation par jour gratuitement à toutes les organisations jusqu'au 23 septembre.



Les développeurs peuvent désormais affiner GPT-4o avec des ensembles de données personnalisés afin d'obtenir de meilleures performances à moindre coût pour leurs cas d'utilisation spécifiques. Le réglage fin permet au modèle de personnaliser la structure et le ton des réponses, ou de suivre des instructions complexes spécifiques à un domaine. Les développeurs peuvent déjà obtenir de bons résultats pour leurs applications avec seulement quelques dizaines d'exemples dans leur ensemble de données d'entraînement.



Du codage à l'écriture créative, le réglage fin peut avoir un impact important sur les performances du modèle dans de nombreux domaines. Ce n'est qu'un début : nous continuerons à investir dans l'élargissement des options de personnalisation des modèles pour les développeurs.



Confidentialité et sécurité des données



Les modèles affinés restent entièrement sous votre contrôle, avec la propriété totale de vos données d'entreprise, y compris toutes les entrées et sorties. Cela garantit que vos données ne sont jamais partagées ou utilisées pour entraîner d'autres modèles.



Nous avons également mis en place des mesures d'atténuation de la sécurité en couches pour les modèles affinés afin de garantir qu'ils ne sont pas utilisés à mauvais escient. Par exemple, nous exécutons en permanence des évaluations de sécurité automatisées sur les modèles finement réglés et nous surveillons l'utilisation pour nous assurer que les applications respectent nos politiques d'utilisation.



OpenAI, connue pour la famille de grands modèles de langage GPT, est une organisation américaine de recherche en intelligence artificielle (IA). Sa publication de ChatGPT en novembre 2022 a été considérée comme le catalyseur d'un intérêt généralisé pour l'IA générative. Elle s'est donnée pour mission de développer une intelligence artificielle générale "sûre et bénéfique".Son modèle le plus récent est GPT-4o mini, un petit modèle économique visant à améliorer l'accessibilité et l'abordabilité . GPT-4o mini obtient un score de 82 % sur MMLU et surpasse actuellement GPT-4 sur les préférences de chat dans le classement LMSYS. Son prix est de 15 cents par million de jetons d'entrée et de 60 cents par million de jetons de sortie, soit 60 % moins cher que le GPT-3.5 Turbo.GPT-4o mini est conçu avec une fenêtre contextuelle de 128 000 jetons et prend en charge jusqu'à 16 000 jetons de sortie par demande. Actuellement, il est capable de traiter du texte et des tâches de vision. De futures mises à jour permettront d'étendre ses capacités aux entrées et sorties de texte, d'image, de vidéo et d'audio. En termes de sécurité, le GPT-4o mini intègre plusieurs mesures pour faire face aux risques tels que les contenus nuisibles et les vulnérabilités du système.Récemment, OpenAI a annoncé la disponibilité d'un outil de réglage fin (fine-tuning) pour personnaliser GPT-4o. Grâce à cet outil, "."Alors que les entreprises sont de plus en plus poussées par leurs concurrents à intégrer les nouvelles technologies dans leurs pratiques, OpenAI lance une nouvelle fonction de réglage fin destinée aux entreprises qui souhaitent utiliser leurs propres données. Cette capacité devrait permettre aux marques et aux entreprises d'adapter beaucoup plus facilement l'IA à leurs propres usages.Le chef de produit de l'API d'OpenAI, Olivier Godement, a déclaré : "" Selon OpenAI, le réglage fin permet au modèle de personnaliser la structure et le ton des réponses ou de suivre des instructions complexes spécifiques à un domaine pour obtenir de bons résultats.Avec la fonction de réglage fin, les clients doivent télécharger leurs données sur les serveurs d'OpenAI. La formation devrait ensuite prendre une heure ou deux, les données étant censées être uniquement textuelles au départ. Bien que cela puisse rendre certaines entreprises nerveuses, OpenAI a déclaré que les modèles affinés restent entièrement sous le contrôle de l'entreprise, avec la pleine propriété des données commerciales. OpenAI ajoute également mettre en place des mesures d'atténuation de la sécurité à plusieurs niveaux pour les modèles affinés afin de garantir qu'ils ne sont pas utilisés à mauvais escient.Voici quelques exemples partagés par OpenAI sur le réglage fin de GPT-4o et les cas d'utilisation :Pour commencer, visitez le tableau de bord de la mise au point, cliquez sur créer, et sélectionnezdans le menu déroulant du modèle de base. La formation au réglage fin GPT-4o coûte 25 $ par million de jetons, et l'inférence 3,75 $ par million de jetons d'entrée et 15 $ par million de jetons de sortie.Le réglage fin de GPT-4o mini est également disponible pour tous les développeurs sur tous les niveaux d'utilisation payants. Visitez le tableau de bord de la mise au point et sélectionnezdans le menu déroulant du modèle de base. Pour GPT-4o mini, OpenAI offre gratuitement 2 millions de jetons de formation par jour jusqu'au 23 septembre.Voici les déclarations d'OpenAI pour l'annonce :Quel est votre avis sur cette nouvelle fonctionnalité ?Pensez-vous que les déclarations d'OpenAI concernant la confidentialité et sécurité des données est crédibles ou pertinentes ?