IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Quelle est la meilleure option pour les entreprises : des services d'IA libres ou commerciaux ?
Défis et limites d'une approche open source de l'intelligence artificielle

Le , par Bruno

10PARTAGES

5  0 
Le choix entre les services d'IA commerciaux et open source est devenu crucial pour les entreprises à la lumière de l'émergence de l'IA générative (GenAI). Les services commerciaux offrent une intégration facile et une sécurité robuste, mais suscitent des préoccupations liées à la confidentialité des données et à la précision des réponses. D'un autre côté, les modèles linguistiques libres tels que Mistral et GPT-J permettent une personnalisation accrue, mais nécessitent des investissements opérationnels et des compétences spécialisées. Les risques de sécurité varient également entre les deux approches, avec les services commerciaux offrant un cadre solide mais nécessitant une vigilance accrue contre les cybermenaces.

Meta, la société mère de Facebook, a récemment lancé Llama 2, un modèle de langage artificiel gratuit et open source qui promet de révolutionner le domaine de l’intelligence artificielle. Llama 2 est basé sur le code source de GPT-3, le modèle de langage le plus avancé au monde, développé par OpenAI, une organisation à but non lucratif soutenue par Elon Musk et d’autres personnalités du secteur technologique. Llama 2 est censé offrir aux développeurs et aux entreprises un accès facile et gratuit à une intelligence artificielle de pointe, sans avoir à payer les frais élevés d’OpenAI.


Les modèles open source laissent la responsabilité de la conformité réglementaire à l'utilisateur, nécessitant une gestion proactive des risques juridiques. Selon des analystes, l'adoption de l'IA générative nécessite une évaluation équilibrée des avantages, des risques et des coûts, en tenant compte des exigences de confidentialité des données et des préférences en matière de contrôle. Aussi, une analyse du Parlement Européen met en évidence les avantages et les inconvénients de l'intelligence artificielle open source, soulignant son potentiel d'innovation mais notant également des défis juridiques, techniques et éthiques. Le rapport propose des recommandations pour stimuler l'adoption de l'IA open source dans le secteur public et privé, soulignant son rôle dans la transparence et la confiance.

Open source est un terme largement utilisé pour décrire les logiciels qui sont fournis avec toutes les permissions nécessaires accordées à l'avance pour faciliter leur utilisation, leur amélioration et leur redistribution (modifiée ou non) par n'importe qui et à n'importe quelle fin. Ces autorisations sont souvent appelées « les quatre libertés » des utilisateurs de logiciels :

  1. La liberté d'exécuter le programme comme vous le souhaitez, dans n'importe quel but ;
  2. La liberté d'étudier le fonctionnement du programme et de le modifier pour qu'il fasse vos calculs comme vous le souhaitez. L'accès au code source est une condition préalable ;
  3. La liberté de redistribuer des copies afin d'aider les autres ;
  4. La liberté de distribuer des copies de vos versions modifiées à d'autres personnes.

Il s'oppose aux logiciels propriétaires, dont seuls les auteurs originaux peuvent légalement les copier, les inspecter et les modifier. Selon l'Open Source Initiative (OSI), une organisation mondiale à but non lucratif qui promeut l'utilisation et la sensibilisation aux logiciels libres, ceux-ci se caractérisent par :

  • la libre redistribution ;
  • la distribution du code source ;
  • l'autorisation des travaux dérivés ;
  • l'intégrité du code source de l'auteur ;
  • l'absence de discrimination à l'égard de personnes ou de groupes ;
  • l'absence de discrimination à l'égard de domaines d'activité ;
  • la distribution de la licence ;
  • la licence ne doit pas être liée à un produit ;
  • la licence ne doit pas restreindre d'autres logiciels ;
  • la licence doit être neutre du point de vue de la technologie.

Les origines de l'open source remontent au système d'exploitation GNU (GNU's Not Unix) en 19836. Le système d'exploitation Linux est sorti en 1991, incorporant de nombreux éléments du projet GNU et principalement utilisé comme alternative à MacOS et Windows. On attribue souvent à ce système le mérite d'avoir donné le coup d'envoi de l'utilisation des logiciels libres et, dès le début des années 2000, de grandes entreprises ont commencé à tirer parti des logiciels libres. Aujourd'hui, Linux affiche des statistiques d'hébergement impressionnantes : il fait tourner 100 % des 500 premiers superordinateurs du monde, exploite 90 % de l'ensemble de l'infrastructure en cloud et, avec les téléphones Android basés sur Linux, 85 % de l'ensemble des smartphones fonctionnent sous ce système.

Compte tenu des nombreuses possibilités offertes par l'utilisation de l'intelligence artificielle, l'open source offre un potentiel d'innovation tant dans le secteur public que dans le secteur privé. Parmi les avantages, citons la capacité à renforcer la transparence, à faciliter l'audit de l'IA et donc à renforcer la confiance des citoyens, tout en stimulant les activités économiques et l'expertise spécifique à un domaine. Parmi les inconvénients et les limites, citons les défis juridiques, techniques, liés aux données, à la gestion des risques, à la société et à l'éthique. Cette analyse examine les principaux avantages et inconvénients de l'intelligence artificielle open source et propose sept recommandations pour stimuler son adoption.

Logiciels libres et IA : une alliance stratégique pour l'avenir européen

La convergence des logiciels libres et de l'intelligence artificielle est à l'origine de progrès rapides dans un certain nombre de secteurs. Cette approche de l'IA open source (IA OSS) s'accompagne d'un fort potentiel d'innovation, tant dans le secteur public que dans le secteur privé, grâce à la capacité et à l'adoption par les individus et les organisations de réutiliser librement les logiciels sous licence open source.

Dans l'UE, l'IA a de grandes chances d'apporter une transformation numérique dans des secteurs tels que le commerce : actuellement, seule une entreprise sur cinq dans l'UE est hautement numérisée, tandis que 60 % des grandes industries et plus de 90 % des petites et moyennes entreprises (PME) sont à la traîne en matière d'innovation numérique. L'OSS AI peut aider les entreprises à tirer parti des meilleures innovations dans les modèles et les plateformes déjà créés, et donc à se concentrer sur l'innovation dans leur expertise spécifique.

Dans le secteur public, les logiciels libres ont l'avantage de renforcer la transparence, en ouvrant la « boîte noire », et, en fin de compte, la confiance des citoyens dans l'administration publique et la prise de décision. En outre, les gouvernements peuvent stimuler les activités économiques en fournissant des logiciels libres aux entreprises nationales et locales. Dans le secteur public des États membres européens, les politiques et la législation en matière de logiciels libres sont le plus souvent intégrées dans les initiatives plus larges de numérisation dans le cadre politique et juridique de ces pays.

Toutefois, la plupart des pays n'ont pas de lien clair avec les politiques et stratégies en matière d'IA (la République tchèque et la Finlande étant les seuls pays dont les documents d'orientation se chevauchent). En outre, malgré les progrès et la puissance de l'IA des logiciels libres, de nombreux gouvernements restent attachés aux méthodes traditionnelles de fourniture de services en raison d'un certain nombre de difficultés, telles que leurs systèmes informatiques actuels et anciens, la diminution du budget public consacré à l'innovation numérique ou le manque d'expertise en matière d'IA au sein de leur personnel.

Un aspect particulier à prendre en compte est également lié aux processus de passation des marchés publics pour l'acquisition de systèmes informatiques, qui ne sont souvent pas propices à l'innovation numérique et aux modèles de partenariat typiques de la communauté du logiciel libre et des écosystèmes émergents de la Gov Tech et de la Civic Tech. Cela s'explique notamment par le fait que l'environnement politique actuel n'investit pas suffisamment dans l'adoption accrue des solutions d'IA du logiciel libre, qui sera nécessaire pour atteindre l'objectif de la souveraineté numérique de l'UE.

Bien que les modèles génératifs populaires actuels, tels que ChatGPT, ne soient pas des logiciels libres, ils reposent sur des bases open source comme la bibliothèque Transformer de Hugging Face, TensorFlow et PyTorch. Les LLM open source tels que Mistral, BLOOM et GPT-J offrent un avantage unique : la personnalisation. Ils permettent aux entreprises d'adapter les modèles d'IA à leurs besoins spécifiques, ce qui se traduit par des résultats plus précis et plus pertinents. Ces modèles permettent aux entreprises de développer leurs outils d'IA pour diverses tâches, offrant une sécurité accrue grâce à des contrôles personnalisables. Pour cette raison, les entreprises doivent être prudentes lors de la saisie des données afin d'éviter les biais d'apprentissage de l'IA.

Dans l'ensemble, les LLM nécessitent davantage d'investissements opérationnels et de compétences spécialisées pour une gestion efficace, de sorte que les entreprises doivent tenir compte de leur budget et de leurs ressources lorsqu'elles envisagent de mettre en œuvre des LLM. Le choix entre ces deux options dépend de plusieurs facteurs, notamment la confidentialité des données, les coûts et le niveau de contrôle qu'une entreprise souhaite exercer sur ses systèmes d'IA. Cette prise de décision devient plus urgente à la lumière d'une récente enquête de McKinsey, qui révèle que 40 % des cadres supérieurs prévoient une augmentation des investissements dans la GenAI d'ici à 2024. Cette tendance souligne l'urgence pour les entreprises d'évaluer stratégiquement leurs investissements dans l'IA, en s'assurant qu'ils correspondent à leurs préférences en matière de confidentialité des données, de coûts et de contrôle.

Dans le domaine hautement compétitif de l'intelligence artificielle, l'open source est-il destiné à rester dans l'ombre, toujours en tant que demoiselle d'honneur et jamais en tant que mariée ? Cette perception doit cependant être corrigée. L'open source et l'intelligence artificielle sont en fait nés ensemble. En 1971, alors que la plupart des gens parlaient d'intelligence artificielle, peut-être en pensant aux Trois lois de la robotique d'Isaac Asimov, la discipline était déjà une réalité au MIT. C'est là que Richard M. Stallman (RMS) a rejoint le laboratoire d'intelligence artificielle.

Par la suite, face à l'émergence des logiciels propriétaires, RMS a développé la notion révolutionnaire de logiciel libre. Ce concept, transformé en logiciel libre des décennies plus tard, allait devenir le berceau de l'IA moderne. L'IA moderne, lancée par l'informaticien Alan Turing en 1950 avec son article "Computing Machine and Intelligence", a donné naissance au test de Turing. Ce test suggère qu'une machine est considérée comme intelligente si elle peut donner l'impression de communiquer avec un être humain. Si certains pensent que les IA actuelles en sont capables, d'autres ne sont pas d'accord, bien que les progrès dans cette direction soient évidents.

Défis et limites d'une approche open source de l'intelligence artificielle

L'objectif des travaux de recherche du Parlement Européen est de fournir une analyse du potentiel de l'adoption d'une approche de logiciel libre pour le déploiement de l'intelligence artificielle, dans le but de faciliter les décisions fondées sur des preuves et de synthétiser l'état actuel des connaissances pour relever les défis et les limites liés à une telle approche combinée. L'analyse porte sur le rôle que les logiciels libres pourraient jouer pour accélérer l'utilisation et l'exploitation de l'IA, en particulier dans le secteur public, en fournissant une évaluation critique des principales recherches et données publiées sur le sujet.

Les services d'IA commerciaux, tels que les systèmes GenAI, offrent un cadre de sécurité solide, mais ils ne garantissent pas automatiquement la protection des données de conversation sensibles. Outre la protection de la propriété intellectuelle, les entreprises doivent être vigilantes face aux cybermenaces sophistiquées qui exploitent les technologies d'IA. Les entreprises doivent se préparer à la possibilité que des acteurs malveillants utilisent les systèmes GenAI pour des cyberattaques et des fraudes. Une tactique particulièrement inquiétante est l'"injection rapide", où les pirates manipulent l'IA, comme ChatGPT, pour divulguer des informations sensibles. Il est essentiel que les entreprises consultent leurs fournisseurs d'assurance cybernétique pour vérifier dans quelle mesure les violations liées à l'IA sont couvertes par leurs polices actuelles. La mise en œuvre de mesures de sécurité complètes et la compréhension de la couverture d'assurance sont des étapes essentielles pour se prémunir contre les vulnérabilités exploitées par l'IA.

À l'inverse, les modèles d'IA à code source ouvert qui ne disposent pas d'une sécurité globale intégrée obligent les entreprises à créer leurs propres défenses robustes, y compris des mesures contre les attaques par injection rapide et des politiques adaptées en matière d'accès et d'authentification.

Services d'IA commerciaux ou solutions open source

Évaluation des avantages et inconvénients entre l'IA commerciale et open-source Les services commerciaux de GenAI, reconnus pour leur intégration aisée, proposent aux entreprises une voie simple pour adopter l'IA. Ces plateformes sont conçues pour une utilisation immédiate, éliminant ainsi la nécessité d'une configuration complexe ou d'une allocation de ressources étendue. Elles sont prêtes à être déployées dans un environnement professionnel, offrant des fonctionnalités de sécurité solides et une conformité fréquente aux réglementations en matière de données.

Cependant, des préoccupations émergent quant à la façon dont ces services traitent les données sensibles, avec le risque que des informations propriétaires soient incorporées dans leurs ensembles d'entraînement. De plus, les limites du filtrage du contenu et la possibilité de réponses moins précises de l'IA posent des défis. Par exemple, une étude sur le ChatGPT a démontré qu'il pouvait répondre correctement à 16 questions sur 21, mais ses réponses tendaient à être plus prudentes que celles d'un être humain.

D'un autre côté, les modèles de langage naturel (LLM) open-source tels que Mistral, BLOOM et GPT-J offrent un avantage unique : la personnalisation. Ils permettent aux entreprises d'ajuster les modèles d'IA selon leurs besoins spécifiques, engendrant des résultats plus précis et pertinents. Ces modèles offrent la possibilité aux entreprises de développer leurs propres outils d'IA pour diverses tâches, renforçant la sécurité grâce à des contrôles personnalisables. Cependant, l'utilisation de LLM nécessite un investissement opérationnel plus important et des compétences spécialisées pour une gestion efficace. Ainsi, les entreprises doivent prendre en compte leur budget et leurs ressources avant d'opter pour une implémentation de LLM.

Le choix entre ces deux options dépend de plusieurs facteurs, tels que la confidentialité des données, les coûts et le niveau de contrôle que l'entreprise souhaite exercer sur ses systèmes d'IA. Cette décision devient plus urgente à la lumière d'une enquête récente de McKinsey, révélant qu'environ 40 % des cadres supérieurs prévoient d'accroître leurs investissements dans la GenAI d'ici 2024. Cette tendance souligne l'urgence pour les entreprises d'évaluer stratégiquement leurs investissements dans l'IA, en s'assurant qu'ils correspondent à leurs préférences en matière de confidentialité des données, de coûts et de contrôle.

Conseils pour une approche équilibrée Pour naviguer dans la complexité de ces options, des décisions stratégiques alignées sur les exigences opérationnelles, le cadre de sécurité et les obligations de conformité de l'entreprise sont nécessaires. Les LLM open-source offrent un contrôle et une personnalisation étendus, mais exigent un investissement substantiel dans l'infrastructure interne et du personnel qualifié pour la sécurité et la gestion. À l'inverse, les solutions d'IA commerciales, telles que Microsoft Azure OpenAI Service, sont recommandées si une entreprise souhaite mettre l'accent sur la sécurité et la conformité réglementaire. Cependant, elles nécessitent des contrôles internes supplémentaires, notamment des stratégies de filtrage de contenu et de gestion de l'exactitude adaptées.

La mise en œuvre de l'une ou l'autre solution requiert l'intégration de systèmes de filtrage de contenu conformes aux politiques de l'entreprise et aux exigences légales, garantissant ainsi la conformité et la gestion des risques potentiels. Des protocoles de sécurité à plusieurs niveaux, basés sur la classification des données et l'accès basé sur les rôles, sont essentiels pour adapter les mesures de sécurité à la solution d'IA choisie.

Les organisations envisageant d'intégrer l'IA dans leurs flux de travail doivent rester informées sur le paysage juridique et réglementaire. Un engagement continu avec des professionnels du droit pour assurer une conformité à jour et une atténuation des risques est crucial, surtout dans un contexte caractérisé par des avancées technologiques rapides et des réglementations changeantes qui tentent de suivre.

Alors que les organisations adoptent de plus en plus l'IA générative, le défi réside dans le choix entre les modèles commerciaux et les modèles open-source. Les entreprises doivent évaluer attentivement leurs priorités lorsqu'elles choisissent des solutions d'IA. Au-delà des considérations impératives de sécurité et de conformité légale, il est crucial d'évaluer la précision, la personnalisation et la rentabilité de ces technologies.

L'alignement des choix en matière d'IA sur les objectifs opérationnels implique une prise en compte équilibrée de ces facteurs clés, veillant à ce que les systèmes sélectionnés répondent non seulement aux normes réglementaires, mais s'alignent également sur les besoins spécifiques et les contraintes budgétaires de l'entreprise. Une approche stratégique adaptée aux besoins de chaque entreprise est nécessaire pour naviguer sur ce terrain complexe.

Sources : Willow Tree, McKinsey, European Parliament, Study requested by the AIDA committee

Et vous ?

Quel est votre avis sur le sujet ?

Quelle est selon vous, la meilleure option pour les entreprises : des services d'IA libres ou commerciaux ?

Est-ce que les conclusions des recherches menées par Willowtree, McKinsey, et l'étude commissionnée par la commission AIDA sont pertinentes ?

Voir aussi :

La startup française Mistral AI publie un modèle d'IA open source de 7,3 milliards de paramètres appelé "Mistral 7B", qui serait plus performant que le modèle d'IA Llama 2 13B de Meta

Google publie en open source sur GitHub "Magika", un outil alimenté par l'IA pour l'identification rapide et efficace des types de fichiers

L'Open Source serait en difficulté et ce n'est pas la faute des grandes entreprises technologiques, d'après Jan Kammerath

Une erreur dans cette actualité ? Signalez-nous-la !