Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Microsoft propose en open source son algorithme d'apprentissage automatique SPTAG
Qui rend son moteur de recherche Bing un peu plus « intelligent »

Le , par Stéphane le calme

220PARTAGES

6  0 
Les moteurs de recherche d'aujourd'hui ont beaucoup évolué ; ils ne se contentent plus de retourner des pages après avoir reçu un ou plusieurs mots clés, mais tentent également de répondre à des questions, de proposer des contextes, etc. Les utilisateurs ont même la possibilité de faire des recherches à partir d’autres éléments comme des images.

Bien sûr, suivre les préférences de recherche des utilisateurs n’est pas nouveau: c’est un combat difficile depuis la création de la recherche Web. Mais maintenant, il devient moins difficile de répondre à ces besoins en constante évolution, grâce aux progrès de l’intelligence artificielle, y compris ceux mis au point par l’équipe de recherche de Bing et les chercheurs du laboratoire de recherche de Microsoft.

« L'intelligence artificielle rend les produits avec lesquels nous travaillons de plus en plus naturels », a déclaré Rangan Majumder, responsable du programme de groupe de l’équipe de recherche Bing et d’intelligence artificielle de Microsoft. « Avant, les gens devaient se dire : " Je me sers d’un ordinateur, alors comment puis-je entrer ma requête de manière à ne pas fausser les résultats de la recherche? " ».

Les algorithmes d’apprentissage automatique de Bing sont utilisés pour créer des vecteurs, essentiellement une représentation numérique d'un mot, d'un pixel d'image ou d'un autre point de données. Un vecteur aide donc à capturer ce que signifie réellement une donnée, qu’il s’agisse de texte sur une page Web, d’images, de son ou de vidéos.

Utiliser les vecteurs pour faire de meilleures recherches

Une fois que le point numérique a été attribué à une donnée, vous pouvez organiser ou mapper des vecteurs, avec des nombres proches placés à proximité les uns des autres pour représenter la similarité. Ces résultats proximaux sont affichés aux utilisateurs, ce qui améliore les résultats de recherche.

Microsoft a commencé à s’intéresser à la technologie sur laquelle s’appuie la recherche vectorielle utilisée par Bing lorsque les ingénieurs de la société ont commencé à remarquer des tendances inhabituelles dans les modèles de recherche des utilisateurs.

« En analysant nos journaux, l'équipe a constaté que les requêtes de recherche devenaient de plus en plus longues », a expliqué Majumder. Cela suggérait que les utilisateurs posaient plus de questions, donnaient beaucoup de détails à cause des résultats antérieurs qui ne leur ont pas donné satisfaction avec une recherche par mot clé, ou « essayaient d'agir comme des ordinateurs » lorsqu'ils décrivaient des choses abstraites - toutes choses peu naturelles et peu pratiques pour les utilisateurs.


Avec Bing Search, la vectorisation s’est étendue à plus de 150 milliards de données indexées par le moteur de recherche afin d’améliorer la comparaison par rapport aux mots clés classiques. Ceux-ci incluent des mots simples, des caractères, des extraits de page Web, des requêtes complètes et d'autres supports. Une fois qu'un utilisateur effectue une recherche, Bing peut analyser les vecteurs indexés et fournir la meilleure correspondance.

L'attribution de vecteur est également formée à l'aide d'une technologie d'apprentissage en profondeur pour une amélioration continue. Les modèles prennent en compte des entrées telles que les clics de l'utilisateur final après une recherche pour mieux comprendre le sens de cette recherche.

Si l’idée de vectoriser les médias et les données de recherche n’est pas nouvelle, il n’a été possible que récemment de l’utiliser à l’échelle d’un puissant moteur de recherche tel que Bing, ont déclaré des experts Microsoft.

« Bing traite des milliards de documents chaque jour. L’idée est maintenant que nous pouvons représenter ces entrées sous forme de vecteurs et rechercher dans cet index géant de plus de 100 milliards de vecteurs pour trouver les résultats les plus connexes en 5 millisecondes », a déclaré Jeffrey Zhu, responsable du programme. responsable de l’équipe Bing de Microsoft.

Pour mettre cela en perspective, a déclaré Majumder, considérez ceci: Une pile de 150 milliards de cartes de visite irait d’ici à la Lune. En un clin d’œil, la recherche de Bing à l’aide de SPTAG permet de localiser successivement 10 cartes de visite différentes dans cette pile de cartes.

En fait, Microsoft utilise un algorithme appelé SPTAG (Space Partition Tree and Graph). Une requête d'entrée est convertie en un vecteur et SPTAG est utilisé pour trouver rapidement des "voisins les plus proches approximatifs" (ANN - approximate nearest neighbors), c'est-à-dire des vecteurs similaires à l'entrée.


« La recherche par vecteur facilite la recherche par concept plutôt que par mot clé. Par exemple, si un utilisateur tape "Quelle est la hauteur de la tour à Paris?", Bing peut renvoyer un résultat en langage naturel indiquant à l'utilisateur que la tour Eiffel mesure 1 063 pieds, bien que le mot "Eiffel" n’apparaisse pas dans la requête de recherche et que le mot “hauteur” n'apparaisse pas dans le résultat.

« Microsoft utilise la recherche vectorielle pour son propre moteur de recherche Bing, technologie qui aide Bing à mieux comprendre l'intention qui sous-tend des milliards de recherches sur le Web et à trouver le résultat le plus pertinent parmi des milliards de pages Web ».

Utilisation pour la recherche visuelle et audio

Microsoft a mis à la disposition de tous, en tant que projet open source sur GitHub, « l’un des outils d’intelligence artificielle les plus avancés et le mieux adapté pour répondre aux besoins de recherche en constante évolution des utilisateurs ». Mercredi, l’éditeur a également publié des exemples de techniques utilisateur et une vidéo d’accompagnement pour ces outils via le laboratoire d’IA de Microsoft.

L’équipe Bing a déclaré qu’elle s’attendait à ce que l’offre open source puisse être utilisée par les entreprises ou les applications grand public pour identifier une langue parlée sur la base d’un extrait audio, ou pour des services comportant beaucoup d’images, comme une application permettant aux utilisateurs de prendre des photos de fleurs et d’identifier le type de fleur. Pour ces types d’applications, une expérience de recherche lente ou non pertinente est frustrante.

« Même quelques secondes pour une recherche peuvent rendre une application inutilisable », a noté Majumder.

L'équipe espère également que les chercheurs et les universitaires l'utiliseront pour explorer d'autres domaines de pointe dans la recherche.

« Nous avons seulement commencé à explorer ce qui est vraiment possible autour de la recherche vectorielle à cette profondeur », a-t-il déclaré.

dépôt GitHub SPTAG
Vidéo d'accompagnement

Source : Microsoft

Voir aussi :

Microsoft : un bogue Windows "wormable" pourrait conduire à un autre WannaCry, les utilisateurs d'anciennes versions doivent appliquer le patch
Microsoft présente une préversion de son système décentralisé d'identification, ION s'appuie sur la blockchain Bitcoin
Microsoft annonce la disponibilité générale d'Azure Dev Spaces, un add-on pour Azure Kubernetes Service qui ambitionne de booster la productivité
Microsoft rapproche Windows 10 d'un avenir sans mots de passe, avec le déploiement de la certification FIDO2 dans la prochaine mise à jour Windows 10

Une erreur dans cette actualité ? Signalez-le nous !