Lemon Slice 2 transforme n'importe quelle image en un avatar IA parlant en temps réel : « Nos modèles d'avatars sont charismatiques et agréables à interagir », déclare Lina Colucci, cofondatrice et PDGLemon Slice, un nouveau laboratoire de recherche et de développement axé sur la technologie vidéo interactive, a lancé Lemon Slice 2, un modèle d'intelligence artificielle (IA) qui transforme une image en avatar conversationnel capable de réagir en temps réel. Ce modèle fonctionne avec un large éventail d'images et prend en charge les expressions faciales, les gestes et les dialogues, sans nécessiter de formation ni de réglage préalable, selon la société. Lemon Slice 2 est disponible sous forme d'API et de widget intégrable.
Lemon Slice décrit son nouveau modèle comme un système « zero shot » qui produit un appel vidéo en temps réel à partir d'une seule entrée. L'outil accepte de nombreux types de visuels, notamment des portraits, des illustrations et des œuvres d'art stylisées. Une fois téléchargé, le modèle génère un avatar animé qui réagit en temps réel pendant une conversation.
« Lemon Slice-2 est un nouveau modèle de transformeur de diffusion vidéo et un cadre d'inférence qui permet des expériences d'avatar interactives en temps réel. Lemon Slice-2 est un modèle causal [...] comprenant 20 milliards de paramètres qui atteint un débit de génération de 20 images par seconde sur un seul GPU. Il prend en charge la génération d'avatars en pied avec des gestes expressifs et sémantiquement sensibles », a déclaré l'entreprise.
Deux options sont disponibles : une API destinée aux développeurs qui souhaitent ajouter des avatars interactifs à des produits existants, et un widget qui peut être placé sur un site web à l'aide d'une seule ligne de code. Il crée une bulle à l'écran avec laquelle les utilisateurs peuvent dialoguer.
Le modèle fonctionne avec un transformeur de diffusion et produit chaque image directement plutôt que de s'appuyer sur des mouvements préenregistrés. Le système prend en charge l'animation faciale, les gestes des mains et les mouvements corporels plus amples.
Pour franchir la barrière du temps réel, l'entreprise a indiqué avoir utilisé plusieurs stratégies comprennant l'attention causale, un nouveau paradigme d'entraînement inspiré de la distillation par correspondance de distribution, une mise en cache efficace, l'accélération graphique CUDA et la quantification. Les utilisateurs de Lemon Slice 2 bénéficient d'un temps de réponse moyen de 2,8 secondes, la génération vidéo ne représentant que 26 % de ce temps (730 millisecondes).
Par ailleurs, en tant que modèle autorégressif, Lemon Slice-2 ne se limite pas à générer des vidéos d'une durée fixe. Contrairement à d'autres modèles autorégressifs, il ne subit pas d'accumulation d'erreurs, ce qui permet de générer des vidéos d'une durée illimitée.
La société Lemon Slice, qui a levé 10,5 millions de dollars en financement initial, souligne que les autres outils d'avatar nécessitent souvent une formation vidéo, un réglage personnalisé ou des entrées photoréalistes, ce qui n'est pas le cas de Lemon Slice 2, qui traite plutôt des images uniques.
Les développeurs peuvent le connecter à des systèmes de chat existants, y compris des agents vocaux et des assistants textuels.
Fonctions de sécurité de Lemon Slice 2
Plusieurs garde-fous ont été mis en place pour garantir la sécurité et le consentement. Les utilisateurs doivent d'abord confirmer qu'ils ont l'autorisation d'utiliser l'image ou la voix téléchargée. Le widget indique clairement la participation de l'IA, afin que les utilisateurs ne pensent pas qu'ils sont réellement en train de converser avec Donald Trump ou Jésus. Des systèmes de modération du contenu sont également en place, et les comptes peuvent être bannis en cas d'utilisation abusive.
Lina Colucci, cofondatrice et PDG, a déclaré : « La principale critique à l'égard des avatars IA est qu'ils manquent de réalisme et nuisent à la valeur ajoutée. Nos modèles d'avatars sont charismatiques et agréables à interagir. À l'avenir, toutes les vidéos seront interactives et personnalisées en fonction de la personne qui les regarde. Nous développons la technologie qui rend cela possible. »
Lemon Slice envisage un large éventail d'utilisations futures pour son produit, notamment des outils pédagogiques présentant des leçons à l'aide de personnages animés, des guides d'achat sur écran capables de répondre à des questions et des systèmes d'admission dans les établissements de santé guidant les patients dans le remplissage de formulaires ou leur fournissant des instructions de base.
Source : Lemon Slice
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous des fonctionnalités proposées par cet outil ? Les trouvez-vous utiles et intéressantes ?Voir aussi :
OpenAI lance GPT Image 1.5, son dernier modèle IA de génération d'images, pour rivaliser avec Gemini Nano Banana de Google, offrant des vitesses de génération d'images jusqu'à quatre fois plus rapides
Microsoft AI annonce le premier générateur d'images créé en interne, MAI-Image-1, qui se classe n° 9 au classement LMArena face aux modèles les plus performants d'OpenAI et de Google
Google lance Nano Banana Pro, un générateur d'images par IA mis à jour et alimenté par Gemini 3 : « Il est incroyable pour les infographies », déclare Josh Woodward, vice-président de Google Labs et Gemini
Vous avez lu gratuitement 12 192 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.