Open Computer Agent : l’agent IA d’Hugging Face qui exécute vos requêtes sur un PC virtuel

Les agents IA sont en train de devenir la nouvelle tendance du moment. Après OpenAI et son fameux Operator réservé aux abonnés de ChatGPT Pro, c’est au tour de Hugging Face de se lancer dans l’arène avec un agent gratuit et accessible à tous. Son nom : Open Computer Agent.

Derrière ce nom un peu générique se cache un outil plutôt original : une interface en ligne qui vous permet de piloter un véritable ordinateur sous Linux grâce à l’intelligence artificielle. Vous lui demandez d’ouvrir un site, de chercher une info, d’interagir avec un programme, et il s’exécute, comme si vous étiez devant l’écran. En théorie, du moins.

On a testé cet agent IA de Hugging Face dès sa sortie, et s’il montre bien le potentiel des modèles open source, il reste encore loin d’un usage fluide et instantané. File d’attente, lenteurs, tâches limitées… on vous dit ce que vous pouvez vraiment en attendre aujourd’hui.

Une machine virtuelle Linux pilotée par une IA

Dès qu’on lance Open Computer Agent, le décor est planté. L’interface, qui rappelle un vieux terminal futuriste tout droit sorti de Tron, affiche un ordinateur virtuel sous Linux, prêt à recevoir vos ordres. Sur la gauche, un encart permet de décrire la tâche à exécuter : par exemple, « ouvre Google Maps et cherche l’adresse du siège de Hugging Face » ou encore « va sur Wikipédia pour voir ce qui s’est passé le 4 avril ». Et l’IA se charge du reste.

Sous le capot, l’agent utilise une combinaison de modèles open source, notamment Qwen-VL, capable de « voir » l’écran comme un humain et de cliquer sur les éléments grâce à la reconnaissance visuelle. Concrètement, ça veut dire que l’IA n’exécute pas des lignes de commande : elle agit dans l’environnement graphique comme n’importe quel utilisateur.

Interface de l’Open Computer Agent de Hugging Face avec un bureau Linux simulé dans un cadre rétro futuriste

Un test en conditions réelles : lent, mais fonctionnel

Pour voir ce que l’agent avait dans le ventre, on s’est prêté au jeu. Première impression : c’est lent. Très lent. Avant même de lancer la moindre tâche, une pop-up nous avertit que le service est saturé. Pas étonnant, vu l’effet de curiosité que ce genre de projet peut susciter dès sa sortie.

Une fois notre tour arrivé, l’agent nous a enfin présenté son bureau Linux, avec quelques icônes classiques (Corbeille, Dossier personnel, Navigateur…). On a saisi une requête simple : aller sur justgeek.fr et ouvrir le premier article disponible. Et là encore, il a fallu faire preuve de patience.

L’IA a bel et bien ouvert le navigateur, tapé l’URL et accédé au site. L’exécution était loin d’être instantanée, mais elle a fonctionné. Pour une tâche basique comme celle-là, Open Computer Agent s’en sort honnêtement. Il simule l’action humaine sans script ou automatisation cachée, ce qui donne une idée assez claire de ce qu’on peut faire — ou pas — avec lui.

Exemple de tâche saisie dans Open Computer Agent avec la machine virtuelle Linux affichée à l’écran

Des limites bien visibles

Si Open Computer Agent peut accomplir quelques tâches simples, inutile de lui demander la lune. Dès que la requête devient un peu trop ambitieuse — comme chercher un vol, remplir un formulaire ou gérer plusieurs onglets — il perd vite les pédales. L’agent peut cliquer au mauvais endroit, rester bloqué sur un chargement, ou tout simplement ne rien faire du tout.

Autre point faible : les CAPTCHA. Ces petits tests anti-bots sont sa kryptonite. Il n’est pas encore capable de les résoudre, ce qui bloque certaines actions en cours de route. Le système vous invite alors à intervenir manuellement, mais on perd ici tout l’intérêt d’avoir un agent autonome.

À cela s’ajoute une exécution assez saccadée : chaque clic, chaque déplacement de souris est visible et prend du temps. On a parfois l’impression de regarder une personne âgée découvrir Internet pour la première fois — sauf qu’il s’agit d’une IA boostée aux modèles visuels dernier cri.

Les agents IA, nouvelle tendance du moment

Depuis quelques mois, les agents IA font de plus en plus parler d’eux. On ne parle plus seulement de poser une question à un chatbot, mais bien de lui confier des tâches concrètes, à exécuter comme le ferait un humain devant un PC.

OpenAI a lancé la tendance avec Operator, son agent intelligent capable de naviguer sur le web ou de réserver un billet d’avion. Problème : Operator est réservé aux utilisateurs de ChatGPT Pro (200$ par mois…). Autrement dit, pas grand monde y a accès.

C’est là que Hugging Face joue une carte intéressante. En rendant son Open Computer Agent gratuit et accessible depuis n’importe quel navigateur, la startup française mise sur la transparence et la communauté open source. Même si l’outil reste perfectible, il montre qu’on peut expérimenter des choses ambitieuses sans abonnement ni écosystème fermé.

Un premier pas prometteur, mais pas encore prêt pour tout

Avec Open Computer Agent, Hugging Face montre qu’il est possible de piloter un ordinateur virtuel via une IA, gratuitement, depuis un simple navigateur. L’idée est ambitieuse, l’exécution encore un peu bancale, mais le projet mérite le détour.

Pour l’instant, mieux vaut se contenter de tâches simples et ne pas trop compter sur lui pour des actions complexes ou urgentes. La lenteur du service et les blocages ponctuels rappellent qu’on est encore dans l’expérimental. Mais comme vitrine du potentiel des modèles open source, c’est une belle démonstration.

Et puis, qui sait ? Avec un peu d’optimisation et de puissance serveur en plus, cet agent IA pourrait devenir un véritable assistant virtuel, capable de vraiment faire le travail à votre place — sans abonnement premium ni conditions obscures.

Source : TechCrunch


Cet article vous a plu ? N'hésitez pas à le partager sur les réseaux sociaux et abonnez-vous à JustGeek sur Google News pour ne manquer aucun article !

Et si vous souhaitez aller plus loin dans votre soutien, vous pouvez nous offrir un petit café virtuel ☕️. Merci pour votre soutien ❤️ !

Offrez-nous un café
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Article précédent
Robot Meta collectant des données personnelles sur Facebook, Instagram et WhatsApp

Meta veut aspirer vos données Facebook, Instagram et WhatsApp pour son IA : voici comment l’en empêcher

Article suivant
Illustration d’un PC avec un jeu mis en pause, représentant le fonctionnement de Nyrna pour suspendre une application ou un jeu sur Windows et Linux

Nyrna : le bouton pause pour vos applications et jeux sur PC

À découvrir également