La plateforme d'évaluation AI Yupp a levé 33 millions de dollars pour redéfinir le modèle d'évaluation de l'intelligence artificielle
Avec la large diffusion des applications d'intelligence artificielle, comment évaluer avec précision les performances des modèles et renforcer la confiance des utilisateurs est devenu un problème urgent à résoudre. Les méthodes d'évaluation traditionnelles reposent souvent sur des mécanismes centralisés, ce qui rend difficile une couverture complète des scénarios diversifiés et ne reflète pas fidèlement les préférences des utilisateurs. Parallèlement, le problème de "l'illusion" des modèles se produit fréquemment, et les utilisateurs se retrouvent souvent piégés dans des chambres d'écho d'informations lors de leurs choix.
La nouvelle plateforme Yupp, grâce à son modèle de crowdsourcing unique et à son mécanisme d'incitation, tente de redéfinir la découverte, la comparaison et l'utilisation des modèles d'IA, apportant une innovation dans le domaine de l'évaluation de l'IA. Cet article analysera en profondeur les mécanismes fondamentaux de Yupp, ses caractéristiques techniques, le contexte de son équipe et son impact potentiel sur l'écosystème de l'IA.
Contexte de l'équipe et aperçu du financement
Yupp s'engage à résoudre le problème d'évaluation qui existe depuis longtemps dans le domaine de l'IA, visant à construire un marché de rétroaction AI "démunisé". Grâce à la blockchain et à des incitations économiques cryptographiques, la plateforme permet à des retours d'utilisateurs diversifiés de circuler librement, formant ainsi une couche d'évaluation de modèle évolutive, équitable et transparente. Yupp aide les développeurs d'IA à itérer et optimiser les performances des modèles en stimulant la distribution de données d'annotation manuelles de haute qualité, capturant rapidement les véritables besoins et préférences des utilisateurs dans différents scénarios.
Le projet a été fondé en juin 2024 par Pankaj Gupta (cofondateur et PDG) et Gilad Mishne (cofondateur et responsable de l'IA), avec la participation du chef scientifique Jimmy Lin (professeur à l'Université de Waterloo). Les trois ont travaillé ensemble en 2010 dans la même entreprise technologique, où ils ont conçu et optimisé des systèmes de recommandation et de recherche à grande échelle, et ont ensuite acquis une riche expérience dans d'autres entreprises technologiques renommées.
La philosophie décentralisée de Yupp et sa vision de la transparence de la valeur des données répondent aux doubles exigences des entreprises d'IA en matière d'évaluation fiable et de participation des utilisateurs. De plus, grâce aux antécédents riches de l'équipe dirigeante, Yupp a obtenu une reconnaissance élevée de la part de personnalités connues de l'industrie technologique et de capital-risqueurs de premier plan.
Récemment, Yupp a annoncé avoir levé 33 millions de dollars lors d'un tour de financement de semences, dirigé par un partenaire de capital-risque renommé. D'autres investisseurs incluent plusieurs dirigeants de grandes entreprises technologiques, des experts académiques et 45 investisseurs providentiels et dirigeants d'entreprises renommés.
Fonctionnalités clés et expérience utilisateur
En tant que plateforme d'évaluation AI innovante, Yupp adhère au principe "AI partagé par tous", permettant aux utilisateurs de découvrir, comparer et utiliser facilement les derniers modèles d'IA. Contrairement à une réponse unique traditionnelle, Yupp renvoie simultanément les réponses de deux (voire plusieurs) modèles pour chaque invite, formant ainsi un "congrès AI". Cette conception répond non seulement aux besoins des utilisateurs en matière de choix diversifiés, mais permet également d'identifier efficacement les "hallucinations" potentielles des modèles, aidant les utilisateurs à prendre des décisions plus éclairées grâce à la comparaison.
La plateforme prend actuellement en charge plus de 500 modèles d'IA, couvrant les domaines de la génération de texte et d'images, y compris plusieurs grands modèles de langage connus ainsi que de nombreux modèles émergents. Pour optimiser davantage l'expérience, Yupp a également lancé la fonction "QuickTake", qui peut condenser des réponses longues en un résumé concis.
De plus, Yupp attache une grande importance à la vie privée des utilisateurs : tous les historiques de chat sont par défaut privés, sauf si l'utilisateur choisit de les rendre publics ; même lors du partage public, aucune information personnelle n'est divulguée. Les utilisateurs peuvent contrôler à tout moment le contenu et l'étendue du partage.
Modèle économique et mécanismes d'incitation
Yupp utilisera gratuitement les retours des utilisateurs, en mesurant l'utilisation du modèle grâce au système de "points Yupp". Les nouveaux utilisateurs reçoivent 5000 points lors de leur inscription, puis peuvent gagner plus de points en notant les réponses du modèle, en choisissant des préférences et en expliquant leurs raisons. Plus la qualité des retours est élevée, plus les récompenses sont généreuses, garantissant aux utilisateurs une utilisation gratuite et durable, y compris pour certains modèles haut de gamme. La plateforme s'engage à ce que les points n'augmentent que, et tous les modèles actuels peuvent être expérimentés gratuitement.
Après chaque question posée par l'utilisateur, deux réponses du modèle seront fournies, et en donnant des retours, l'utilisateur pourra gagner des "cartes à gratter numériques", avec des récompenses allant de 0 à 250 points Yupp. Chaque 1000 points peuvent être échangés contre 1 dollar, et l'utilisateur peut retirer jusqu'à 10 dollars par jour, avec un maximum de 50 dollars par mois. Les points peuvent être échangés contre plus de 20 devises, avec des partenaires comprenant plusieurs plateformes de paiement bien connues. De plus, la plateforme intègre certains réseaux de blockchain et des stablecoins, offrant des récompenses instantanées et sans frais aux utilisateurs du monde entier.
Pour attirer plus de participants, Yupp a également mis en place un programme de récompenses de parrainage : le parrain et le filleul peuvent tous deux obtenir des points supplémentaires.
Système de notation Yupp VIBE
Pour remédier au manque de transparence des classements existants, à leur équité insuffisante et à l'inégalité d'accès aux données d'évaluation, Yupp a lancé la version bêta de son classement AI et du système de notation "Yupp VIBE (Vibe Intelligence Benchmark) Score". Ce système agrège les données de préférence générées par les utilisateurs du monde entier lors d'interactions naturelles, visant à fournir des résultats d'évaluation robustes et fiables.
Les principes d'évaluation de Yupp incluent la robustesse (couvrir divers scénarios, refléter les préoccupations des utilisateurs, résister aux comportements malveillants) et la fiabilité (absence de biais envers le modèle, divulgation détaillée de l'algorithme de classement, respect des normes d'évaluation).
La plateforme non seulement collecte les préférences binaires, mais encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses, et effectue une analyse de segmentation basée sur les informations démographiques des utilisateurs, montrant les différences de préférences entre les différents groupes.
Sur le plan technique, Yupp explore l'utilisation de la blockchain, des primitives cryptographiques et des preuves à zéro connaissance pour garantir l'équité, la transparence et la vérifiabilité du processus d'évaluation. Parallèlement, la plateforme a collaboré avec des fournisseurs de données AI professionnels pour calibrer les évaluateurs via la vérification de dossiers et des contrôles de qualité multicouches, éliminant ainsi les données malveillantes.
 et Gilad Mishne (cofondateur et responsable de l'IA), avec la participation du chef scientifique Jimmy Lin (professeur à l'Université de Waterloo). Les trois ont travaillé ensemble en 2010 dans la même entreprise technologique, où ils ont conçu et optimisé des systèmes de recommandation et de recherche à grande échelle, et ont ensuite acquis une riche expérience dans d'autres entreprises technologiques renommées.
La philosophie décentralisée de Yupp et sa vision de la transparence de la valeur des données répondent aux doubles exigences des entreprises d'IA en matière d'évaluation fiable et de participation des utilisateurs. De plus, grâce aux antécédents riches de l'équipe dirigeante, Yupp a obtenu une reconnaissance élevée de la part de personnalités connues de l'industrie technologique et de capital-risqueurs de premier plan.
Récemment, Yupp a annoncé avoir levé 33 millions de dollars lors d'un tour de financement de semences, dirigé par un partenaire de capital-risque renommé. D'autres investisseurs incluent plusieurs dirigeants de grandes entreprises technologiques, des experts académiques et 45 investisseurs providentiels et dirigeants d'entreprises renommés.
Fonctionnalités clés et expérience utilisateur
En tant que plateforme d'évaluation AI innovante, Yupp adhère au principe "AI partagé par tous", permettant aux utilisateurs de découvrir, comparer et utiliser facilement les derniers modèles d'IA. Contrairement à une réponse unique traditionnelle, Yupp renvoie simultanément les réponses de deux (voire plusieurs) modèles pour chaque invite, formant ainsi un "congrès AI". Cette conception répond non seulement aux besoins des utilisateurs en matière de choix diversifiés, mais permet également d'identifier efficacement les "hallucinations" potentielles des modèles, aidant les utilisateurs à prendre des décisions plus éclairées grâce à la comparaison.
La plateforme prend actuellement en charge plus de 500 modèles d'IA, couvrant les domaines de la génération de texte et d'images, y compris plusieurs grands modèles de langage connus ainsi que de nombreux modèles émergents. Pour optimiser davantage l'expérience, Yupp a également lancé la fonction "QuickTake", qui peut condenser des réponses longues en un résumé concis.
De plus, Yupp attache une grande importance à la vie privée des utilisateurs : tous les historiques de chat sont par défaut privés, sauf si l'utilisateur choisit de les rendre publics ; même lors du partage public, aucune information personnelle n'est divulguée. Les utilisateurs peuvent contrôler à tout moment le contenu et l'étendue du partage.
Modèle économique et mécanismes d'incitation
Yupp utilisera gratuitement les retours des utilisateurs, en mesurant l'utilisation du modèle grâce au système de "points Yupp". Les nouveaux utilisateurs reçoivent 5000 points lors de leur inscription, puis peuvent gagner plus de points en notant les réponses du modèle, en choisissant des préférences et en expliquant leurs raisons. Plus la qualité des retours est élevée, plus les récompenses sont généreuses, garantissant aux utilisateurs une utilisation gratuite et durable, y compris pour certains modèles haut de gamme. La plateforme s'engage à ce que les points n'augmentent que, et tous les modèles actuels peuvent être expérimentés gratuitement.
Après chaque question posée par l'utilisateur, deux réponses du modèle seront fournies, et en donnant des retours, l'utilisateur pourra gagner des "cartes à gratter numériques", avec des récompenses allant de 0 à 250 points Yupp. Chaque 1000 points peuvent être échangés contre 1 dollar, et l'utilisateur peut retirer jusqu'à 10 dollars par jour, avec un maximum de 50 dollars par mois. Les points peuvent être échangés contre plus de 20 devises, avec des partenaires comprenant plusieurs plateformes de paiement bien connues. De plus, la plateforme intègre certains réseaux de blockchain et des stablecoins, offrant des récompenses instantanées et sans frais aux utilisateurs du monde entier.
Pour attirer plus de participants, Yupp a également mis en place un programme de récompenses de parrainage : le parrain et le filleul peuvent tous deux obtenir des points supplémentaires.
Système de notation Yupp VIBE
Pour remédier au manque de transparence des classements existants, à leur équité insuffisante et à l'inégalité d'accès aux données d'évaluation, Yupp a lancé la version bêta de son classement AI et du système de notation "Yupp VIBE (Vibe Intelligence Benchmark) Score". Ce système agrège les données de préférence générées par les utilisateurs du monde entier lors d'interactions naturelles, visant à fournir des résultats d'évaluation robustes et fiables.
Les principes d'évaluation de Yupp incluent la robustesse (couvrir divers scénarios, refléter les préoccupations des utilisateurs, résister aux comportements malveillants) et la fiabilité (absence de biais envers le modèle, divulgation détaillée de l'algorithme de classement, respect des normes d'évaluation).
La plateforme non seulement collecte les préférences binaires, mais encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses, et effectue une analyse de segmentation basée sur les informations démographiques des utilisateurs, montrant les différences de préférences entre les différents groupes.
Sur le plan technique, Yupp explore l'utilisation de la blockchain, des primitives cryptographiques et des preuves à zéro connaissance pour garantir l'équité, la transparence et la vérifiabilité du processus d'évaluation. Parallèlement, la plateforme a collaboré avec des fournisseurs de données AI professionnels pour calibrer les évaluateurs via la vérification de dossiers et des contrôles de qualité multicouches, éliminant ainsi les données malveillantes.
![a16z a investi 33 millions de dollars dans un tour de table d'amorçage, comment Yupp redéfinit-il le modèle d'évaluation de l'IA basé sur la blockchain et les incitations ?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01
Histoire et perspectives d'avenir
Yupp sera officiellement lancé le 13 juin 2025, après six mois de tests internes. Depuis son lancement, le produit a été continuellement itéré :
La mission de Yupp est "d'habiliter l'humanité à façonner l'avenir de l'IA". Grâce aux réponses d'IA multi-perspectives et aux retours des utilisateurs, Yupp non seulement aide les utilisateurs à prendre de meilleures décisions, mais fournit également une motivation continue pour l'évolution de l'IA.
Dans l'ensemble, Yupp ouvre de nouvelles voies pour l'évaluation de l'IA grâce à un système d'évaluation basé sur un modèle de crowdsourcing, des mécanismes d'incitation et les préférences réelles des utilisateurs. Il offre aux utilisateurs une expérience interactive avec l'IA gratuite et diversifiée, tout en transformant les retours des utilisateurs en données d'entraînement de haute valeur, favorisant ainsi l'optimisation continue des modèles. Grâce à une équipe expérimentée et un soutien financier solide, Yupp est bien positionné pour jouer un rôle important dans l'écosystème de l'IA à l'avenir, réalisant la vision "Chacun bénéficie de l'IA, chacun façonne l'IA".
Cependant, en tant que plateforme émergente, Yupp fait encore face à de nombreux défis. Comment garantir en continu la qualité des données avec une participation massive des utilisateurs, résister aux comportements frauduleux potentiels, et trouver un équilibre entre la commercialisation et l'incitation des utilisateurs, sera une direction à explorer et optimiser constamment dans son développement futur.