AIアプリケーションがさまざまな業界に浸透する中、モデルのパフォーマンスを正確に評価し、ユーザーの信頼を高めることが緊急の課題となっています。従来の評価は中央集権的なメカニズムに依存することが多く、多様なシナリオをカバーすることが困難で、真のユーザーの好みを反映することができません。同時に、モデルの「ハルシネーション」の問題が頻繁に発生し、ユーザーが選択を行う際に情報のサイロに陥ることがよくあります。
この文脈において、Yuppは新しいプラットフォームとして、独自のクラウドソーシングモデルとインセンティブメカニズムを用いてAIモデルの発見、比較、利用を再構築し、AI評価の分野にパラダイムシフトをもたらそうとしています。この記事では、Yuppのコアメカニズム、技術的ハイライト、チームの背景、そしてAIエコシステムに与える潜在的な影響について掘り下げます。
Yuppは、AI分野における長年の評価課題を解決することに注力しており、「トラストレス」なAIフィードバック市場を構築することに専念しています。これにより、多様なユーザーフィードバックがブロックチェーンと暗号経済的インセンティブの保護の下で自由に流通し、スケーラブルで公平かつ透明なモデル評価レイヤーが形成されます。高品質の手動アノテーションデータの配布にインセンティブを与えることによって、Yuppはさまざまなシナリオにおけるユーザーの真のニーズと好みを迅速に把握し、AI開発者がモデルのパフォーマンスを反復的に最適化するのを助けます。
このプロジェクトは、2024年6月にPankaj Gupta(共同創設者兼CEO)とGilad Mishne(共同創設者兼AI責任者)によって設立され、Chief ScientistのJimmy Lin(ウォータールー大学の教授)もコアチームに参加しました。三人は以前、2010年にTwitterで一緒に働き、大規模な推薦システムと検索システムを構築・最適化し、その後GoogleやCoinbaseで広範な経験を積みました。
データ価値の分散化と透明性のビジョンにより、信頼できる評価とユーザー参加へのAI製造業者の二重の要求を満たすことができ、さらにコアチームの豊富な経験から利益を得て、Yuppはテクノロジー業界の著名人やトップベンチャーキャピタリストから高い評価を得ています。
先週、YuppはA16zのパートナーであるクリス・ディクソンが主導する3300万ドルのシードラウンドファイナンスの完了を発表しました。他の投資家には、Googleのチーフサイエンティストであるジェフ・ディーン、Twitterの共同創設者であるビズ・ストーン、Pinterestの共同創設者であるエヴァン・シャープ、PerplexityのCEOアラヴィンド・スリニヴァス、スタンフォード大学のダン・ボーネ、クリス・レ、ニック・マキューン、バラジ・プラバカールなど、45人の著名なエンジェルや企業幹部、さらにCoinbase Venturesが含まれています。
中央集権的なAI評価プラットフォームであるYuppは、「すべての人のためのすべてのAI」という哲学を遵守し、ユーザーが最新のAIモデルを簡単に発見、比較、利用できるようにしています。従来の単一応答とは異なり、Yuppは各プロンプトに対して2つ(あるいはそれ以上)のモデルから同時に回答を返し、「AI議会」を形成します。このデザインは、ユーザーの多様な選択に対する要求を満たすだけでなく、モデルが生成する可能性のある「幻覚」を効果的に特定し、比較を通じてユーザーがより情報に基づいた意思決定を行えるようにします。YuppのCEOであるPankaj Guptaが述べたように、並列出力は生成エラーを懸念するユーザーにとって特に有益であり、結果を相互確認することができます。
このプラットフォームは現在、500以上のAIモデルをサポートしており、テキストおよび画像生成の分野をカバーしています。ChatGPT、Claude、Gemini、DeepSeek、Grok、Llamaなどの有名なモデルや、多くの新興モデルが含まれています。体験をさらに最適化するために、Yuppは「QuickTake」機能も導入しました。この機能は、長い返信を簡潔なツイートに要約することができます。
さらに、Yuppはユーザーのプライバシーを非常に重視しています:すべてのチャット記録はデフォルトでプライベートであり、ユーザーが積極的に公開しない限り、個人情報は開示されません。ユーザーは、いつでも共有の内容と範囲を制御できます。
Yuppは、ユーザーのフィードバックを無料で利用し、「Yuppポイント」システムを通じてモデルの使用状況を測定します。新しいユーザーは登録時に5000ポイントを受け取り、モデルの応答を評価したり、好みを選択したり、理由を説明したりすることでさらにポイントを獲得できます。フィードバックの質が高いほど報酬が大きくなり、ユーザーはClaude Opus 4やOpenAI o3のような高級モデルを無料で持続的に使用できるようになります。このプラットフォームは、ポイントが増え続けることを約束しており、すべての現在のモデルを無料で体験できるとしています。
各質問の後、ユーザーは2つのモデル応答を受け取り、フィードバックを通じて「デジタルスクラッチカード」を獲得することができ、0から250の範囲でYuppポイントが報酬として与えられます。1000ポイントごとに1ドルと交換でき、1日の最大引き出し額は10ドル、月の最大引き出し額は50ドルです。ポイントはドルやユーロを含む20以上の通貨と交換可能で、Stripe、PayPal、Coinbaseなどのパートナーと提携しています。同時に、プラットフォームはBase Ethernet L2とSolanaステーブルコインを統合し、グローバルなユーザーに即時の手数料無料の報酬を提供します。
Pankaj Guptaが言ったように、ユーザーによって生成される高品質なフィードバックは、AI企業のモデルファインチューニングや強化学習にとって、報酬そのものよりもはるかに価値があります。ユーザーの月収はせいぜい数杯のコーヒーに相当するかもしれませんが、この有料アノテーションデータはAIのイテレーションにとって重要です。
より多くの人々に参加を促すため、Yuppは紹介報酬も設けました:紹介者は5000ポイントを受け取り、紹介された人は1000ポイントを受け取ります;現在、新しく登録したユーザーは5000ポイントを受け取ることができ、紹介された人はさらに2500ポイントを受け取ります。
ランキングの透明性不足、公平性の欠如、評価データへのアクセスの不均衡といった既存の問題に対処するため、YuppはAIランキングのベータ版と「Yupp VIBE (Vibe Intelligence Benchmark) Score」評価システムを発表しました。このシステムは、自然なインタラクションで生成されたグローバルユーザーの好みデータを集約し、堅牢で信頼性のある評価結果を提供することを目的としています。
Yuppの評価原則には次のものが含まれます:
プラットフォームは、バイナリープリファレンスを収集するだけでなく、ユーザーが返信の利点と欠点(「要点を押さえた」、「速いスピード」、「良いスタイル」など)を指摘することを奨励し、ユーザーの年齢、教育、職業、その他の情報に基づいてクラスタ分析を行い、異なるグループ間の嗜好の違いを示します。
技術的なレベルで、Yuppはブロックチェーン、暗号学的プリミティブ、およびゼロ知識証明の使用を探求しており、評価プロセスが公正で透明かつ検証可能であることを確保しています。同時に、プラットフォームはプロフェッショナルなAIデータプロバイダーと提携し、アーカイブ検証とマルチレイヤー品質検出を通じてスコアラーを調整し、悪意のあるデータを排除しています。
最近のリーダーボードが更新され、GPT‑4.5プレビュー、Claude Opus 4、Claude Sonnet 4などのモデルのVIBEスコアが表示されており、勝率、嫌われ率、速度、レイテンシ、コンテキストウィンドウ、コストメトリクスも含まれています。
Yuppは2025年6月13日に正式にローンチされ、6ヶ月間の内部テストを経てリリースされました。ローンチ以来、製品は継続的にイテレーションを重ねています。
Yuppのミッションは「人類がAIの未来を形作る力を与える」ことです。Pankaj Guptaは、AIの発展には誰もが参加し、貢献することが必要だと考えています。多様な視点からのAIの応答とユーザーのフィードバックを通じて、Yuppはユーザーがより良い意思決定を行う手助けをするだけでなく、AIの進化のための継続的な推進力も提供します。
Yuppの主な競合の一つは、オープンAIモデル評価プラットフォームLMArenaであることは言及する価値があります(ウェブサイト:https://lmarena.ai/)このウェブサイトはAI専門家の間で非常に人気がありますが、プラットフォームは現在商業探索の段階にあり、ブロックチェーン技術を活用してユーザー参加のための直接的な物質的報酬やポイントインセンティブメカニズムを提供していません。
全体として、Yuppはクラウドソーシングモデル、インセンティブメカニズム、実際のユーザーの好みに基づいた評価システムにより、AI評価の新しい道を切り開きました。これは、ユーザーに無料で多様なAIインタラクティブ体験を提供するだけでなく、ユーザーのフィードバックを高価値なトレーニングデータに変換し、モデルの継続的な最適化を促進します。経験豊富なチームと一流の資本の支援を受けて、Yuppは将来のAIエコシステムにおいて重要な役割を果たすと期待されており、「すべての人のためのAI、すべての人によって形作られる」というビジョンを実現します。
しかし、最近立ち上げられたYuppにとって、大量のユーザーが参加する中でデータ品質を継続的に確保し、潜在的な不正行為に抵抗し、商業化とユーザーインセンティブのバランスを取る方法は、今後の発展において探求し最適化する必要がある方向性である。
AIアプリケーションがさまざまな業界に浸透する中、モデルのパフォーマンスを正確に評価し、ユーザーの信頼を高めることが緊急の課題となっています。従来の評価は中央集権的なメカニズムに依存することが多く、多様なシナリオをカバーすることが困難で、真のユーザーの好みを反映することができません。同時に、モデルの「ハルシネーション」の問題が頻繁に発生し、ユーザーが選択を行う際に情報のサイロに陥ることがよくあります。
この文脈において、Yuppは新しいプラットフォームとして、独自のクラウドソーシングモデルとインセンティブメカニズムを用いてAIモデルの発見、比較、利用を再構築し、AI評価の分野にパラダイムシフトをもたらそうとしています。この記事では、Yuppのコアメカニズム、技術的ハイライト、チームの背景、そしてAIエコシステムに与える潜在的な影響について掘り下げます。
Yuppは、AI分野における長年の評価課題を解決することに注力しており、「トラストレス」なAIフィードバック市場を構築することに専念しています。これにより、多様なユーザーフィードバックがブロックチェーンと暗号経済的インセンティブの保護の下で自由に流通し、スケーラブルで公平かつ透明なモデル評価レイヤーが形成されます。高品質の手動アノテーションデータの配布にインセンティブを与えることによって、Yuppはさまざまなシナリオにおけるユーザーの真のニーズと好みを迅速に把握し、AI開発者がモデルのパフォーマンスを反復的に最適化するのを助けます。
このプロジェクトは、2024年6月にPankaj Gupta(共同創設者兼CEO)とGilad Mishne(共同創設者兼AI責任者)によって設立され、Chief ScientistのJimmy Lin(ウォータールー大学の教授)もコアチームに参加しました。三人は以前、2010年にTwitterで一緒に働き、大規模な推薦システムと検索システムを構築・最適化し、その後GoogleやCoinbaseで広範な経験を積みました。
データ価値の分散化と透明性のビジョンにより、信頼できる評価とユーザー参加へのAI製造業者の二重の要求を満たすことができ、さらにコアチームの豊富な経験から利益を得て、Yuppはテクノロジー業界の著名人やトップベンチャーキャピタリストから高い評価を得ています。
先週、YuppはA16zのパートナーであるクリス・ディクソンが主導する3300万ドルのシードラウンドファイナンスの完了を発表しました。他の投資家には、Googleのチーフサイエンティストであるジェフ・ディーン、Twitterの共同創設者であるビズ・ストーン、Pinterestの共同創設者であるエヴァン・シャープ、PerplexityのCEOアラヴィンド・スリニヴァス、スタンフォード大学のダン・ボーネ、クリス・レ、ニック・マキューン、バラジ・プラバカールなど、45人の著名なエンジェルや企業幹部、さらにCoinbase Venturesが含まれています。
中央集権的なAI評価プラットフォームであるYuppは、「すべての人のためのすべてのAI」という哲学を遵守し、ユーザーが最新のAIモデルを簡単に発見、比較、利用できるようにしています。従来の単一応答とは異なり、Yuppは各プロンプトに対して2つ(あるいはそれ以上)のモデルから同時に回答を返し、「AI議会」を形成します。このデザインは、ユーザーの多様な選択に対する要求を満たすだけでなく、モデルが生成する可能性のある「幻覚」を効果的に特定し、比較を通じてユーザーがより情報に基づいた意思決定を行えるようにします。YuppのCEOであるPankaj Guptaが述べたように、並列出力は生成エラーを懸念するユーザーにとって特に有益であり、結果を相互確認することができます。
このプラットフォームは現在、500以上のAIモデルをサポートしており、テキストおよび画像生成の分野をカバーしています。ChatGPT、Claude、Gemini、DeepSeek、Grok、Llamaなどの有名なモデルや、多くの新興モデルが含まれています。体験をさらに最適化するために、Yuppは「QuickTake」機能も導入しました。この機能は、長い返信を簡潔なツイートに要約することができます。
さらに、Yuppはユーザーのプライバシーを非常に重視しています:すべてのチャット記録はデフォルトでプライベートであり、ユーザーが積極的に公開しない限り、個人情報は開示されません。ユーザーは、いつでも共有の内容と範囲を制御できます。
Yuppは、ユーザーのフィードバックを無料で利用し、「Yuppポイント」システムを通じてモデルの使用状況を測定します。新しいユーザーは登録時に5000ポイントを受け取り、モデルの応答を評価したり、好みを選択したり、理由を説明したりすることでさらにポイントを獲得できます。フィードバックの質が高いほど報酬が大きくなり、ユーザーはClaude Opus 4やOpenAI o3のような高級モデルを無料で持続的に使用できるようになります。このプラットフォームは、ポイントが増え続けることを約束しており、すべての現在のモデルを無料で体験できるとしています。
各質問の後、ユーザーは2つのモデル応答を受け取り、フィードバックを通じて「デジタルスクラッチカード」を獲得することができ、0から250の範囲でYuppポイントが報酬として与えられます。1000ポイントごとに1ドルと交換でき、1日の最大引き出し額は10ドル、月の最大引き出し額は50ドルです。ポイントはドルやユーロを含む20以上の通貨と交換可能で、Stripe、PayPal、Coinbaseなどのパートナーと提携しています。同時に、プラットフォームはBase Ethernet L2とSolanaステーブルコインを統合し、グローバルなユーザーに即時の手数料無料の報酬を提供します。
Pankaj Guptaが言ったように、ユーザーによって生成される高品質なフィードバックは、AI企業のモデルファインチューニングや強化学習にとって、報酬そのものよりもはるかに価値があります。ユーザーの月収はせいぜい数杯のコーヒーに相当するかもしれませんが、この有料アノテーションデータはAIのイテレーションにとって重要です。
より多くの人々に参加を促すため、Yuppは紹介報酬も設けました:紹介者は5000ポイントを受け取り、紹介された人は1000ポイントを受け取ります;現在、新しく登録したユーザーは5000ポイントを受け取ることができ、紹介された人はさらに2500ポイントを受け取ります。
ランキングの透明性不足、公平性の欠如、評価データへのアクセスの不均衡といった既存の問題に対処するため、YuppはAIランキングのベータ版と「Yupp VIBE (Vibe Intelligence Benchmark) Score」評価システムを発表しました。このシステムは、自然なインタラクションで生成されたグローバルユーザーの好みデータを集約し、堅牢で信頼性のある評価結果を提供することを目的としています。
Yuppの評価原則には次のものが含まれます:
プラットフォームは、バイナリープリファレンスを収集するだけでなく、ユーザーが返信の利点と欠点(「要点を押さえた」、「速いスピード」、「良いスタイル」など)を指摘することを奨励し、ユーザーの年齢、教育、職業、その他の情報に基づいてクラスタ分析を行い、異なるグループ間の嗜好の違いを示します。
技術的なレベルで、Yuppはブロックチェーン、暗号学的プリミティブ、およびゼロ知識証明の使用を探求しており、評価プロセスが公正で透明かつ検証可能であることを確保しています。同時に、プラットフォームはプロフェッショナルなAIデータプロバイダーと提携し、アーカイブ検証とマルチレイヤー品質検出を通じてスコアラーを調整し、悪意のあるデータを排除しています。
最近のリーダーボードが更新され、GPT‑4.5プレビュー、Claude Opus 4、Claude Sonnet 4などのモデルのVIBEスコアが表示されており、勝率、嫌われ率、速度、レイテンシ、コンテキストウィンドウ、コストメトリクスも含まれています。
Yuppは2025年6月13日に正式にローンチされ、6ヶ月間の内部テストを経てリリースされました。ローンチ以来、製品は継続的にイテレーションを重ねています。
Yuppのミッションは「人類がAIの未来を形作る力を与える」ことです。Pankaj Guptaは、AIの発展には誰もが参加し、貢献することが必要だと考えています。多様な視点からのAIの応答とユーザーのフィードバックを通じて、Yuppはユーザーがより良い意思決定を行う手助けをするだけでなく、AIの進化のための継続的な推進力も提供します。
Yuppの主な競合の一つは、オープンAIモデル評価プラットフォームLMArenaであることは言及する価値があります(ウェブサイト:https://lmarena.ai/)このウェブサイトはAI専門家の間で非常に人気がありますが、プラットフォームは現在商業探索の段階にあり、ブロックチェーン技術を活用してユーザー参加のための直接的な物質的報酬やポイントインセンティブメカニズムを提供していません。
全体として、Yuppはクラウドソーシングモデル、インセンティブメカニズム、実際のユーザーの好みに基づいた評価システムにより、AI評価の新しい道を切り開きました。これは、ユーザーに無料で多様なAIインタラクティブ体験を提供するだけでなく、ユーザーのフィードバックを高価値なトレーニングデータに変換し、モデルの継続的な最適化を促進します。経験豊富なチームと一流の資本の支援を受けて、Yuppは将来のAIエコシステムにおいて重要な役割を果たすと期待されており、「すべての人のためのAI、すべての人によって形作られる」というビジョンを実現します。
しかし、最近立ち上げられたYuppにとって、大量のユーザーが参加する中でデータ品質を継続的に確保し、潜在的な不正行為に抵抗し、商業化とユーザーインセンティブのバランスを取る方法は、今後の発展において探求し最適化する必要がある方向性である。