出所:コインテレグラフオリジナル:「分散型OORT AIデータがGoogle Kaggleでトップに登場」分散型AIソリューションプロバイダーOORTが開発した人工知能トレーニング画像データセットは、GoogleのKaggleプラットフォームで顕著な成功を収めました。OORTの「Diverse Tools Kaggle」データセットリストは4月初めに公開され、その後、複数のカテゴリーでトップページに上昇しました。KaggleはGoogle傘下のオンラインプラットフォームで、データサイエンスや機械学習のコンペティション、学習、協力のためのものです。暗号AIプロジェクトOpenLedgerの主要貢献者であるRamkumar SubramaniamはCointelegraphに対して「Kaggleのホームページランキングは、データセットがデータサイエンティスト、機械学習エンジニア、そして実務者などの重要なコミュニティの積極的な参加を引き付けていることを示す強力な社会的信号です」と述べました。OORTの創設者兼CEOであるMax Liは、Cointelegraphに対し、同社が「鼓舞的な参加指標を観察しており、これは『分散型モデルを通じて収集されたトレーニングデータ』が実際に初期市場の需要と関連性を持っていることを検証している」と明らかにしました。彼はさらに次のように付け加えました:"コミュニティからの自発的な関心、積極的な使用と貢献を含む—OORTのような分散型、コミュニティ主導のデータパイプラインが中央集権的な仲介機関に依存することなく迅速な配信と広範な参加を実現できることを明確に示しています。"Liは、OORTが今後数ヶ月で複数のデータセットをリリースする予定であると述べました。その中には、車内音声コマンドデータセット、スマートホーム音声コマンドデータセット、そしてAI駆動のメディアの真実性検証能力を向上させることを目的としたディープフェイクビデオデータセットが含まれています。コインテレグラフの独立した検証により、データセットが今月初めにKaggleの一般AI、小売・ショッピング、製造、エンジニアリングの各カテゴリーのトップページに掲載されたことが確認された。 本稿執筆時点では、データセットは、5月6日の潜在的に無関係なデータセットの更新と5月14日の別の更新により、これらのランキングを維持しなくなりました。この成果を認める一方で、SubramaniamはCointelegraphに対して、「これは実際の応用や企業レベルの品質の決定的な指標ではない」と述べました。彼は、OORTデータセットの独自性は「ランキングだけでなく、データセットの背後にあるソースチャネルとインセンティブメカニズムにもある」と指摘しました。彼はさらに説明しました:"不透明なプロセスに依存する中央集権的な供給者とは異なり、透明性のあるトークンインセンティブに基づくシステムは、適切なガバナンス構造が確立されている前提で、追跡可能性、コミュニティによる共同管理、そして継続的な最適化の可能性を提供することができます。"人工知能リスク投資機関Generative VenturesのパートナーであるLex Sokolinは、これらの成果が再現不可能ではないと考えているものの、「これは確かに暗号プロジェクトが分散型インセンティブメカニズムを利用して経済的価値のある活動を組織できることを証明しています。」と述べています。人工知能研究機関Epoch AIが発表したデータによると、人間が生成したテキストのAIトレーニングデータは2028年までに尽きると予想されています。投資家は現在、AI企業が著作権で保護された素材の使用権を獲得するための取引を促進しています。AIのトレーニングデータがますます希少になり、これがこの分野の発展を制約する可能性についての研究報告は長年にわたって流布されています。合成(AI生成)データはますます広く利用され、一定の成果を上げていますが、人間が生成したデータは依然としてより優れた選択肢と見なされています。このような高品質データは、より優れた性能を持つAIモデルを育成することができます。AIトレーニング画像の分野では、状況がますます複雑になっており、アーティストたちは意図的にトレーニング作業を妨害しています。自身の作品が無断でAIトレーニングに使用されるのを防ぐために、Nightshadeツールはクリエイターが自分の画像を「毒化」することを可能にし、その結果、モデルの性能に深刻な影響を与えます。サブラマニアムは指摘した:"私たちは高品質の画像データがますます希少になる時代に突入しています。"彼はまた、画像ポイズニング技術の広範な使用がこの課題をさらに厳しくしていることを強調した:"画像の隠蔽技術や対抗的なウォーターマークなどのAIトレーニング毒性手法の台頭に伴い、オープンソースデータセットは数量と信頼性の二重の課題に直面しています。"この状況に対して、Subramaniamは、検証可能でコミュニティによって貢献されたインセンティブデータセットが「これまで以上に価値がある」と述べました。彼は、このようなプロジェクトが「単なる代替案として機能するだけでなく、データ経済におけるAIの整合性とデータのトレーサビリティの重要な柱になる」と考えています。関連する情報:KimaがMastercardのサンドボックスに参加し、ステーブルコインカードのチャージを実現
分散型OORT AIデータは、Google Kaggleのリストのトップにあります
出所:コインテレグラフ オリジナル:「分散型OORT AIデータがGoogle Kaggleでトップに登場」
分散型AIソリューションプロバイダーOORTが開発した人工知能トレーニング画像データセットは、GoogleのKaggleプラットフォームで顕著な成功を収めました。
OORTの「Diverse Tools Kaggle」データセットリストは4月初めに公開され、その後、複数のカテゴリーでトップページに上昇しました。KaggleはGoogle傘下のオンラインプラットフォームで、データサイエンスや機械学習のコンペティション、学習、協力のためのものです。
暗号AIプロジェクトOpenLedgerの主要貢献者であるRamkumar SubramaniamはCointelegraphに対して「Kaggleのホームページランキングは、データセットがデータサイエンティスト、機械学習エンジニア、そして実務者などの重要なコミュニティの積極的な参加を引き付けていることを示す強力な社会的信号です」と述べました。
OORTの創設者兼CEOであるMax Liは、Cointelegraphに対し、同社が「鼓舞的な参加指標を観察しており、これは『分散型モデルを通じて収集されたトレーニングデータ』が実際に初期市場の需要と関連性を持っていることを検証している」と明らかにしました。彼はさらに次のように付け加えました:
"コミュニティからの自発的な関心、積極的な使用と貢献を含む—OORTのような分散型、コミュニティ主導のデータパイプラインが中央集権的な仲介機関に依存することなく迅速な配信と広範な参加を実現できることを明確に示しています。"
Liは、OORTが今後数ヶ月で複数のデータセットをリリースする予定であると述べました。その中には、車内音声コマンドデータセット、スマートホーム音声コマンドデータセット、そしてAI駆動のメディアの真実性検証能力を向上させることを目的としたディープフェイクビデオデータセットが含まれています。
コインテレグラフの独立した検証により、データセットが今月初めにKaggleの一般AI、小売・ショッピング、製造、エンジニアリングの各カテゴリーのトップページに掲載されたことが確認された。 本稿執筆時点では、データセットは、5月6日の潜在的に無関係なデータセットの更新と5月14日の別の更新により、これらのランキングを維持しなくなりました。
この成果を認める一方で、SubramaniamはCointelegraphに対して、「これは実際の応用や企業レベルの品質の決定的な指標ではない」と述べました。彼は、OORTデータセットの独自性は「ランキングだけでなく、データセットの背後にあるソースチャネルとインセンティブメカニズムにもある」と指摘しました。彼はさらに説明しました:
"不透明なプロセスに依存する中央集権的な供給者とは異なり、透明性のあるトークンインセンティブに基づくシステムは、適切なガバナンス構造が確立されている前提で、追跡可能性、コミュニティによる共同管理、そして継続的な最適化の可能性を提供することができます。"
人工知能リスク投資機関Generative VenturesのパートナーであるLex Sokolinは、これらの成果が再現不可能ではないと考えているものの、「これは確かに暗号プロジェクトが分散型インセンティブメカニズムを利用して経済的価値のある活動を組織できることを証明しています。」と述べています。
人工知能研究機関Epoch AIが発表したデータによると、人間が生成したテキストのAIトレーニングデータは2028年までに尽きると予想されています。投資家は現在、AI企業が著作権で保護された素材の使用権を獲得するための取引を促進しています。
AIのトレーニングデータがますます希少になり、これがこの分野の発展を制約する可能性についての研究報告は長年にわたって流布されています。合成(AI生成)データはますます広く利用され、一定の成果を上げていますが、人間が生成したデータは依然としてより優れた選択肢と見なされています。このような高品質データは、より優れた性能を持つAIモデルを育成することができます。
AIトレーニング画像の分野では、状況がますます複雑になっており、アーティストたちは意図的にトレーニング作業を妨害しています。自身の作品が無断でAIトレーニングに使用されるのを防ぐために、Nightshadeツールはクリエイターが自分の画像を「毒化」することを可能にし、その結果、モデルの性能に深刻な影響を与えます。
サブラマニアムは指摘した:"私たちは高品質の画像データがますます希少になる時代に突入しています。"彼はまた、画像ポイズニング技術の広範な使用がこの課題をさらに厳しくしていることを強調した:
"画像の隠蔽技術や対抗的なウォーターマークなどのAIトレーニング毒性手法の台頭に伴い、オープンソースデータセットは数量と信頼性の二重の課題に直面しています。"
この状況に対して、Subramaniamは、検証可能でコミュニティによって貢献されたインセンティブデータセットが「これまで以上に価値がある」と述べました。彼は、このようなプロジェクトが「単なる代替案として機能するだけでなく、データ経済におけるAIの整合性とデータのトレーサビリティの重要な柱になる」と考えています。
関連する情報:KimaがMastercardのサンドボックスに参加し、ステーブルコインカードのチャージを実現