DataFi: Web3 mendorong tren baru aset data AI

robot
Pembuatan abstrak sedang berlangsung

Data adalah Aset: DataFi Membuka Laut Biru Baru

Dunia sedang berada dalam era persaingan untuk membangun model dasar terbaik. Meskipun kemampuan komputasi dan arsitektur model sangat penting, namun parit yang sebenarnya adalah data pelatihan. Berita terbesar di dunia AI bulan ini adalah Meta menunjukkan kekuatannya, Zuckerberg merekrut bakat, membentuk tim AI mewah yang sebagian besar terdiri dari talenta penelitian Tionghoa. Pemimpin tim adalah Alexander Wang yang berusia 28 tahun, yang mendirikan Scale AI yang saat ini memiliki valuasi 29 miliar USD, menyediakan layanan data untuk beberapa raksasa AI yang memiliki hubungan kompetitif termasuk militer Amerika, OpenAI, Anthropic, dan Meta. Bisnis inti Scale AI adalah menyediakan sejumlah besar data yang terlabel dengan akurat.

Jalan Sukses Scale AI

Skala AI dapat menonjol di antara banyak unicorn karena ia telah menemukan pentingnya data dalam industri AI sejak awal.

Kekuatan komputasi, model, dan data adalah tiga pilar utama dari model AI. Jika model besar dibandingkan dengan seorang manusia, maka model adalah tubuh, kekuatan komputasi adalah makanan, dan data adalah pengetahuan/informasi.

Dalam proses perkembangan cepat LLM, fokus industri telah beralih dari model ke daya komputasi. Saat ini, sebagian besar model telah menetapkan transformer sebagai kerangka, kadang-kadang ada inovasi seperti MoE atau MoRe; para raksasa besar baik membangun kluster superkomputer sendiri atau menandatangani perjanjian jangka panjang dengan penyedia layanan cloud untuk mengatasi masalah daya komputasi. Setelah kebutuhan dasar daya komputasi teratasi, pentingnya data secara bertahap menjadi lebih jelas.

Scale AI berkomitmen untuk membangun fondasi data yang solid untuk model AI, bisnisnya tidak hanya mencakup eksplorasi data yang ada, tetapi juga fokus pada bisnis generasi data jangka panjang. Perusahaan ini membentuk tim pelatihan AI yang terdiri dari para ahli manusia di berbagai bidang untuk menyediakan data berkualitas lebih tinggi bagi pelatihan model AI.

Data sebagai Aset: DataFi sedang membuka lautan biru baru

Dua Tahap Pelatihan Model

Pelatihan model dibagi menjadi dua bagian: pra-pelatihan dan penyetelan.

Pra-pelatihan mirip dengan proses belajar berbicara bayi manusia, yang memerlukan input sejumlah besar teks, kode, dan informasi lainnya yang diambil dari internet ke dalam model AI, sehingga model dapat menguasai kemampuan komunikasi dasar melalui pembelajaran mandiri.

Fine-tuning itu mirip dengan sekolah, biasanya memiliki benar dan salah, jawaban dan arah yang jelas. Berbagai "sekolah" akan menghasilkan "talenta" dengan karakteristik yang berbeda. Kami menggunakan beberapa dataset yang telah disiapkan dengan baik dan terarah, untuk membuat model memiliki kemampuan yang kami harapkan.

Oleh karena itu, kita memerlukan dua jenis data:

  1. Data besar yang tidak perlu banyak pengolahan, terutama berasal dari data crawler platform UGC besar, basis data literatur publik, basis data privat perusahaan, dll.

  2. Dataset profesional yang dirancang dan dipilih dengan cermat memerlukan pekerjaan pembersihan data, penyaringan, pelabelan, umpan balik manual, dan sebagainya.

Dua jenis dataset ini membentuk inti dari jalur AI Data. Saat ini, secara umum dianggap bahwa dengan hilangnya keuntungan daya komputasi secara bertahap, data akan menjadi kunci bagi produsen model besar untuk mempertahankan daya saing.

Seiring dengan peningkatan kemampuan model, berbagai data pelatihan yang lebih halus dan profesional akan menjadi faktor kunci dalam menentukan kemampuan model. Jika pelatihan model dibandingkan dengan pembentukan ahli bela diri, maka dataset berkualitas tinggi adalah kitab rahasia seni bela diri yang terbaik.

Dalam jangka panjang, AI Data adalah jalur jangka panjang yang memiliki efek bola salju. Seiring dengan akumulasi pekerjaan awal, aset data akan memiliki kemampuan bunga majemuk, dan nilainya akan meningkat seiring waktu.

Data sebagai Aset: DataFi sedang membuka lautan biru baru

Web3 DataFi: Tanah yang Ideal untuk Data AI

Dibandingkan dengan perusahaan data tradisional, Web3 memiliki keunggulan alami di bidang data AI, yang melahirkan konsep DataFi.

Keuntungan ideal dari Web3 DataFi meliputi:

  1. Kontrak pintar menjamin kedaulatan data, keamanan, dan privasi
  2. Arsitektur terdistribusi menarik tenaga kerja global yang paling sesuai
  3. Blockchain menyediakan keuntungan insentif dan penyelesaian yang jelas
  4. Menguntungkan untuk membangun pasar data satu atap yang efisien dan terbuka

Bagi pengguna biasa, DataFi adalah proyek AI terdesentralisasi yang paling mudah diikuti. Pengguna hanya perlu masuk ke dompet mereka dan dapat berpartisipasi dengan menyelesaikan berbagai tugas, seperti menyediakan data, mengevaluasi model, menggunakan alat AI untuk kreasi sederhana, terlibat dalam perdagangan data, dan lainnya.

Potensi Proyek DataFi Web3

Saat ini sudah ada beberapa proyek DataFi yang mendapatkan pendanaan besar, berikut adalah beberapa proyek representatif:

  • Sahara AI: Berkomitmen untuk membangun infrastruktur dan pasar perdagangan AI terdesentralisasi.
  • Yupp: Platform umpan balik model AI, mengumpulkan penilaian pengguna terhadap keluaran model
  • Vana: Mengubah data pribadi pengguna menjadi aset digital yang dapat dimonetisasi
  • Chainbase: Fokus pada data on-chain, mencakup lebih dari 200 blockchain
  • Sapien: Mengubah pengetahuan manusia menjadi data pelatihan AI berkualitas tinggi
  • Prisma X: Berkomitmen untuk membangun lapisan koordinasi terbuka untuk robot.
  • Masa: Proyek subnet dari ekosistem Bittensor, menyediakan akses data secara real-time
  • Irys: Fokus pada penyimpanan data dan komputasi yang dapat diprogram
  • ORO: Memberdayakan orang biasa untuk berpartisipasi dalam kontribusi AI
  • Gata: lapisan data terdesentralisasi, menyediakan berbagai cara untuk berpartisipasi dalam data

Proyek-proyek ini saat ini umumnya memiliki hambatan yang tidak tinggi, tetapi seiring dengan akumulasi pengguna dan daya tarik ekosistem, keunggulan platform akan cepat terbentuk. Proyek awal harus fokus pada insentif dan pengalaman pengguna untuk menarik cukup banyak pengguna.

Sementara itu, platform-platform ini juga perlu memperhatikan bagaimana mengelola tenaga kerja, menjamin kualitas data, dan menghindari fenomena "penggembala" yang menyebabkan mata uang yang buruk mengusir mata uang yang baik. Beberapa proyek seperti Sahara, Sapien telah mulai menekankan kualitas data, berusaha membangun hubungan kerja sama yang sehat dan jangka panjang dengan pengguna platform.

Selain itu, meningkatkan transparansi juga merupakan tantangan yang dihadapi proyek-proyek on-chain saat ini. Banyak proyek masih perlu mempercepat langkah-langkah terbuka dan transparan untuk mendorong perkembangan jangka panjang yang sehat dari Web3 DataFi.

Adopsi DataFi secara besar-besaran perlu didorong dari dua aspek: pertama, menarik cukup banyak pengguna individu untuk berpartisipasi dalam pengumpulan/produksi data, membentuk kelompok konsumen untuk ekonomi AI; kedua, mendapatkan pengakuan dari perusahaan-perusahaan utama, karena dalam jangka pendek mereka adalah sumber utama untuk kontrak data besar.

Data sebagai Aset: DataFi sedang membuka lautan biru baru

Kesimpulan

Dari sudut pandang tertentu, DataFi adalah penggunaan kecerdasan manusia untuk mengembangkan kecerdasan mesin dalam jangka panjang, sambil menjamin keuntungan dari kerja cerdas manusia melalui kontrak pintar, dan akhirnya menikmati balasan dari kecerdasan mesin.

Bagi mereka yang merasa tidak pasti tentang era AI, atau yang masih memiliki idealisme di bidang blockchain, mengikuti jejak para raksasa kapitalis untuk terjun ke DataFi adalah pilihan yang baik.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 4
  • Bagikan
Komentar
0/400
SneakyFlashloanvip
· 19jam yang lalu
Wah, 28 tahun sudah 29 miliar, saya harus berusaha lebih keras.
Lihat AsliBalas0
MetaMuskRatvip
· 20jam yang lalu
Lagi-lagi Zack bikin keributan, ngakak banget
Lihat AsliBalas0
NftDataDetectivevip
· 20jam yang lalu
sepertinya zuck akhirnya mengerti... data adalah minyak baru fr fr
Lihat AsliBalas0
AirdropChaservip
· 20jam yang lalu
Duduk-duduk lihat proyek yang benar-benar kaya, saatnya untuk berinvestasi.
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)