Era Model Besar AI: Kebangkitan Transformer dan Pertempuran Seratus Model
Bulan lalu, dunia AI diguncang oleh "Pertempuran Hewan". Di satu sisi ada Llama (lama) dari Meta, di sisi lain ada model besar bernama Falcon (elang). Kedua model ini saling mengejar di tangga LLM sumber terbuka, bergantian menduduki posisi teratas.
Menariknya, pengembang Falcon bukanlah raksasa teknologi, melainkan sebuah lembaga penelitian di Uni Emirat Arab. Pejabat negara tersebut menyatakan bahwa mereka terlibat dalam perlombaan AI untuk "mengguncang pemain inti". Saat ini, selama memiliki kekuatan finansial yang cukup, hampir semua negara dan perusahaan sedang membangun model bahasa besar mereka sendiri.
Di balik "perang ratusan model" ini adalah algoritma Transformer yang dirilis oleh Google pada tahun 2017. Algoritma ini menyelesaikan masalah pemahaman mesin terhadap teks panjang, menjadikan model besar dari masalah penelitian teoretis menjadi masalah rekayasa. Kini, baik GPT maupun model lainnya, dibangun di atas dasar Transformer.
Munculnya Transformer telah secara signifikan menurunkan ambang batas pengembangan AI. Selama ada cukup daya komputasi dan data, perusahaan mana pun dapat melatih model besar. Ini juga menyebabkan situasi saat ini yang beragam - menurut statistik, jumlah model besar di Tiongkok telah melebihi Amerika Serikat, mencapai 130.
Namun, apakah bisa menjadi raksasa di era AI, kuncinya tidak terletak pada sekadar menumpuk parameter. Keberhasilan Llama milik Meta terletak pada komunitas pengembangnya yang aktif. Sementara itu, keunggulan GPT-4 yang jauh di depan berasal dari kekuatan penelitian OpenAI yang luar biasa.
Saat ini, tantangan terbesar yang dihadapi industri model besar adalah masalah profitabilitas. Biaya komputasi yang tinggi membuat banyak perusahaan mengalami kerugian besar dalam AI. Diperkirakan, total investasi di infrastruktur di seluruh industri setiap tahun mungkin melebihi pendapatan sebesar 125 miliar dolar.
Oleh karena itu, kompetisi di masa depan mungkin tidak akan tergantung pada siapa yang memiliki lebih banyak parameter model, tetapi pada siapa yang dapat menemukan model bisnis yang tepat, yang benar-benar mengubah AI menjadi produktivitas. Sama seperti kesuksesan iPhone 4 yang tidak hanya terletak pada prosesor, tetapi pada ekosistem aplikasi yang kaya, pemenang di industri AI di masa depan kemungkinan adalah perusahaan yang dapat menyediakan solusi praktis.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
18 Suka
Hadiah
18
5
Bagikan
Komentar
0/400
StealthMoon
· 07-14 19:49
Kebun binatang apa ini?
Lihat AsliBalas0
SleepTrader
· 07-14 19:46
pro semua sedang berkompetisi dengan AI siapa yang punya lebih banyak uang
Lihat AsliBalas0
LiquidationAlert
· 07-14 19:39
Mie instan bisa disebut model AI, betapa segarnya.
Lihat AsliBalas0
ZKProofEnthusiast
· 07-14 19:38
Sekarang kita harus membandingkan Daya Komputasi dan kekayaan.
Lihat AsliBalas0
GmGnSleeper
· 07-14 19:32
Ini adalah kecepatan ini, tidak bisa mengalahkan llama.
Transformer memimpin era model besar AI, perang seratus model mulai berkecamuk.
Era Model Besar AI: Kebangkitan Transformer dan Pertempuran Seratus Model
Bulan lalu, dunia AI diguncang oleh "Pertempuran Hewan". Di satu sisi ada Llama (lama) dari Meta, di sisi lain ada model besar bernama Falcon (elang). Kedua model ini saling mengejar di tangga LLM sumber terbuka, bergantian menduduki posisi teratas.
Menariknya, pengembang Falcon bukanlah raksasa teknologi, melainkan sebuah lembaga penelitian di Uni Emirat Arab. Pejabat negara tersebut menyatakan bahwa mereka terlibat dalam perlombaan AI untuk "mengguncang pemain inti". Saat ini, selama memiliki kekuatan finansial yang cukup, hampir semua negara dan perusahaan sedang membangun model bahasa besar mereka sendiri.
Di balik "perang ratusan model" ini adalah algoritma Transformer yang dirilis oleh Google pada tahun 2017. Algoritma ini menyelesaikan masalah pemahaman mesin terhadap teks panjang, menjadikan model besar dari masalah penelitian teoretis menjadi masalah rekayasa. Kini, baik GPT maupun model lainnya, dibangun di atas dasar Transformer.
Munculnya Transformer telah secara signifikan menurunkan ambang batas pengembangan AI. Selama ada cukup daya komputasi dan data, perusahaan mana pun dapat melatih model besar. Ini juga menyebabkan situasi saat ini yang beragam - menurut statistik, jumlah model besar di Tiongkok telah melebihi Amerika Serikat, mencapai 130.
Namun, apakah bisa menjadi raksasa di era AI, kuncinya tidak terletak pada sekadar menumpuk parameter. Keberhasilan Llama milik Meta terletak pada komunitas pengembangnya yang aktif. Sementara itu, keunggulan GPT-4 yang jauh di depan berasal dari kekuatan penelitian OpenAI yang luar biasa.
Saat ini, tantangan terbesar yang dihadapi industri model besar adalah masalah profitabilitas. Biaya komputasi yang tinggi membuat banyak perusahaan mengalami kerugian besar dalam AI. Diperkirakan, total investasi di infrastruktur di seluruh industri setiap tahun mungkin melebihi pendapatan sebesar 125 miliar dolar.
Oleh karena itu, kompetisi di masa depan mungkin tidak akan tergantung pada siapa yang memiliki lebih banyak parameter model, tetapi pada siapa yang dapat menemukan model bisnis yang tepat, yang benar-benar mengubah AI menjadi produktivitas. Sama seperti kesuksesan iPhone 4 yang tidak hanya terletak pada prosesor, tetapi pada ekosistem aplikasi yang kaya, pemenang di industri AI di masa depan kemungkinan adalah perusahaan yang dapat menyediakan solusi praktis.