Transformer, AI büyük modeller çağını yönlendiriyor. Yüzlerce model savaşının rüzgarı esiyor.

AI Büyük Model Dönemi: Transformer'ın Yükselişi ve Yüzlerce Model Savaşı

Geçen ay, AI dünyasında bir "hayvan savaşı" patlak verdi. Bir taraf Meta'nın Llama'sı (lama), diğer taraf ise Falcon (şahin) adlı büyük modeldi. Bu iki model, açık kaynaklı LLM sıralamasında birbirlerini takip ederek zirveye çıkıyor.

İlginçtir ki, Falcon'un geliştiricileri teknoloji devleri değil, Birleşik Arap Emirlikleri'nde bir araştırma enstitüsüdür. Ülke yetkilileri, yapay zeka yarışına katılmalarının "ana oyuncuları altüst etmek" için olduğunu belirtiyor. Artık, yeterli maddi kaynak olduğu sürece, neredeyse tüm ülkeler ve işletmeler kendi büyük dil modellerini oluşturuyor.

Bu "Yüz Model Savaşı"nın arkasında, 2017'de Google tarafından yayınlanan Transformer algoritması var. Bu algoritma, makinelerin uzun metinleri anlamasını sağlayan zorluğu çözüyor ve büyük modellerin teorik araştırmalardan mühendislik problemlerine dönüşmesini sağlıyor. Artık, ister GPT ister diğer modeller olsun, hepsi Transformer temelinde inşa edilmiştir.

Transformer'ın ortaya çıkması, AI geliştirme barını büyük ölçüde düşürdü. Yeterli hesaplama gücü ve veri olduğunda, herhangi bir şirket büyük bir model eğitebilir. Bu da şu anda her türlü modelin hızla geliştiği bir duruma neden oldu - istatistiklere göre, Çin'deki büyük model sayısı Amerika'yı geçerek 130'a ulaştı.

Ancak, AI çağında bir dev haline gelip gelemeyeceği, sadece parametreleri bir araya getirmekle ilgili değildir. Meta'nın Llama'sının başarılı olmasının nedeni, aktif bir geliştirici topluluğuna sahip olmasıdır. GPT-4'ün neden bu kadar önde olduğu ise OpenAI'nin güçlü araştırma gücünden kaynaklanmaktadır.

Şu anda, büyük model endüstrisinin karşılaştığı en büyük zorluk kârlılık sorunudur. Yüksek hesaplama maliyetleri, birçok şirketin AI üzerinde ciddi kayıplar yaşamasına neden olmaktadır. Tahminlere göre, tüm endüstride altyapıya yapılan yıllık yatırım gelirleri 125 milyar doları aşabilir.

Bu nedenle, gelecekteki rekabet belki de kimin model parametrelerinin daha fazla olduğunda değil, kimin uygun bir iş modeli bulabileceğinde yatıyor; gerçekten AI'yı üretkenliğe dönüştüren. iPhone 4'ün başarısının işlemcide değil, zengin uygulama ekosisteminde olduğu gibi, AI endüstrisinin gelecekteki kazananları da muhtemelen pratik çözümler sunabilen şirketler olacaktır.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 5
  • Share
Comment
0/400
StealthMoonvip
· 07-14 19:49
Bu ne hayvanat bahçesi?
View OriginalReply0
SleepTradervip
· 07-14 19:46
prolar AI'yi sarıyor, kim daha fazla paraya sahip?
View OriginalReply0
LiquidationAlertvip
· 07-14 19:39
Hızlı erişim, AI modeli bile olarak anılabiliyor, ne kadar taze.
View OriginalReply0
ZKProofEnthusiastvip
· 07-14 19:38
Şimdi bilgi işlem gücü ve finans gücünü karşılaştırma zamanı.
View OriginalReply0
GmGnSleepervip
· 07-14 19:32
İşte bu hızda llama'yı geçemem.
View OriginalReply0
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)