Scan to Download Gate App
qrCode
More Download Options
Don't remind me again today

Amerika'nın Açık Kaynak AI Hamlesi: İki Laboratuvar, Bir Soru—ABD Rekabet Edebilir Mi?

image

Kaynak: CryptoNewsNet Orijinal Başlık: Amerika'nın Açık Kaynaklı AI Hamlesi: İki Laboratuvar, Bir Soru—ABD Rekabet Edebilir mi? Orijinal Bağlantı: Bu hafta iki Amerikalı AI laboratuvarı, kamuya açık AI sistemlerinde Çin'in egemenliği ile nasıl rekabet edileceği sorununa tamamen farklı yaklaşımlar benimseyerek açık kaynaklı modelleri yayımladı.

Deep Cogito, kurucusu Drishan Arora'nın “ABD'li bir şirket tarafından yapılan en iyi açık ağırlıklı LLM” olarak adlandırdığı 671 milyar parametreli dev bir model olan Cogito v2.1'i piyasaya sürdü.

Hızlı olma, karşılık verdi The Allen Institute for AI, Olmo 3'ü “en iyi tamamen açık temel model” olarak tanıtarak yeni piyasaya sürdü. Olmo 3, eğitim verileri ve kodu da dahil olmak üzere tam şeffaflık sunuyor.

Ironik bir şekilde, Deep Cognito'nun amiral gemisi modeli Çin temeline dayanıyor. Arora, Cogito v2.1'in “Kasım 2024'teki açık lisanslı Deepseek temel modelinden çatallandığını” kabul etti.

Bu, bir Çin modelinin ince ayarının Amerikan yapay zeka ilerlemesi olarak sayılıp sayılamayacağı veya ABD laboratuvarlarının ne kadar geride kaldığını kanıtlayıp kanıtlamadığı konusunda bazı eleştiriler ve tartışmalara yol açtı.

Her şeye rağmen, Cogito'nun DeepSeek'e göre gösterdiği verimlilik artışları gerçektir.

Deep Cognito, Cogito v2.1'in DeepSeek R1'e göre %60 daha kısa akıl yürütme zincirleri ürettiğini, rekabetçi performansı koruyarak iddia ediyor.

Arora'nın “Tekrar Edilmiş Damıtma ve Amplifikasyon” olarak adlandırdığı yöntemi kullanarak—modellerin kendini geliştirme döngüleri aracılığıyla daha iyi bir sezgi geliştirmeyi öğrenmeleri—girişim, RunPod ve Nebius'tan aldığı altyapıda modelini sadece 75 günde eğitti.

Eğer referanslar doğruysa, bu şu anda bir ABD ekibi tarafından sürdürülen en güçlü açık kaynaklı LLM olacaktır.

Neden Önemlidir

Şu ana kadar, Çin açık kaynaklı yapay zeka alanında öncülük ediyor ve ABD şirketleri giderek daha fazla, sessizce veya açıktan, rekabetçi kalmak için Çin'e ait temel modellere güveniyor.

Bu dinamik risklidir. Eğer Çin laboratuvarları dünya çapında açık yapay zeka için varsayılan altyapı haline gelirse, ABD girişimleri teknik bağımsızlık, pazarlık gücü ve endüstri standartlarını şekillendirme yeteneğini kaybeder.

Açık ağırlıklı yapay zeka, her bir aşağı akış ürününün bağımlı olduğu ham modellerin kimler tarafından kontrol edildiğini belirler.

Şu anda, Çin açık kaynaklı modelleri (DeepSeek, Qwen, Kimi, MiniMax) küresel benimsemede baskın çünkü ucuz, hızlı, son derece verimli ve sürekli güncelleniyor.

Birçok ABD girişimi, bunu kamuya açık olarak kabul etmemelerine rağmen, zaten bunların üzerine inşa ediyor.

Bu, ABD firmalarının yabancı fikri mülkiyet, yabancı eğitim süreçleri ve yabancı donanım optimizasyonları üzerine iş kurdukları anlamına geliyor. Stratejik olarak, bu Amerika'yı bir zamanlar yarı iletken üretimiyle yüzleştiği aynı konuma getiriyor: giderek başkasının tedarik zincirine bağımlı hale geliyor.

Deep Cogito'nun yaklaşımı—bir DeepSeek çatallamasından başlayarak—üst tarafı (hızlı iterasyon) ve alt tarafı (bağımlılık) gösteriyor.

Allen Enstitüsü'nün yaklaşımı—Olmo 3'ü tam şeffaflıkla inşa etmesi—alternatifi gösteriyor: Eğer ABD açık AI liderliği istiyorsa, veriden eğitim tariflerine ve kontrol noktalarına kadar yığını kendisi yeniden inşa etmesi gerekiyor. Bu iş gücü yoğun ve yavaş, ancak temel teknoloji üzerindeki egemenliği koruyor.

Teorik olarak, eğer DeepSeek'i zaten beğendiyseniz ve çevrimiçi kullanıyorsanız, Cogito çoğu zaman size daha iyi cevaplar verecektir. API aracılığıyla kullanıyorsanız, verimlilik artışları sayesinde iyi yanıtlar üretmek için daha az para ödeyeceğiniz için iki kat daha mutlu olacaksınız.

Allen Enstitüsü tam ters bir yaklaşım benimsedi. Olmo 3 modellerinin tüm ailesi, sıfırdan oluşturulmuş 5.9 trilyon tokenlik bir eğitim veri seti olan Dolma 3 ile birlikte geliyor; ayrıca her eğitim aşamasından tam kod, tarifler ve kontrol noktaları da mevcut.

Kar amacı gütmeyen kuruluş, 7 milyar ve 32 milyar parametreye sahip üç model varyantı—Temel, Düşün ve Talimat—yayınladı.

“Gerçek yapay zeka açıklığı sadece erişimle ilgili değil—bu güven, hesap verebilirlik ve ortak ilerleme ile ilgilidir,” diye yazdı enstitü.

Olmo 3-Think 32B, Qwen 3 gibi benzer modellerin toplam token sayısının yaklaşık altıda biri ile eğitilmiş, bu ölçekteki ilk tamamen açık akıl yürütme modelidir ve rekabetçi bir performans sergilemektedir.

Deep Cognito, Ağustos ayında Benchmark liderliğinde $13 milyon dolar tohum finansmanı sağladı. Yeni girişim, “önemli ölçüde daha fazla hesaplama gücü ile daha iyi veri setleri” üzerinde eğitilmiş 671 milyar parametreye kadar sınır modellere sahip olmayı planlıyor.

Bu arada, Nvidia, Olmo 3'ün geliştirilmesini destekledi ve başkan yardımcısı Kari Briski, “geliştiricilerin AI'yi açık, ABD yapımı modellerle ölçeklendirmeleri için bunun hayati öneme sahip olduğunu” söyledi.

Enstitü, Google Cloud'un H100 GPU kümelerinde eğitim aldı ve Meta'nın Llama 3.1 8B'sine göre %60 daha az hesaplama gereksinimi elde etti.

Cogito v2.1, ücretsiz çevrimiçi test için kullanılabilir. Model indirilebilir, ancak dikkat: çalıştırmak için çok güçlü bir karta ihtiyaç var.

Olmo test için mevcut. Modeller indirilebilir. Bunlar, hangi modeli seçtiğinize bağlı olarak daha kullanıcı dostudur.

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)