Hal paling penting hari ini adalah konferensi GTC Nvidia, benar-benar seperti sejarah singkat AI versi manusia.

robot
Pembuatan abstrak sedang berlangsung

Hari ini hal terpenting adalah konferensi GTC NVIDIA, benar-benar seperti sejarah manusia versi AI.

Huang Renxun belum naik panggung, tapi bocoran informasinya sudah cukup untuk menulis satu buku.

Malam ini saya rangkum tiga poin utama, ayo teman-teman, ikuti saya.

1)Biaya komputasi AI langsung dipangkas menjadi sepersepuluh

Generasi sebelumnya Blackwell sudah sangat hebat, kan? Segera akan diumumkan chip generasi baru Vera Rubin yang akan diproduksi massal.

Apa hebatnya Vera Rubin? Sederhana saja: murah.

Menggunakan model AI yang sama, jumlah chip dikurangi hingga seperempat, biaya inferensi turun sembilan kali lipat. Turun sembilan kali lipat, teman-teman. AWS, Microsoft, dan Google langsung menjadi pengguna awal.

2)Groq yang dibeli tahun lalu seharga 20 miliar dolar hari ini menyerahkan hasil

Sebelumnya Huang Renxun mengatakan di laporan keuangan bahwa Groq akan diintegrasikan ke dalam arsitektur NVIDIA, seperti saat mereka mengakuisisi Mellanox untuk melengkapi kemampuan jaringan.

LPU Groq dan GPU NVIDIA ditempatkan di pusat data yang sama, GPU memahami masalah, LPU bertanggung jawab untuk mengeluarkan jawaban dengan cepat.

Dua jenis chip bekerja sama, mengurangi latensi dalam skenario Agen secara langsung.

AI Agent bekerja untuk manusia, satu tugas bisa memakan puluhan putaran model, setiap putaran menguras daya inferensi, dan pengguna menunggu di sana, pengalaman yang lambat bisa membuat sistem crash.

Inferensi dilakukan dalam dua langkah, pertama memahami pertanyaanmu, lalu mengeluarkan jawaban satu per satu.

GPU unggul di langkah pertama, tetapi kecepatan dan kestabilan mengeluarkan kata-kata di langkah kedua, LPU Groq lebih kuat.

200 miliar, apakah itu mahal?

Bayangkan nanti setiap perusahaan menjalankan ratusan Agent, setiap Agent memanggil model ribuan kali setiap hari.

3)NemoClaw, versi NVIDIA dari OpenClaw

Yaitu platform open-source, perusahaan bisa langsung menginstal untuk menjalankan AI karyawan menggantikan manusia dalam proses, pengolahan data, dan pengelolaan proyek. Dikatakan sudah bernegosiasi dengan Salesforce dan Adobe.

Hal menariknya, NemoClaw tidak mengharuskan penggunaan chip NVIDIA. Coba pikirkan logikanya. Menjual chip hanya menghasilkan uang dari perangkat keras, menetapkan aturan agar bisa mendapatkan keuntungan dari seluruh ekosistem. Huang Renxun sangat paham soal ini.

4)Huang Renxun bilang akan menampilkan “chip yang belum pernah dilihat dunia”

Kemungkinan besar adalah arsitektur generasi berikutnya, Feynman, yang akan debut pertama kali, diproduksi massal tahun 2028, dengan proses 1.6nm TSMC yang paling canggih.

Ada juga rumor langka yang saya rasa cukup menarik.

NVIDIA akan merilis prosesor laptop, dua model, fokus pada gaming. Penjual kartu grafis akan bersaing dengan CPU.

Malam ini saya merasa Huang Renxun akan menjadi tokoh besar di masa depan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan