Pindai untuk Mengunduh Aplikasi Gate

qrCode

Opsi Unduhan Lainnya

Jangan ingatkan saya lagi hari ini

AltcoinArchitect

2025-11-07 03:07:37

Model bahasa besar jelas menyimpan banyak data pelatihan dalam jaringan saraf mereka, tetapi inilah yang mengganggu saya: tidak ada yang benar-benar memahami di mana informasi yang diingat ini sebenarnya berada di dalam model-model ini. Seperti, lapisan mana yang menyimpannya? Bagaimana arsitektur menyimpan dan mengambil fakta-fakta spesifik? Seluruh mekanisme di balik memorisasi dalam LLM tetap mengejutkan kabur, meskipun kita semakin bergantung pada sistem-sistem ini.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

9 Suka

Hadiah
9
4
Posting ulang
Bagikan

Komentar

0/400

GateUser-c799715c

· 8jam yang lalu

Kenapa rasanya model bahasa besar terlalu misterius ya?

Lihat AsliBalas0

ContractFreelancer

· 8jam yang lalu

Memori model besar memang bagus, tapi kita nggak tahu disimpan di mana saja.

Lihat AsliBalas0

FloorPriceNightmare

· 8jam yang lalu

Kotak hitam di baliknya sangat menakutkan!

Lihat AsliBalas0

BearHugger

· 9jam yang lalu

Tertawa sampai mati, model pelatihan mirip dengan membakar dupa dan berdoa.

Lihat AsliBalas0

Topik TrendingLihat Lebih Banyak
#GateWeb3LaunchpadBOBLaunches
5.11K Popularitas
#LaunchTokensOnSquareToGrab$1,000
42.26K Popularitas
#CryptoMarketPullback
242.46K Popularitas
#PrivacyCoinsRally
8.6K Popularitas
#HKLaunchesFirstTokenizedFund
2.53K Popularitas

Hot Gate FunLihat Lebih Banyak

1
DDM白日做梦
MC:$4.11KHolder:2
0.08%
2
RWARWA
MC:$4.16KHolder:1
0.00%
3
狗勾柴犬币
MC:$4.17KHolder:1
0.00%
4
$BTCXX
MC:$4.14KHolder:1
0.00%
5
SEGSeven EcoTrade GT
MC:$4.23KHolder:2
0.17%

Sematkan