Büyük dil modellerinin kesinlikle sinir ağlarında tonlarca eğitim verisi tuttuğu açık, ama beni rahatsız eden şey şu: bu ezberlenmiş bilgilerin bu modellerin içinde nerede yaşadığı gerçekten anlaşılamıyor. Yani, hangi katmanlar bunu tutuyor? Mimarisi belirli bilgileri nasıl depolar ve geri alır? LLM'lerde ezberleme mekanizması, bu sistemlere giderek daha fazla güvendiğimiz halde, şaşırtıcı bir şekilde belirsizliğini koruyor.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
9 Likes
Reward
9
4
Repost
Share
Comment
0/400
GateUser-c799715c
· 8h ago
Büyük dil modellerinin çok gizemli olduğunu nasıl da hissediyorum.
View OriginalReply0
ContractFreelancer
· 8h ago
Büyük modellerin hafıza gücü iyi olsa da, nerede sakladıklarını bilmiyoruz.
View OriginalReply0
FloorPriceNightmare
· 8h ago
Arkadaki kara kutu gerçekten korkutucu!
View OriginalReply0
BearHugger
· 9h ago
Gülmekten öldüm, model eğitimi, tütsü yakmak ve dua etmek gibi.
Büyük dil modellerinin kesinlikle sinir ağlarında tonlarca eğitim verisi tuttuğu açık, ama beni rahatsız eden şey şu: bu ezberlenmiş bilgilerin bu modellerin içinde nerede yaşadığı gerçekten anlaşılamıyor. Yani, hangi katmanlar bunu tutuyor? Mimarisi belirli bilgileri nasıl depolar ve geri alır? LLM'lerde ezberleme mekanizması, bu sistemlere giderek daha fazla güvendiğimiz halde, şaşırtıcı bir şekilde belirsizliğini koruyor.