امسح ضوئيًا لتحميل تطبيق Gate

qrCode

خيارات تحميل إضافية

لا تذكرني بذلك مرة أخرى اليوم

AltcoinArchitect

2025-11-07 03:07:37

من الواضح أن النماذج اللغوية الكبيرة تحتفظ بالكثير من بيانات التدريب في شبكاتها العصبية، لكن ما يزعجني هو: لا أحد يفهم حقًا أين تعيش هذه المعلومات الم memorized داخل هذه النماذج. مثل، أي الطبقات تحتفظ بها؟ كيف تخزن البنية المعمارية وتسترجع الحقائق المحددة؟ لا يزال الآلية الكاملة وراء التذكر في LLMs غامضة بشكل مدهش، حتى ونحن نعتمد على هذه الأنظمة أكثر فأكثر.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 9

أعجبني
9
4
إعادة النشر
مشاركة

تعليق

0/400

GateUser-c799715c

· منذ 8 س

كيف أشعر أن النماذج اللغوية الكبيرة غامضة جدًا؟

شاهد النسخة الأصليةرد0

ContractFreelancer

· منذ 8 س

الذاكرة الجيدة للنموذج الكبير جيدة، لكن لا نعرف أين يخزنها بالضبط.

شاهد النسخة الأصليةرد0

FloorPriceNightmare

· منذ 8 س

الخلفية الصندوق الأسود مخيف حقًا!

شاهد النسخة الأصليةرد0

BearHugger

· منذ 9 س

أضحكني، يبدو أن تدريب النموذج يشبه حرق البخور والدعاء.

شاهد النسخة الأصليةرد0

المواضيع الرائجةعرض المزيد
#GateWeb3LaunchpadBOBLaunches
5.15K درجة الشعبية
#LaunchTokensOnSquareToGrab$1,000
42.37K درجة الشعبية
#CryptoMarketPullback
242.6K درجة الشعبية
#PrivacyCoinsRally
8.64K درجة الشعبية
#HKLaunchesFirstTokenizedFund
2.56K درجة الشعبية

Gate Fun الساخنعرض المزيد

1
DDM白日做梦
القيمة السوقية:$4.11Kعدد الحائزين:2
0.08%
2
RWARWA
القيمة السوقية:$4.16Kعدد الحائزين:1
0.00%
3
狗勾柴犬币
القيمة السوقية:$4.17Kعدد الحائزين:1
0.00%
4
$BTCXX
القيمة السوقية:$4.14Kعدد الحائزين:1
0.00%
5
SEGSeven EcoTrade GT
القيمة السوقية:$4.23Kعدد الحائزين:2
0.17%

تثبيت

خريطة الموقع