ملف:RLHF diagram.svg

الملف الأصلي (ملف SVG، أبعاده 512 × 366 بكسل، حجم الملف: 177 كيلوبايت)

هذا ملف من ويكيميديا كومنز. معلومات من صفحة وصفه مبينة في الأسفل. كومنز مستودع ملفات ميديا ذو رخصة حرة.

ملخص

الوصفRLHF diagram.svg	English: This is a high-level overview of reinforcement learning from human feedback, including training an initial supervised model, collecting human feedback, training a reward model, and using it to align the initial model.
التاريخ	١٤ مارس ٢٠٢٤
المصدر	عمل شخصي
المؤلف	PopoDameron

أنا، صاحب حقوق التأليف والنشر لهذا العمل، أنشر هذا العمل تحت الرخصة التالية:

يحقُّ لك:

حسب الشروط التالية:

نسب العمل إلى مُؤَلِّفه – يلزم نسب العمل إلى مُؤَلِّفه بشكل مناسب وتوفير رابط للرخصة وتحديد ما إذا أجريت تغييرات. بالإمكان القيام بذلك بأية طريقة معقولة، ولكن ليس بأية طريقة تشير إلى أن المرخِّص يوافقك على الاستعمال.
الإلزام بترخيص المُشتقات بالمثل – إذا أعدت إنتاج المواد أو غيرت فيها، فيلزم أن تنشر مساهماتك المُشتقَّة عن الأصل تحت ترخيص الأصل نفسه أو تحت ترخيص مُتوافِقٍ معه.

اضغط على زمن/تاريخ لرؤية الملف كما بدا في هذا الزمن.

	زمن/تاريخ	صورة مصغرة	الأبعاد	مستخدم	تعليق
حالي	20:20، 1 أبريل 2024		512 × 366 (177 كيلوبايت)	PopoDameron	Clarified relationship between RM and aligned model & added description to the aligned model
	04:13، 14 مارس 2024		512 × 366 (160 كيلوبايت)	PopoDameron	Uploaded own work with UploadWizard

الصفحة التالية تستخدم هذا الملف:

الويكيات الأخرى التالية تستخدم هذا الملف:

هذا الملف يحتوي على معلومات إضافية، غالبا ما تكون أضيفت من قبل الكاميرا الرقمية أو الماسح الضوئي المستخدم في إنشاء الملف.

إذا كان الملف قد عدل عن حالته الأصلية، فبعض التفاصيل قد لا تعبر عن الملف المعدل.

العرض	100%
الارتفاع	100%