بيانات التدريب والتحقق والاختبار

في تعلم الآلة، تعد دراسة وبناء الخوارزميات التي يمكن أن تتعلم من البيانات وتصدرها مهمة شائعة. ^[1] تعمل مثل هذه الخوارزميات عن طريق إجراء تنبؤات أو قرارات تستند إلى البيانات من خلال بناء نموذج رياضي من البيانات المدخلة.^[2] عادةً ما تأتي البيانات المستخدمة لبناء النموذج النهائي من مجموعات بيانات متعددة. على وجه الخصوص، تُستخدم ثلاث مجموعات من البيانات بشكل شائع في المراحل المختلفة من إنشاء النموذج: مجموعات التدريب والتحقق من الصحة والاختبار.

في البداية يُلائم النموذج على مجموعة بيانات تدريب، وهي مجموعة من الأمثلة المستخدمة لملاءمة المعلمات (مثل أوزان الاتصالات بين الخلايا العصبية في الشبكات العصبية الاصطناعية) للنموذج. يُدرب النموذج (مثل مصنف بايز الساذج) على مجموعة بيانات التدريب باستخدام طريقة التعلم الإشرافي، على سبيل المثال باستخدام طرق التحسين مثل نزول التدرج أو نزول التدرج العشوائي. في الممارسة العملية، تتكون مجموعة بيانات التدريب غالبًا من أزواج من متجه الإدخال (أو قيمة عددية) ومتجه الإخراج المقابل (أو قيمة عددية)، حيث يُشار إلى مفتاح الإجابة عادةً باسم الهدف (أو الملصق). يُشغل النموذج الحالي مع مجموعة بيانات التدريب وينتج نتيجة، ثم يُقارن بالهدف، لكل متجه إدخال في مجموعة بيانات التدريب. بناءً على نتيجة المقارنة والخوارزمية التعلمية المحددة المستخدمة، تُضبط معلمات النموذج. يمكن أن يشمل ملاءمة النموذج كلًا من اختيار المتغيرات وتقدير المعلمات.^[3]^[4]

بيانات التدريب

بيانات التدريب هي مجموعة بيانات من الأمثلة المستخدمة للتعلم، وهي تناسب المتغيرات (مثل القيم)، على سبيل المثال، المصنف.^[5]^[6] تميل معظم المقاربات التي تبحث من خلال بيانات التدريب عن العلاقات التجريبية إلى مناسبة البيانات، بمعنى أنه يمكنها تحديد العلاقات الواضحة في بيانات التدريب التي لا تتم بشكل عام.

بيانات التحقق

مجموعة بيانات التحقق عبارة عن مجموعة بيانات من الأمثلة المستخدمة لضبط بنية المتغيرات من المصنف. يسمى أحيانًا مجموعة التطوير. في الشبكات العصبية الاصطناعية، تكون بنية المتغيرات المعلمة الفائقة، على سبيل المثال، عدد الوحدات المخفية. يجب أن تتبع مجموعة الاختبار (كما ذكر أعلاه) نفس التوزيع الاحتمالي مثل مجموعة بيانات التدريب.

بيانات الاختبار

مجموعة بيانات الاختبار هي مجموعة بيانات مستقلة عن مجموعة بيانات التدريب، ولكنها تتبع نفس توزيع الاحتمالية كمجموعة بيانات تدريبية. إذا كان النموذج المناسب لمجموعة بيانات التدريب مناسبًا أيضًا لمجموعة بيانات الاختبار، فقد حدث الحد الأدنى من المطابقة الزائدة (انظر الشكل أدناه). عادةً ما يشير التركيب الأفضل لمجموعات البيانات التدريبية بخلاف مجموعة بيانات الاختبار إلى المطابقة الزائد.

وبالتالي، فإن مجموعة الاختبار هي مجموعة من الأمثلة المستخدمة فقط لتقييم الأداء (أي التعميم) لمصنف محدد بالكامل. للقيام بذلك، يُستخدم النموذج النهائي للتنبؤ بتصنيفات الأمثلة في مجموعة الاختبار. تُقارن هذه التنبؤات مع التصنيفات الحقيقية للأمثلة لتقييم دقة النموذج.

في السيناريو الذي تُستخدم كل من مجموعتي البيانات للتحقق من الصحة والاختبار، تُستخدم مجموعة بيانات الاختبار عادةً لتقييم النموذج النهائي الذي اُختيرت خلال عملية التحقق من الصحة. في حالة تقسيم مجموعة البيانات الأصلية إلى مجموعتين فرعيتين (مجموعتي تدريب واختبار)، قد تقيم مجموعة بيانات الاختبار النموذج مرة واحدة فقط (على سبيل المثال، في طريقة الاحتفاظ). لاحظ أن بعض المصادر تنصح بعدم استخدام مثل هذه الطريقة. ومع ذلك، عند استخدام طريقة مثل التحقق المتقاطع، يمكن أن يكون تقسيمان كافيين وفعالين لأن النتائج يُحسب متوسطها بعد جولات متكررة من تدريب النموذج والاختبار للمساعدة في تقليل التحيز والتقلب.^[7]

مجموعة تدريب (يسار) ومجموعة اختبار (يمين) من نفس المجموعة الإحصائية كنقاط زرقاء. نموذجان تنبؤيان يتناسبان مع بيانات التدريب. يتم رسم كل من النماذج المجهزة مع كل من مجموعات التدريب والاختبار. في مجموعة التدريب ، يكون (متوسط الخطأ المربع) للملاءمة الموضحة باللون البرتقالي 4 ، في حين أن متوسط الخطأ المربع للملائمة المبينة باللون الأخضر هو 9. في مجموعة الاختبار ، يكون متوسط الخطأ المربع للملائمة الموضح باللون البرتقالي 15 و متوسط الخطأ المربع للملائمة الموضحة في اللون الأخضر هو 13. يزيد المنحنى البرتقالي بشكل كبير من بيانات التدريب ، حيث أن متوسط الخطأ المربع يزداد بمقدار أربعة أضعاف تقريبًا عند مقارنة الاختبار بمجموعة التدريب. إن المنحنى الأخضر يتغلب على بيانات التدريب بشكل أقل بكثير ، حيث يزيد متوسط الخطأ المربع الخاص به بأقل من عامل 2.

البيانات المعزولة

ببساطة جزء من مجموعة البيانات الأصلية يمكن أن تكون جانبا وتستخدم كمجموعة الاختبار.^[8]

المراجع

^ Ron Kohavi؛ Foster Provost (1998). "Glossary of terms". تعلم الآلة. ج. 30: 271–274. مؤرشف من الأصل في 2018-07-07.
^ Machine learning and pattern recognition "can be viewed as two facets of the same field."
^ Ripley، Brian D. (31 ديسمبر 2007). Pattern Recognition and Neural Networks. Cambridge University Press. ISBN:978-0-521-71770-0. مؤرشف من الأصل في 2024-12-03.
^ James، Gareth (2013). An Introduction To Statistical Learning With Applications In R. Springer-Verlag New York Inc. ISBN:978-1-4614-7137-0. مؤرشف من الأصل في 2024-12-03.
^ Ripley, B.D. (1996) Pattern Recognition and Neural Networks, Cambridge: Cambridge University Press, p. 354
^ "Subject: What are the population, sample, training set, design set, validation set, and test set?", Neural Network FAQ, part 1 of 7: Introduction (txt), comp.ai.neural-nets, Sarle, W.S., ed. (1997, last modified 2002-05-17) نسخة محفوظة 9 مايو 2020 على موقع واي باك مشين.
^ "Discovering knowledge in data : an introduction to data mining | WorldCat.org". search.worldcat.org (بالإنجليزية). Archived from the original on 2024-08-24. Retrieved 2024-11-27.
^ https://web.archive.org/web/20180710195839/https://www.researchgate.net/profile/Ron_Kohavi/publication/2352264_A_Study_of_Cross-Validation_and_Bootstrap_for_Accuracy_Estimation_and_Model_Selection/links/02e7e51bcc14c5e91c000000.pdf. مؤرشف من الأصل (PDF) في 2018-07-10. {{استشهاد ويب}}: الوسيط |title= غير موجود أو فارغ (مساعدة)

[1] Ron Kohavi؛ Foster Provost (1998). "Glossary of terms". تعلم الآلة. ج. 30: 271–274. مؤرشف من الأصل في 2018-07-07.

[bishop-2] Machine learning and pattern recognition "can be viewed as two facets of the same field."

[3] Ripley، Brian D. (31 ديسمبر 2007). Pattern Recognition and Neural Networks. Cambridge University Press. ISBN:978-0-521-71770-0. مؤرشف من الأصل في 2024-12-03.

[4] James، Gareth (2013). An Introduction To Statistical Learning With Applications In R. Springer-Verlag New York Inc. ISBN:978-1-4614-7137-0. مؤرشف من الأصل في 2024-12-03.

[Ripley,_B.D._1996_p._354-5] Ripley, B.D. (1996) Pattern Recognition and Neural Networks, Cambridge: Cambridge University Press, p. 354

[cann-faq-6] "Subject: What are the population, sample, training set, design set, validation set, and test set?", Neural Network FAQ, part 1 of 7: Introduction (txt), comp.ai.neural-nets, Sarle, W.S., ed. (1997, last modified 2002-05-17) نسخة محفوظة 9 مايو 2020 على موقع واي باك مشين.

[7] "Discovering knowledge in data : an introduction to data mining | WorldCat.org". search.worldcat.org (بالإنجليزية). Archived from the original on 2024-08-24. Retrieved 2024-11-27.

[8] ttps://web.archive.org/web/20180710195839/https://www.researchgate.net/profile/Ron_Kohavi/publication/2352264_A_Study_of_Cross-Validation_and_Bootstrap_for_Accuracy_Estimation_and_Model_Selection/links/02e7e51bcc14c5e91c000000.pdf. مؤرشف من الأصل (PDF) في 2018-07-10. {{استشهاد ويب}}: الوسيط |title= غير موجود أو فارغ (مساعدة)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]