مستخدم:JarBot/مهام مقترحة

هذه الصفحة لاقتراح المهام البوتية التي تخدم ويكيبيديا العربية وتساهم بتوفير الوقت على المستخدمين.

اكتشاف خرق حقوق الملكية الفكرية

عدل

حقوق الملكية والنشر هي من أكبر المشكلات القائمة في ويكيبيديا العربية، فكثيرٌ من المقالات المخالفة قد تُضَاف وتمضي عليها سنوات بدون اكتشافها حتى يصبح العثور عليها فائق الصعوبة، إذ إن على المحرّرين التحقق يدوياً من تاريخ المعلومات في المقال ومقارنته بالمعلومات في المصادر الأخرى. واكتشاف خرق حقوق النشر آلياً يكاد يكون مستحيلاً بالنسبة للمقالات القديمة في الموسوعة لأنها تُنْسَخ إلى عشرات المواقع الأخرى بعد نشرها، لكن من الممكن تدقيق المقالات الجديدة بطريقة مؤتمتة وباستخدام أدوات تكشف النسخ المخالف لحقوق النشر (plagiarism) وتُبلِّغ عنه للمحرّرين.

  • الطريقة الأسهل لتحقيق هذا الأمر هي استخدام واحدٍ من برماج كشف مخالفات حقوق النشر وتشغيله على المقالات الجديدة، والتبليغ عن أي مقالات تتجاوز نسبة الخرق فيها عدداً معيناً من الكلمات أو نسبة معينة من حجم المقال. في ويكيبيديا الإنكليزية عدة بوتات تقوم بهذه المهمة يمكن التواصل مع مشغّليها للحصول على المساعدة.

  تعليق: سأعمل على هذه المهمة ومهمة استرجاع التخريب خلال الفترة القادمة. جار الله

الحيادية

عدل

بعض مشكلات الحيادية تحتاج ساعاتٍ من البحث والتحقيق للكشف عنها أو إثباتها أو معالجتها، إلا أن بعض المشكلات تتضّح بسهولة شديدة، وتزخر ويكيبيديا العربية ببعض مشكلات الحيادية الجليّة في لغة المقالات والتي تظهر مباشرةً باستخدام مصطلحاتٍ مثل "شهيد" أو "فضيلة الشيخ" أو ما شابه. يمكن استخدام أسسٍ بحثية في تحديد المصطلحات المخالفة للحيادية واكتشافها تلقائياً.

  • على أساس قائمة بالمصطلحات المُحمَّلة بمعانٍ قد تخرق الحيادية، يمكن للبوت وضع قوالب تدلّ على مشكلات الحيادية في المقالات أو حذف المصطلح مباشرةً في حالات معيّنة،

  تعليق: مجرد توفير قائمة بالمصطلحات يمكن للبوت أن ينفذ المهمة مع مراعاة الاستثناءات والاقتباسات. جار الله

القوالب

عدل

إحدى المهام البسيطة رغم أهميتها والمساعدة الهائلة التي تقدّمها (والتي ربما تقوم بها بعض البوتات سلفاً) هي استيراد الآتي لمقالات ويكيبيديا العربية:

  • قوالب المعلومات: نسخ أي قالب معلومات موجود في ويكيبيديا الإنكليزية (على الأقل ضمن مجالات معيّنة: مثل الكائنات الحيّة). يكفي نسخ الكود الأساسي لظهور القالب عبر ويكي بيانات ولا حاجة لملئه بالكامل في النسخة العربية.
  • قوالب التصفّح: نسخ قوالب التصفّح الموجودة في آخر المقال الإنكليزي إن كان القالب نفسه موجوداً في ويكيبيديا العربية.

  تعليق: مهمة قوالب المعلومات تم الموافقة عليها خلال الأشهر الماضية ويتم تنفيذها بشكل دوري. قوالب التصفح هناك مهمة أعمل عليها ستشملها. جار الله

تنسيق مقالات الموسوعة

عدل

توجد كثير من مشكلات التنسيق الشائعة التي يمكن للبوت أن يتعلم تصحيحها بعد إجراء بعض التجارب بأسلوب المحاولة والخطأ أو التجربة والفشل، ومن أهمّها:

  • استخدام رمز {{<nowiki>}}: يكاد يكون خاطئاً دوماً في نطاق المقالات، ويكثر جداً في مقالات المستخدمين الجدد.
  • تنسيق عناوين الأقسام: استبدال الخط الغامق في سطر منفردٍ بعلامات "==" لعنوان القسم.
  • تحويل الروابط الخارجية إلى داخلية: تعديل الروابط الخارجية التي تقود إلى مقالات الموسوعة لتكون داخلية.

  تعليق: مهمة تحويل الروابط الخارجية إلى داخلية أعمل بشكل دوري عليها، الأقسام فكرة جيدة، العمل على رمز {{<nowiki>}} ضمن مهمة الأخطاء الإملائية فكرة جيدة لأن لا يمكن تنفيذ التنسيق بشكل فردي بسبب اعتبار المجتمع هذه المهمة تجميلية ويمكن توفير الاستثناءات. --جار الله

تدقيق لغوي دائم التطور

عدل

يكاد يكون التدقيق اللغوي أحد أهم مهام البوتات وأكثرها توفيراً للوقت على مستخدمي ويكيبيديا العربية، خصوصاً مع كثرة الأخطاء الهائلة في مساهمة معظم المساهمين الجدد. ورغم توفّر بعض شفرات التدقيق اللغوي في الموسوعة، إلا أن هذه الشفرات قلَّما تتطور لأنها لم تعتمد حتى الآن على قدر يذكر من الجهد التشاركي (crowdsourcing) أو الذكاء الاصطناعي في تطويرها. وفي حال فتح المجال لاستقبال الاقتراحات بهذا الخصوص يمكن توسيع قائمة مهام التدقيق اللغوي لتوفير مئات الساعات على المحرّرين في مراجعة مقالات الموسوعة المُطوّلة وتصحيح أخطاءٍ قد تكرّر عشرات المرات في المقال الواحد، بدءاً من المسافات بين علامات الترقيم إلى الهمزات ونقاط الهاء وما شابه.

  تعليق: أستقبل الطلبات بعد موافقة ميدان اللغويات عليها بشكل دوري ولكن عدد قليل من الزملاء يقترح كلمات أو أخطاء جديدة. كتابة AI/ML models من خلال تجاربي السابقة والمستمرة خارج ويكيبيديا تأخذ فترة طويلة (من تدريب الآلة وتعليمها) ونحتاج حجم داتا كبير لتتعلم الآلة بنسبة نجاح تسمح بتشغيلها بشكل آلي وحتى لا تتحول إلى حافظ مش فاهم :)، في البداية يجب أن نحصل على عدد كبير من الاقترحات كي نتحول إلى الذكاء الاصطناعي وإلا كتابة قائمة بالكلمات ستكون الحل الأضمن والخالي من الأخطاء. -- جار الله