مستخدم:Fattahsafa/ملعب
ملخص- بينما يزداد حجم إستخدام شبكات التواصل الإجتماعي يوماً بعد يوم، أصبج تحليل أو إستخراج الآراء موضوع هام في السنين الأخيرة. حجم العمل على دراسة تحليل الآراء في اللغة الإنجليزية وفي بعض اللغات الأخرى يفوق كثيراً كميته في اللغة العربية. هذه الورقة البحثية تناقش قصية تحليل الآراء وتستقصي دراساته للغة العربية وتسلط الضوء على بعض القضايا والمشاكل المتعلقة به.
مقدمة
عدلتحتل الشبكات الإجتماعية حيزاً كبيراً من وقتنا . إحصائيات عام 2015 تظهر أن هناك 2.206 مليار مستخدم نشط للشبكات الإجتماعية (30% من سكان العالم )[1]. المحتوى الشخصي للمستخدمين في هذه الشبكات يلقى إهتماماً بالغاً من الحكومات والشركات . يعرف تحليل الآراء على أنه إستخراج الآراء الشخصية من الوثائق بإستخدام طرق معالجة اللغات الطبيعية NLP[2].
يمكن تعريف تحليل الآراء من خلال تحديد مهماته ، حيث أن المهمة الأهم هي تحديد قطبية الرأي : إيجابي أو سلبي أو محايد . مهمة أخرى هي تحديد ما إذا كان مستندان متفقان تجاه قضية معينة قد تتعدى مهام تحليل الآراء إلى تحديد درجة الوفاق بين المستندات تجاه قضايا مختلفة[3] . معظم البحوث في تحليل الآراء هي للغة الإنجليزية وبعض اللغات الأخرى . أما بالنسبة للغة العربية ، فالموضوع حصل على بعض الاهتمام مؤخراً .
اللغة العربية هي 385.3 مليون شخص، 135 مليون منهم هم مستخدمون نشطون للإنترنت و 71 مليون شخص هم من مستخدمين الشبكات الإجتماعية . للغة العربية الكثير من اللهجات التي تستخدم بشكل أساسي في التواصل اليومي. أما بالنسبة للغة الفصحى الحديثة فهي تدرس في المدارس والجامعات وتستخدم في المراسلات الرسمية، وهي تعتمد لغوياً ونحوياً على اللغة العربية الفصحى القديمة[4].
دراسات تحليل الآراء في اللغة العربية إستخدمت طرق متعددة. هذه الورقة البحثية ارتكزت في تصنيفها للبحوث على الصفات المستخدمة في تصنيف الآراء. باقي الورقة منظم على النحو التالي: الجزء الثاني يتناول مجاميع ومعاجم الآراء العربية. الجزء الثالث يعرض مجموعة من طرق تحليل الآراء في اللغة العربية. الجزء الرابع يناقش تأثير الترجمة والنفي على تحليل الآراء. وأخيراً، القسم الأخير يلخص الورقة كاملةً.
مجاميع ومعاجم الآراء
عدلتعد كلمات التعبير عن الآراء الأدوات الأهم في تحليلها. معاجم الآراء هي قائمة بالكلمات التي تستخدم في التعبير عن الآراء[5]. أما مجاميع الآراء فهي مجموعة كبيرة من الأراء المصنفة[6]. مجاميع الآراء تستخدم بكثرة في تقييم طرق تحليل الأراء.
عرض رشدي وآخرون[7] مجمع الآراء العربية الذي يحتوي على 500 رأي للأفلام باللغة العربية. هذا المجمع تم جمعه بطريقة آلية من المواقع الإلكترونية.
من أجل تقييم المجمع، تم إجراء 24 تجربة بإستخدام المتغيرات التالية: على مستوى معادلة المصطلحات( Schema Weighting ) تكرار المصطلح (Term Frequency) وتكرار المصطلح-معكوس تردد المستند(Ferquency Term Frequency Inverse Document) أما على مستوى المصنف فتم استخدام مصنف شعاع الدعم (Support Vector Machine ) ومصنف نايف باز (Naive Bays) أما على مستوى النمذجة فتم إستخدام سلال كلمات احادية الكلمة(Unigram) وثنائية الكلمة (Bigram) وثلاثية الكلمة (Trigram). كما أنه تم إستخدام الكلمات أو جذورها (Stemming).
نتائج هذه الإختبارات أظهرت أن مصنف شعاع الدعم كان أفضل من مصنف نايف بايز، خاصة عندما تم استخدامه مع تكرار المصطلح.كما أن كلا سلاسل الكلمات ثنائية وثلاثية الكلمة كانت أفضل من أحادية الكلمة. عندما تم استخدام مصنف شعاع الدعم، كلا نتائج السلاسل ثنائية وثلاثية الكلمة كانت متساوية مع جذور الكلمات وتكرار المصطلح، او باستخدام الكلمات نفسها لكن مع تكرار المصطلح-معكوس تكرار المستند. أما بالنسبة لمصنف نايف بايز، فإنه حقق نتائج أفضل بدون استخدام جذور الكلمات. نتائج كلا تكرار المصطلح وتكرار المصطلح- معكوس تكرار المستند كانت جيدة مع مصنف شعاع الدعم وسلاسل الكلمات ثلاثية الكلمة.
إبن حمودة[8] اقترح طريقة تعتمد على معاجم الآراء لإستخراج آراء الأشخاص في فيسبوك تجاه الربيع العربي. تم بناء ثلاثة معاجم للمختصرات وللعواطف وللمدخلات بإسم 256 حالة فيسبوك شخصية. المؤلفون اهتموا بثلاثة متغيرات: تمثيل النص (text Representation) وسلاسل الكلمات (n-gram) ، ووسم أجزاء الكلمات(Part Of Speach Tagging )، لتمثيل النص، تم إستخدام مصفوفة الحضور .(Presence Matrix ) لتقييم هذه الطريقة تم استخدام 60% من البيانات للتدريب وتم تصنيفها يدوياً إلى إيجابي وسلبي ومحايد. أما باقي البيانات فتم استخدامها للإختبار. تم إجراء 4 اختبارات لاختبار الطريقة مع متغيريين: المصنف وسلاسل الكلمات. تم استخدام أربعة أنواع من سلاسل الكلمات : أحادية الكلمة وأحادية الكلمات +ثنائية الكلمة وأحادية الكلمة +ثلاثية الكلمة وأحادية الكلمة +ثنائية الكلمة + ثلاثية الكلمة. أما على مستوى المصنف فتم استخدام شعاع الدعم ونايف فايز. نتائج الاختبارات أظهرت أن الدقة (Accuracy) العظمى كانت عندما تم استخدام مصنف شعاع الدعم مع سلاسل أحادية الكلمة + ثنائية الكلمة . شعاع الدعم حصل على دقة (75.31%) أعلى من نايف بايز (74.78%). النتائج أظهرت أيضاً أن مقياس فيشر(F-measure) للحالات الإيجابية (75.0) كان أعلى منه للسلبية (73.1 ). أرجع المؤلفون هذا الى فارق العدد بين الحالات الإيجابية والسلبية المستخدمة، والذي قد يعكس التوجه الإيجابي لمستخدمي الفيسبوك العرب تجاه الربيع العربي.
تحليل الآراء في اللغة العربية
عدلتحليل الآراء هي قضية تصنيف النص (Text Classfication)، والعديد من خوارزميات تصنيف النص قابلة للتطبيق في تصنيف الآراء. تصنيف الآراء هو عادة من ثلاث فئات هي : إيجابية ، سلبية ومحايدة. تحليل الآراء في اللغة العربية هو تحدي نظراً لعدد من الأسباب: تعقيد قواعد اللغة العربية والتشكيل، ومجموعة متنوعة من اللهجات العربية ومجموعة متنوعة من أشكال الكلمة والآراء في اللغة العربية تعتمد كثيراً على سياقات الكلم[9]. في هذا القسم، يتم عرض بعض الأساليب المقترحة لتحليل الآراء باللغة العربية .
الميزات التي لا تعتمد على اللغة
عدلالميزات التي لا تعتمد على اللغة تستخدم في أنظمة تحليل الآراء متعددة اللغات. الحاجة الى مثل هذه الأنظمة تأتي من دافعين اثنين. أولاً، أحياناً الباحثين الذين يتكلمون لغات مختلفة يعملون على نفس النظام ويريدون تشغيل النظام الخاص بهم على جميع اللغات التي يتكلمونها . ثانيا، بعض الشركات العالمية تريد أن تعرف آراء عملائها من مختلف البلدان عن منتجاتها[5]، هذه الميزات هي: قواعد اللغة المحلية، وميزات موضعية[10] ، وأنماط المشاعر الحاملة[11]، سلاسل الكلمات، وتعليم مواضع الكلم،وتحليل التبعية[12]. في هذا القسم، يعرض اثنين من النظم ، الأول يقوم على قواعد اللغة المحلية في حين أن الآخر يقوم على سلاسل الكلمات.
أحمد وآخرون[13] استخدموا قواعد اللغة المحلية في تحليل الآراء المالية في اللغة الانجليزية والعربية والصينية. هذه الطريقة اعتمدت على مقارنة توزيع الكلمات في نص مالي عشوائي مع نفس الكلمات في نص أساسي، من أجل تحديد الكلمات المفتاحية (keywords)، التي قد تجذب نظر المتكلم. الخطوة الأولى في هذه الطريقة كانت الحصول على قائمة بالكلمات المفتاحية بإستخدام التحليل الإحصائي (Statistical Analusis) ثم يتم تحليل الكلمات القريبة من هذه الكلمات المفتاحية. إلى أن يتم حليل قواعد لغة محلية تستخدم الكلمات أو المصطلحات التي تحمل آراء النص حول القضية المالية. هذه القواعد اللغوية المحلية استخدمت لاحقاً لبناء آلة ذات حالات منتهية (Finite State Automaton ).
تم اختبار هذه الطريقة عن طريق تمرير مجموعة من النصوص الجديدة، وتم الحصول على دقة بنسبة %75-60
طوّر شكري وآخرون[14] نظام لتحليل الآراء للتغريدات العربية المكتوبة باللهجة المصرية. بدايةً تم جمع 1000 تغريدة وتصنيفها إلى إيجابية وسلبية بطريقة يدوية. ثم استخدمت هذه التغريدات في بناء مجمع لغوي. في الخطوة التالية تم إستخدام التحليل الإحصائي لإستخراج قيم المتغيرات. هذه الطريقة اعتمدت على سلاسل الكلمات، حيث تم استخراج سلاسل كلمات أحادية الكلمة وثنائية الكلمة وثلاثية الكلمة. سلاسل الكلمات ذو تكرار اقل من حد معين تم حذفها. بعد هذه المرحلة متجه قيم المتغيرات كان جاهزاً.
تم اختبار هذه الطريقة باستخدام 4 اختبارات ذوات 3 متغيرات هي : سلاسل الكلمات والكلمات الشائعة (Stop words) والمصنف .
نتائج هذه الاختبارات أظهرت ان استخدام سلاسل كلمات أحادية الكلمة أو أحادية الكلمة+ثنائية الكلمة لا يؤثر على مقياس فيشر. أرجع المؤلفون ذلك الى قلة عدد السلاسل ثنائية الكلمةالتي تجاوزت الحد المعرف. كما أن النتائج أظهرت ان حذف الكلمات الشائعة لم يحسن كثيراً الدقة ومقياس فيشر. ارجع المؤلفون ذلك الى غياب قائمة بالكلمات الشائعة للهجة المصرية ، حيث ان كثيراً من الكلمات الشائعة لم تحذف من النص وفي الجانب الاخر بعض الكلمات غير الشائعة حذفت لانها عرفت انها شائعة بالخطأ. مصنف شعاع الدعم حصل على دقة ومقياس فيشر اعلى من مصنف نايف بايز حيث كانت الدقة في كليهما 72.6% و 65.4% ، بينما مقياس فيشر 72.5% و 65.4% على التوالي .
أنظمة إسترجاع المعلومات والمصنفات والمجمعات
عدلهذا الجزء يعرض اثنين من أنظمة تحليل الآراء التي استخدمت نظم استرجاع المعلومات والمصنفات والمجمعات .
عرض الحواري والإفكي[15] نظاماً لتحليل آراء الأعمال العربية باستخدام مصنفين ، الاول لبناء بيانات التدريب (Training Data) من خلال تصنيف مجموعة من بيانات الشبكة العنكبوتية(Web) الى آراء و غير آراءثم مصنف تعزيز التكيف (AdaBoost Classifier)استخدم لتصنيف النصوص الى مستندات تحتوي على اراء باللغة العربية واخرى غير ذلك . ثم تم استخدام معجم لتحليل الآراء الذي تم بناؤه من الصفر واحتوى على اراء ايجابية واخرى سلبية مرتبين حسب درجاتهم. هذا المعجم استخدم كنواة لرسم التشابه(Similarity Graph ) في رسم التشابه كل كلمتين متشابهتين بينهما حافة. تم اضافة الكلمات الاكثر شيوعاً على الشبكة العنكبوتية لهذه النواة ايضاً . تم اختبار هذا النظام بإستخدام 650 كلمة او مصطلح عشوائياً وحل على دقة عالية (Precision) لكن نسبة استرجاع (Recall) ضعيفة . استخدم ابو جبرا [16]طرق معالجة اللغة العربية الطبيعية لتحليل آراء النقاشات . أبو جبرا بدأ بالتحليل على مستوى الكلمة حيث تم تحديد قطبية كل كلمة بالاعتماد على معجم عواطف [17]اما قطبية الكلمة في السياق فتم تحديدها بالاعتماد على نظام سمر [18]في المرحلة اللاحقة تم تحديد هدف القطبية حيث تم توسيم اي كلمة ظهرت في نصين او اكثر بهدف القطبية. تم تمثيل توزيع المواضيع لكل مناقش بمتجه ذي ن من الحدود حيث ن هي عدد المواضيع ، في المرحلة التالية تم تطبيق تخصيص ديريتشليت الكامن (LDA) على كل واحد من المواضيع. هذا التمثيل يعتمد على حقيقة انه اذا اتفق شخصان على نفس الرأي فإنهما غالباً سيكون لديهم نفس الاهتمام بالمواضيع. لإيجاد المجموعات الجزئية للآراء تم استخدام طرق تجميع المتجهات (Vector Space Clustering) تم تمثيل مواضيع المناقشين ايضا كشبكة معلمة (Signed Network) حيث ان كل نقطة في هذا الشبكة تمثل مناقشاً ولكل نقطتين في وصلة ايجابية اذا كان عدد المواضيع الذين اتفقوا عليها أكبر من عدد اللواتي اختلفوا عليها ووصلة سلبية اذا كان عدد اللواتي اختلفوا عليها اكبر اما اذا لم يكن هناك اهتمام مشترك بنفس المواضيع فهما غير متصلتان.تم اختبار التمثيل المتجهي باستخدام مجمع ك-معدل(K-Means) وبإستخدام مجمع الأبعد أولاً (Farthest First) وبإستخدام توقع التجزيئ الأقصى (Maximization Expectation) بينما تم اختبار تمثيل الشبكة المعلمة باستخدام طريقة تجزيء الشبكات المعلمة(Signed Network Partioning) اظهرت النتائج ان طرق التجميع حصلت على اعلى نقاوة (Purity) واعلى مقياس فليشر (F measure) وأفضل مقياس عشوائية (Entroby) هذه وحصل توقع التجزيئ الاقصى على افضل مقياس فليشر(0.76) وأعلى نقاوة (0.77) وأفضل عشوائية (0.5) كما ان النتائج أظهرت ان عدد اهداف الرأي والتحليل الدلالي للكلمة (Laten Similarity analusis) هما خاصيتان مهمتان.
تحليل الآراء بإستخدام ميزات خاصة باللغة العربية
عدلبعض أنظمة تحليل الآراء إستخدمت ميزات خاصة باللغة العربية. في هذا الجزء نستعرض إثنين منها.
عبد المجيد وآخرون[18] قدموا "سمر": نظام تحليل الآراء لعربية في وسائل التوصال الإجتماعي. سمر إستخدم نسخة خفيفة من مصنف دعم الشعاع في مرحلتي تصفية. المصنف في المرحلة الأولى صنف النصوص إلى نصوص تحمل آراء ذاتية ونصوص موضوعية. بينما صنف المصنف الثاني الآراء الذاتية إلى إيجابية وسلبية. أما بالنسبة للأراء المحايدة والمختلطة فقد تم تجاهلها.
إعتمد سمر على أربع أنواع من الميزات: نحوية ومعيارية وعامة وخواص تتعلق باللهجة. ضمت الخواص النحوية على شكل الكلمة ومواضع الكلم (POS-Tags). بينما إحتوت الخواص المعيارية على خاصية فريد التي وسم بها سمر أي كلمة ذات تكرار أقل أو يساوي 3، وخاصية معجمية التي إستخدمها سمر للدلالة على ما إذا كانت هذا الصفة جزءاً من معجم القطبية (Polarity-Lexicon)الذي استخدمه المصنف في المرحلة الأولى. أما بالنسبة لخاصية اللهحة فقد إستخدها سمر للدلالة على ما إذا كان هذا المستند هو باللغة الفصحى أم بالعامية. ضمت الخواص العامة الجنس وإسم المستخدم وهوية النص. سمر إستخدم بيانات من غرف الدردشة وتويتر وويكيبيديا لدراسة أثر بعض الخواض على نتائج التصنيف للآراء. توصل سمر إلى نتيجتين مهمتين هما: الأولى أن يكون نظام تحليل الآراء محدد إلى حد كبير، والثانية أن التجريد خاصية لا يمكن الإستغناء عنها.
أما النظام الثاني فقد إعتمد فيه الحزمي وسليم[19] في تحليل الآراء في التغريدات على خمسة من الخواص هي: الكائنات المسماة (Named-Entities) والكلمات الإنجليزية والوسوم (Hashtags) ووسوم مواضع الكلم. الخواص المستخرجة تم إستخدامها كمدخلات لثلاثة مصنفات: نايف بايز وشعاع الدعم و أقرب الجيران (K-Nearest-Neighbor). لتقييم تأثير خاصية وسم مواضع الكلم على نتائج التصنيف، تم إخضاع النظام لمجموعتين من التجارب: الأولى تم إستخدام فيها وسم مواضع الكلم والاخرى بدونه.
أظهرت النتائج أن مصنف شعاع الدعم قد أحرز أعلى تقدم عند إستخدام وسوم مواضع الكلم في مقياس فيتشر. أما بالنسبة لمصنف أقرب الجيران فقد أحرز أعلى دقة(0.915)، يليه نايف بيز (0.854)، ثم شعاع الدعم ثالثاً(0.697). كما أن النتائج أظهرت أن إستخدام وسوم مواضع الكلم لم يحرز تقدماً كبيراً. أرجع الباحثون هذا إلى أن اللهجة العامية العربية هي الأكثر إستخداماً في تويتر، الأمر الذي أدى إلى التأثر على دقة واسم مواضع الكلم.
قضايا في تحليل الآراء العربية
عدلعند تحليل الآراء العربية نحتاج الى أخذ بعض القضايا بعين الاعتبار، مثل الترجمة والنفي والتعجب والسخرية. في هذا الجزء نلقي الضوء على قضيتين مهمتين: الترجمة والنفي. يستخدم النفي بشكل واسع في اللغة العربية بإستخدام 10 ادوات نفي في جدول(1)[20] يوضح نسبة استخدام النفي في بعض المجالات. جدول1: إستخدام النفي على مستوى الجملة والمستند
مجال البيانات | المستند(%) | الجملة(%) |
---|---|---|
55 | 13 | آراء في الاخبار |
99 | 19 | اراء عن الاسواق |
39 | 11 | اراء عن المطاعم |
14 | 11 | اراء عن الافلام |
66 | 8 | اراء في وكالات الانباء |
النفي هو قضية مهمة في تحليل الآراء حيث أنه يعكس قطبية الرأي. بعض نظم تحليل الآراء تجاهلت تأثير النفي ، حيث عاملت أدوات النفي ككلمات شائعة(Stop words) حيث تم التخلص منهن جميعا في مرحلة قبل معالجات البيانات. الأمر الذي يؤدي إلى دقة أقل. في الناحية الأخرى, بعض الأنظمة أخذت قضية النفي بعين الحسبان. الكتيبي[20] في عمله على طريقتين لمعالجة النفي: ثابتة(Static)، ومتحركة (Dynamic) . في الطريقة الثابتة تعتبر الجملة منفية عندما توجد أي من كلمات النفي الشائعة فيها. مدى النفي يتم تحديده بإحدى ثلاثة طرق. في الطريقة الأولى يمتد تأثير أداة النفي الى الكلمة التي تليها فقط. أما في الطريقة الثانية يتم اختيار نافذة ذات عدد متغير من الكلمات. فيكون تأثير النفي على كامل النافذة. أما في الطريقة الثالثة فتأثير النفي يمتد ليغطي الجملة كلها . أما الطريقة المتحركة فتعتمد على مجمع نفي معلّم لتحديد ادوات النفي والجملة المنفية. وقد تم الاعتماد أيضاً على خوارزمية الحقل العشوائي الشرطي في (Conditional Random Field) تحديد مدى النفي. تم اختبار طريقتين بمجموعة من التجارب وبالاعتماد على سلسلة كلمات أحادية الكلمة ومصنف شعاع دعم. أما بالنسبة للبيانات فكانت آراء في الاخبار وللآسواق وللمطاعم والافلام وفي وكالات الانباء. نتائج كلا الطريقتين اظهرت تحسن على مقياش فيتشر في معظم المجالات مقارنة مع عدم النفي في عين الاعتبار، مع اختلاف هذا التحسن من مجال لآخر. أما القضية الاخرى الهامة في تحليل الآراء العربية فهي تأثير الترجمة على دقة النتائج. أهمية هذه القضية جائت من حقيقة لمعظم الدراسات البحثية لتحليل الآراء كانت لنصوص غير عربية. درس سلامة واخرون[21] في بحثهم تأثير الترجمة على نتائج تحليل الآراء عن طريق مقارنة تحليل الآراء لمجموعة من نصوص شبكات التواصل الاجتماعي قبل وبعد الترجمة. قام الباحثون باستخدام نصوص مترجمة آلياً ويدوياً من مجموعتي نصوص. نتائج إختبار النظام أظهرت أن تأثير الترجمة على دقة نتائج تحليل الآراء كان قليلاً، (1.4%) في مجموعة النصوص الاولى و (0.54%) في مجموعة النصوص الثانية.
خلاصة
عدلهذه الورقة استعرضت بعض الطرق والنظم لتحليل الآراء في اللغة العربية. معظم الأنطمة التي تم عرضها إستخدمت أما مجاميع أو معاجم للأراء. لذلك وجود هذه الأدوات اللغوية مسبقاً يسرع من عملية البحوث في تحليل الآراء ومن تقييمها أيضاً. هذا يعكس كم من الضروي أن يبذل الجهد في بناء معاجم ومجاميع للآراء. من ناحية أخرى، هذا الجهد يمكن أن يكون موجهاً ومركزاً على بناءها في اللهجات العامية، وذلك لسببين: أولاً جزء كبير من المحتوى العربي في الشبكات الإجتماعية مكتوب باللغة العامية، وثناياً نتائج بعض النظم التي أتسعرضت في تعكس مدى النقص في مصادر هذه اللهجات.
بالؤغم أن نظم تحليل الآراء غالباً ما تكون مخصصة لمجال معين، إلا أن بعض الخواص أثتبتت ةكفائتها في معظم هذه الانظمة. إستخدام مصنف شعاع الدعم هومثال واضح على هذه الخواص.
إستخدام نظم تحليل الآراء في اللغة الإنجليزية لتحليل الآراء العربية من خلال الترجمة أثتب نجاعته. التوجه لإستخدام مثل هذه النظم يبرره أن البحوث في اللغة الإنجليزية في تحليل الآراء تقدمت كثيراً على البحوث في العربية. هذا وتعتبر الخواص المستقلة عن اللغة مفيدة جداً في بناءً نظم تحليل آراء متعددة اللغات. وفي الناحية الأخرى، فإن الإعتماد على وميزات اللغة التي تسزخر بها اللعة العربية وأخذ خواصها وأدواتها، كالنفي، في عين الإعتبار عند تحليل الآراء له تأثير إيجابي على دقة نتائج التحليل.
- ^ كادي ريجان. الإعلام الإجتماعي اليوم. 2015. (باللغة الإنجليزية).
- ^ ويكيبيديا. تحليل الآراء. 2015. (باللغة الإنجليزية).
- ^ إريك كامبريا وبجورن شيلر ويونجينج شيا وكاثرين عافازي، طرق جديدة في تحليل الآراء. الانظمة الذكية لجمعية مهندسي الكهرباء والإلكترونيات، (2)، صفحة 15-21، (باللغة الإنجليزية)
- ^ نزار حبش. مقدمة إلى طرق معالجة اللغات الطبيعية في اللغة العربية. محاضرات في تكنولوجيا اللغات الإنسانية. 3(1): ص1--187. 2010. (باللغة الإنجليزية).
- ^ ا ب بينغ ليو. تحليل الآراء. محاضرات في تكنولوجيا اللغات الإنسانية. 5(1): ص1--167. 2012. (باللغة الإنجليزية).
- ^ تحليل الآراء في التغريدات العربية بإستخدام المنقب السريع. http://www.slideshare.net/RapidMiner. 2014. (باللغة الإنجليزية).
- ^ محمد رشدي صالح وتيسريسا مارت والفريدو بروبيز وجوزيه ميريسا-اورتيجا، مجمع الآراء العربية. مجلة المجتمع الامريكي لعلوم المعلوماتية والتكنولوجيا. 62(10)، صفحة 2045--2054، 2011، (باللغة الإنجليزية)ز
- ^ صفا إبن حمودة وجلال أكياشي. التنقيب في بيانات شبكات التواصل الإجتماعي لتصنيف الآراء. قضية جالات الفيسبوك أثناؤ الربيع العربي. المجلة العالمية للتطبيقات من أجل الإبداع في الهندسة والإدارة. 2(5) ص470--478. 2013. (باللغة الإنجليزية),
- ^ تقرير الإعلام الإجتماعي العربي. http://www.socialmediatoday.com/social-networks/kadie-regan/2015-08-10/10-amazing-social-media-growth-stats-2015. 2014. (باللغة الإنجليزية).
- ^ محمد كرايم وديفيد كاندال ومحمد عبد المجيد. تحليل الآراء في اللغة العربية: دراسة استقصائية. طرق وتطبيقات متطورة لتعليم الآلة، صفحات 128--139. شبرينغر للنشر، 2012.(باللغة الانجليزية).
- ^ كارليوس ارجونيتا وين- شن شن . تحليل الاراء متعدد اللغاتلبيانات الاجتماعية بالاعتماد على مجلة طرق معالجة اللغات الطبيعية لبيانات التواصل الاجتماعي ، صفحات 38 ، 2014.(باللغة الانجليزية).
- ^ باك وباروبيك. منهاج لا يعتمد على اللغة لتحليل الآراء. في المؤتمر العالمي للحوار. مجلد 2. ص38--50. 2012. (باللغة الإنجليزية).
- ^ خورشيد أحمد وديفيد شينغ ويوسف الماس. تحليل الآراء في لغات مختلفة للأخبار المالية. المؤتمر الأول لشبكة في الامور المالية، 2006. (باللغة الانجليزية).
- ^ اميرة شكري وأحمد رافيا. تحليل الآراء في اللغة العربية على مستوى الجملة. في المؤتمر العالمي لطرق وأنطمة التعاون. ص546--550. جمعية مهندسي الكهرباء والإلكترونياء العالمية. 2012. (باللغة الإنجليزية).
- ^ محمد الحواري ومحمد الإفكي، تحليل الآراء العربية للأعمال. في ورشة عمل مؤتمر إتحاد مهندسي الكهرباء والإلكترونيات العالمية لتحليل البيانات 2010. ص 1108-1113. إتحاد مهندسي الكهرباء والإلكترونيات العالمية. 2010 (باللغة الإنجليزية).
- ^ أمجد أبو جبارة وبين كينج ومنى ذياب ودراغومير راديف. تعريف مجموعات الآراء الجزئية في النقاشات العربية الحية. جمعية اللغات المحوسبة ، صفحات 829--835، 2013 (باللغة الانجليزية).
- ^ محمد عبد المجيد ومنى ذياب. عواطف: مجمع متعدد الانواع لتحليل الاراء في اللغة العربية الفصحى الحديثة. المؤتمر العالمي لمصادر وتقييم اللغة، صفحات 3907--3914 ، 2012 .(باللغة الانجليزية).
- ^ ا ب محمد عبد المجيد وساندرا كوبلير ومنى ذياب.سمر: نظام لتحليل الاراء في الاعلام الاجتماعي العربي. محضر ورشة عمل الثالثة في الطرق المحوسبة لتحليل الاراء، صفحات 19--28. إتحاد علوم اللغة المحوسبة، 2012. (باللغة الانجليزية).
- ^ مروة الحزمي ونعومي سليم. إستخراج أهداف الآراء من التغريدات. مجلة الهندسة والعلوم التطبيقية للشبكة الآسيوية لنشر البحوث 10(3): ص1023--1026. 2015. (باللغة الإنجليزية).
- ^ ا ب سعود صالح الكتيبي، تحليل الآراء في اللغة العربية بإستخدام تعليم الآلة. رسالة ماجستير، جامعة ولاية كولارادو، فورت كولينز، كولارادو.
- ^ محمد سلامة وسيف محمد وسفيتلانا كيريتشينكو. الاراء بعد الترجمة: قضية ملصقات شبكات التواصل الإجتماعي . قسم أمريكا الشمالية في جمعية اللغة المحوسبة، 2015. (باللغة الانجليزية).