University Publications

Computer Science and Technology Journal - - Issue (1) - استخدام تقنية SMOTE لمعالجة مشكلة عدم توازن البيانات في استبيان الطلاب لتقييم العملية التدريسية في الجامعة

Abstract

في الآونة الأخيرة حرصت أغلب المؤسسات الأكاديمية على إيجاد العوامل التي تزيد من نتائج التعليم وأصبحت جودة التعليم هدف مهم تسعى جميع المؤسسات التعليميه اليه خاصة في ظل توفر قدر ضخم من البيانات التي يمكن الاستفادة منها للحصول على نتائج ممتازة . و كثر استخدام خوارزميات تنقيب البيانات لتحليل هذه العوامل ، في هذه الدراسة تم بناء نموذج لتقييم الأداء الأكاديمي للأستاذ الجامعي وذلك عبر تصنيف اجابات الطلاب المتحصل عليها بواسطة استبانة الطلاب والتي تم بناءها باستخدام نموذج جوجل google form وهي مكونة من 36 سؤال بالإضافة لبعض البيانات الأخرى الخاصة بالأستاذ مثل معدله التراكمي الذي تخرج به ، الدرجة العلمية ، و عدد سنوات الخبرة. وقد تم التصنيف باستخدام ثلاث خوارزميات تصنيف (classification) وهي (Random Forest, Decision Tree, Naïve Bayes) وذلك لأنها تعمل مع الـ Multi Class classification وعند المقارنة بين اداء الخوارزميات اعطت خوارزمية الغابة العشوائية معدل أعلى من خوارزميتي Naïve Bayes وشجرة القرار حيث كان معدل الدقة 0.68 في خوارزمية الغابة العشوائية و هو منخفض نوعا ما بالإضافة الى أن نتائج مقاييس مصفوفة الارتباكrecall وprecision مع الفصائل 0 و 1 كانت منخفضة بينما النتائج مرتفعة مع الفصيل 2 أي أن النموذج منحاز للأغلبية و هذا نسبة لعدم التوازن في توزيع البيانات ، لذلك استخدم الباحث طريقة SMOTE لمعالجة هذه المشكلة. استخدمت لغة بايثون لبناء النموذج ، يمكن تقسيم عملية تصميم النموذج النهائي الى أربع مراحل ، المرحلة الأولى هي المعالجة المسبقة (preprocessing) ، و الثانية هي تطبيق الثلاث خوارزميات المقترحة ، في المرحلة الثالثة يتم اختبار النموذج باستخدام أدوات مصفوفة الارتباك precision, recall , f1-score)) و المرحلة الأخيرة تم استخدام طريقة SMOTE للتعامل مع عدم توازن البيانات. خلصت الدراسة إلى أن أداء النموذج تحسن أي أعطى معدل دقة أعلى عند تطبيق SMOTE حيث تحسنت الدقة العامة وايضا قدرة وأداء النموذج على التنبؤ و كانت خوارزمية Random Forest هي الأفضل من حيث التنبؤ بالعوامل الأكثر تأثيرا على معدلات تقييم الطالب للأستاذ ، حيث ارتفع معدل الدقة الى 0.82 بدلا عن 0.68