تعداد نشریات | 161 |
تعداد شمارهها | 6,532 |
تعداد مقالات | 70,504 |
تعداد مشاهده مقاله | 124,122,578 |
تعداد دریافت فایل اصل مقاله | 97,230,598 |
مقایسه مدلهای یادگیری جمعی برای پیشبینی رتبۀ کشوری دانشآموزان در کنکور سراسری | ||
مدیریت صنعتی | ||
دوره 16، شماره 3، 1403، صفحه 457-481 اصل مقاله (801.35 K) | ||
نوع مقاله: مقاله علمی پژوهشی | ||
شناسه دیجیتال (DOI): 10.22059/imj.2024.381521.1008178 | ||
نویسندگان | ||
احمد جعفرنژاد چقوشی* 1؛ آرمان رضاسلطانی2؛ امیر محمد خانی2 | ||
1استاد، گروه مدیریت صنعتی، دانشکده مدیریت صنعتی و فناوری، دانشکدگان مدیریت، دانشگاه تهران، تهران، ایران. | ||
2دانشجوی دکتری، گروه مدیریت صنعتی، دانشکده مدیریت صنعتی و فناوری، دانشکدگان مدیریت، دانشگاه تهران، تهران، ایران. | ||
چکیده | ||
هدف: این پژوهش به بررسی و مقایسه مدلهای یادگیری جمعی میپردازد تا بتواند به پیشبینی دقیقتری از رتبۀ کشوری دانشآموزان در کنکور سراسری دست یابد. هدف اصلی این پژوهش شناسایی مدلهای بهینهای است که با تحلیل دادههای آزمونهای آمادگی که پیش از کنکور برگزار میشود، بتوانند رتبۀ دانشآموزان را با بیشترین دقت پیشبینی کنند. مدلهای شناساییشده میتوانند به مشاوران تحصیلی کمک کنند تا با ارائۀ توصیههای دقیقتر و مبتنی بر داده، به دانشآموزان در انتخاب مسیر تحصیلی و برنامهریزی آموزشی کمک کنند. روش: در این پژوهش، بهمنظور تحلیل دقیق عملکرد دانشآموزان، از نرمافزار Octoparse برای جمعآوری دادههای مرتبط با آزمون قلمچی کانون فرهنگی آموزش استفاده شد. مجموعه دادهها اطلاعات مهمی بودند، نظیر میانگین نمره آزمون، رتبههای کشوری و منطقهای، رشتههای تحصیلی و دانشگاههای قبولی دانشآموزان. همچنین در این مطالعه، چهار مدل پیشرفته یادگیری جمعی شامل XGBoost، LightGBM، CatBoost و Random Forest بهمنظور مقایسه و ارزیابی عملکرد در پیشبینی رتبۀ کشوری دانشآموزان انتخاب شد. بهمنظور سنجش دقت و کارایی این مدلها، از معیارهای متنوعی مانند میانگین مربعات خطا، جذر میانگین مربعات خطا، ضریب تعیین و همچنین زمانهای آموزش و پیشبینی استفاده شد. دادههای جمعآوریشده، به دو بخش آموزشی و آزمایشی تقسیم شدند تا مدلها بتوانند به بهترین شکل آموزش ببینند و ارزیابی شوند. بهمنظور دستیابی به عملکرد بهینه، از روش جستوجوی شبکهای بهره گرفته شد که به ما اجازه میدهد پارامترهای مدلها را بهطور دقیق تنظیم کنیم و بهترین نتایج ممکن را بهدست آوریم. یافتهها: نتایج این مطالعه نشاندهندۀ عملکرد برجسته مدلهای XGBoost و LightGBM در پیشبینی رتبۀ کشوری دانشآموزان بود. مدل XGBoost بهعنوان دقیقترین گزینه شناخته شد؛ زیرا پیشبینیهایی ارائه داد که به مقادیر واقعی بسیار نزدیک بود و کمترین میزان خطا را داشت. این دقت بالا باعث شد که XGBoost بهعنوان مدل برتر در این پژوهش شناخته شود. مدل LightGBM نیز با نتایج بسیار مشابه XGBoost، بهعنوان یکی دیگر از گزینههای برجسته، برای پیشبینی رتبۀ کشوری انتخاب شد. این مدل به خاطر سرعت و دقت زیاد، مورد توجه قرار گرفت و بهعنوان ابزاری مؤثر در این زمینه شناخته شد. مدل Random Forest نیز با دقتی بهتر نسبت به CatBoost عمل کرد؛ هرچند زمان بیشتری برای آموزش و پیشبینی نیاز داشت. در مقابل، مدل CatBoost بهعنوان ضعیفترین گزینه شناخته شد؛ زیرا در مقایسه با سایر مدلها دقت کمتری داشت و مقادیر خطای بیشتری ارائه میکرد؛ هرچند سرعت پیشبینی آن بیشتر بود. به نظر میرسد که این مدل به بهبود نیاز دارد تا بتواند با دیگر مدلهای موفق رقابت کند. نتیجهگیری: یافتهها نشان میدهد که مدلهای XGBoost و LightGBM بهعنوان دو ابزار مؤثر در یادگیری جمعی، عملکرد بسیار خوبی برای پیشبینی رتبۀ دانشآموزان در آزمونهای سراسری دارند. این مدلها با دقت بالا و عملکرد بهینه، میتوانند بهعنوان راهنماهایی ارزشمند در سیستمهای آموزشی عمل کنند و به بهبود فرایندهای یادگیری کمک کنند. این مدلها قادرند دانشآموزانی را که ممکن است در مسیر تحصیلی خود با چالش مواجه شوند، شناسایی کنند و به طراحی برنامههای یادگیری مؤثرتر یاری دهند. علاوهبراین، نتایج این پژوهش میتواند به رهبران مدارس و سیاستگذاران برنامههای آموزشی کمک کند تا تصمیمهای هوشمندانهتری در جهتِ ارتقای عدالت آموزشی اتخاذ کنند؛ بهطوری که فرصتهای یادگیری برابر، برای همۀ دانشآموزان فراهم شود. در آینده، استفاده از مدلهای پیشرفتهتر یادگیری عمیق و اضافهکردن دادههای مرتبط، مانند عوامل اجتماعی، اقتصادی و نوع مدارس، میتواند به بهبود دقت پیشبینیها منجر شود. همچنین، ترکیب مدلهای مختلف یادگیری ماشین برای ایجاد مدلهای ترکیبی میتواند به افزایش دقت و کاهش خطاهای پیشبینی کمک کند. بهطور کلی، این پژوهش میتواند نقطۀ عطفی برای توسعۀ سیستمهای پیشبینی و تصمیمگیری در حوزۀ آموزش در کشور شمرده شود و زمینهساز بهبودهای چشمگیر در این زمینه باشد. | ||
کلیدواژهها | ||
یادگیری جمعی؛ پیشبینی رتبۀ کشوری؛ کنکور سراسری؛ مدلهای یادگیری ماشین | ||
مراجع | ||
اسدی، علی اکبر و جوادزاده، محمدعلی (1400). پیشبینی نمرات دانشآموزان با استفاده از روش یادگیری ماشین (مقایسه سه الگوریتم درخت تصمیم، جنگل تصادفی و رگرسیون خطی). ششمین کنفرانس بینالمللی پژوهشهای کاربردی در کامپیوتر، برق و فناوری اطلاعات.
بابایی، مرضیه و شویدی نوش آبادی، مهدی (1399). مروری بر روشهای پیشبینی عملکرد دانشجویان با استفاده از الگوریتمهای یادگیری ماشین. ششمین کنفرانس بینالمللی نوآوری و تحقیق در علوم مهندسی.
خانی، امیر محمد؛ کزازی، ابولفضل و بیرامی، ثریا (1401). مدلسازی ساختاری بر مبنای مدیریت زنجیرهتأمین در رابطه با مدیریت کیفیت جامع، نگهداریو تعمیرات بهرهور فراگیر، سازمان یادگیرنده و عملکرد عملیاتی. مطالعات مدیریت صنعتی، 20(65)، 39-84.
زنگوئی، حمید و فاطمی، سید امید (1400). پیشبینی دانشآموزان در معرض خطر افت تحصیلی با استفاده از تجزیهوتحلیل یادگیری در سیستم مدیریت یادگیری. مجله ایرانی آموزش از دور، 3(2)، 32-44.
سالاری، مژده؛ رادفر، رضا و فقیهی، مهدی (1403). پیشبینی عملکرد دانشجویان با استفاده از الگوریتمهای یادگیری ماشین و داده کاوی آموزشی (مطالعه موردی دانشگاه شاهد). مطالعات مدیریت کسبوکار هوشمند، 12(47)، 315-366.
قدوسی، محمد، میرسعیدی، فاطمه و کوشا، حمیدرضا (1399). پیشبینی و تحلیل عملکرد دانشجویان به کمک تکنیکهای دادهکاوی بهمنظور بهبود عملکرد تحصیلی. فناوری آموزش، 14(4)، 821-834.
کاظمیان، مینا؛ افشارکاظمی، محمدعلی؛ فتحی هفشجانی، کیامرث و معتدل، محمدرضا (1402). ارائه مدل هوشمند تعیین قیمت فولاد با رویکرد ترکیبی نظریه بازیها و الگوریتمهای یادگیری ماشین. مدیریت صنعتی، 15(3)، 478- 507.
References Adejo, O. W. & Connolly, T. (2018). Predicting student academic performance using multi-model heterogeneous ensemble approach. Journal of Applied Research in Higher Education, 10(1), 61–75. https://doi.org/10.1108/jarhe-09-2017-0113 Asadi, A.A. & Javadzadeh, M.A. (2021). Prediction of students' grades using machine learning method (comparison of three algorithms of decision tree, random forest and linear regression). The 6th International Conference on Applied Research in Computer, Electricity and Information Technology. (in Persian) Babaei, M. & Shovidi Noushabadi, M. (2019). A review of student performance prediction methods using machine learning algorithms. The 6th International Conference on Innovation and Research in Engineering Sciences, https://civilica.com/doc/1033467 Breiman, L. (2001). Random forests. Machine Learning, 45, 5-32. https://doi.org/10.1023/A:1010933404324 Butt, N. A., Mahmood, Z., Shakeel, K., Alfarhood, S., Safran, M. & Ashraf, I. (2023). Performance Prediction of students in Higher Education using Multi-Model Ensemble Approach. IEEE Access, 11, 136091–136108. https://doi.org/10.1109/access.2023.3336987 Chen, T. & Guestrin, C. (2016, August). Xgboost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 785-794). https://doi.org/10.1145/2939672.2939785 Daniele, V. (2021). Socioeconomic inequality and regional disparities in educational achievement: The role of relative poverty. Intelligence, 84, 101515. https://doi.org/10.1016/j.intell.2020.101515 Frost, J. (2019). Regression Analysis: An Intuitive Guide for Using and Interpreting Linear Models. Statistics by Jim Publishing. https://doi.org/10.1007/978-3-030-36077-8 Ghodoosi, M., Mirsaeedi, F. & Koosha, H. (2020). Predicting and analyzing the performance of students through data mining techniques to improve academic performance. Technology of Education Journal (TEJ), 14(4), 821-834. doi: 10.22061/jte.2019.4902.2134 (in Persian) Gibson, D. C. & Webb, M. E. (2015). Data science in educational assessment. Education and Information Technologies, 20, 697-713. https://doi.org/10.1007/s10639-015-9411-7 Goodfellow, I., Bengio, Y. & Courville, A. (2016). Deep Learning. MIT Press. https://doi.org/10.5555/3086952 Han, J., Pei, J. & Kamber, M. (2011). Data mining: Concepts and techniques (3rd ed.). Morgan Kaufmann. https://doi.org/10.1016/C2009-0-61819-5 Han, M., Tong, M., Chen, M., Liu, J. & Liu, C. (2017). Application of Ensemble Algorithm in Students’ Performance Prediction. 2017 6th IIAI International Congress on Advanced Applied Informatics (IIAI-AAI), 735-740. Hodson, T. O. (2022). Root-mean-square error (RMSE) or mean absolute error (MAE): when to use them or not. Geoscientific Model Development, 15(14), 5481–5487. https://doi.org/10.5194/gmd-15-5481-2022 Hyndman, R. J. & Koehler, A. B. (2006). Another look at measures of forecast accuracy. International Journal of Forecasting, 22(4), 679-688. https://doi.org/10.1016/j.ijforecast.2006.03.001 Injadat, M., Moubayed, A., Nassif, A. B. & Shami, A. (2020). Systematic ensemble model selection approach for educational data mining. Knowledge-Based Systems, 200, 105992. https://doi.org/10.1016/j.knosys.2020.105992 James, G., Witten, D., Hastie, T. & Tibshirani, R. (2013). An Introduction to Statistical Learning with Applications in R. Springer. https://doi.org/10.1007/978-1-4614-7138-7 Kazemian, M., Afsharkazemi, M. A., Fathi Hafashjani, K. & Motadel, M. (2023). Presenting Smart Steel Pricing Model: An Integration of Game Theory and Machine Learning Algorithms. Industrial Management Journal, 15(3), 478-507. doi: 10.22059/imj.2023.356697.1008039 (in Persian) Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., ... & Liu, T. Y. (2017). LightGBM: A highly efficient gradient boosting decision tree. Advances in Neural Information Processing Systems, 30. https://doi.org/10.5555/3294996.3295074 Khani, A. M., Kazzazi, A. & Birami, S. (2022). Structural modeling based on supply chain management in relation to total quality management, maintenance and comprehensive productivity, learning organization and operational performance. Industrial Management Studies, 20(65), 39-84. doi: 10.22054/jims.2022.62763.2688 (in Persian) Navarro, C. L. A., Damen, J. A., Takada, T., Nijman, S. W., Dhiman, P., Ma, J. , ... & Hooft, L. (2021). Risk of bias in studies on prediction models developed using supervised machine learning techniques: systematic review. BMJ, 375. https://doi.org/10.1136/bmj.n2281 Prokhorenkova, L., Gusev, G., Vorobev, A., Dorogush, A. V. & Gulin, A. (2018). CatBoost: Unbiased boosting with categorical features. Advances in Neural Information Processing Systems, 31. https://doi.org/10.48550/arXiv.1706.09516 Sakri, S. & Saleh, A. (2020). RHEM: a robust hybrid ensemble model for students’ performance assessment on cloud computing course. International Journal of Advanced Computer Science and Applications, 11(11). https://doi.org/10.14569/ijacsa.2020.0111150 Salari, M., Radfar, R. & Faghihi, M. (2024). Predicting students' performance using machine learning algorithms and educational data mining (a case study of Shahed University). Business Intelligence Management Studies, 12(47), 315-366. doi: 10.22054/ims.2023.75523.2375 (in Persian) Wang, N. Z. & Shi, N. Y. (2016). Prediction of the admission lines of college entrance examination based on machine learning. 2016 2nd IEEE International Conference on Computer and Communications (ICCC), 332-335. https://doi.org/10.1109/compcomm.2016.7924718 Yağcı, M. (2022). Educational data mining: prediction of students' academic performance using machine learning algorithms. Smart Learning Environments, 9(1), 11. https://doi.org/10.1186/s40561-022-00192-z Yan, L. & Liu, Y. (2020). An ensemble prediction model for potential student recommendation using machine learning. Symmetry, 12(5), 728. https://doi.org/10.3390/sym12050728 Zangooei, H. & Fatemi, O. (2021). Predicting students at risk of academic failure using learning analytics in the learning management system. Quarterly of Iranian Distance Education Journal, 3(2), 32-44. doi: 10.30473/idej.2022.63913.1104 (in Persian) Zhang, C., Bengio, S., Hardt, M., Recht, B. & Vinyals, O. (2017). Understanding deep learning requires rethinking generalization. https://doi.org/10.48550/arXiv.1611.03530 | ||
آمار تعداد مشاهده مقاله: 414 تعداد دریافت فایل اصل مقاله: 119 |