الكشف والتصنيف الآلي لورم الدماغ البشري بأستخدام التعلم الآلي

رسالة ماجستير

اسم الباحث : سارة علي عبد الحسين قمر

اسم المشرف : الهام محمد ثابت عبد الامير

الكلمات المفتاحية :

الكلية : كلية علوم الحاسوب وتكنولوجيا المعلومات

الاختصاص : علوم الحاسوب

سنة نشر البحث : 2024

تحميل الملف : اضغط هنا لتحميل البحث

الخلاصة

يعد النظام الآلي مهمًا لمساعدة الأطباء وأخصائيي الأشعة على اكتشاف أورام المخ وتصنيفها. تنتج الأورام الصلبة داخل الجمجمة عن انقسام الخلايا غير الطبيعي وغير المنضبط. التحدي الرئيسي في اكتشاف أورام المخ هو الاختلاف في موقع الورم وشكله وحجمه وتنوع أورام المخ وتعقيدها. يعد التعلم الآلي والتعلم العميق الحل الأمثل لهذه المشكلة.
يتضمن العمل المقترح المعالجة المسبقة للبيانات وتجزئة الصور، وتم تطبيق تقنيتين للتجزئة (التجزئة على أساس الحافة والتجزئة على أساس المنطقة) لمقارنتهما، حيث كانت النتائج باستخدام المنطقة أفضل من النتائج باستخدام الحافة. تم تطبيق العمليات المورفولوجية بعد عملية التجزئة وتشمل عمليات الإغلاق (التمدد والتآكل).
بعد ذلك، تم تطبيق التعلم الآلي وخوارزميات التعلم العميق لتصنيف أورام الدماغ بالتصوير بالرنين المغناطيسي إلى أربعة أنواع: الغدة النخامية، والورم الدبقي، والورم السحائي، وعدم وجود ورم في الحالات العادية، بناءً على مجموعة محددة من الميزات التي تعمل على تحسين دقة التصنيف وتوفير الوقت والتكلفة.
في هذا العمل، تم تنفيذ نموذجين مقترحين. الأول هو الجمع بين (مجموعة الهندسة المرئية 16 (VGG16) وأربعة مصنفات تقليدية): آلة ناقل الدعم (SVM)، وشجرة القرار (DT)، والغابة العشوائية (RF)، و Naive Bayes(NB). يتم تنفيذ هذا المزيج نظرًا لقدراته على التعلم العميق، حيث يمكنه استخلاص ميزات معقدة مثل تفاصيل أورام المخ. النموذج الثاني المقترح هو الشبكة العصبية التلافيفية (CNN).
في هذا العمل، أظهرت النتائج التجريبية أن الجمع ((VGG16) مع الغابة العشوائية) باستخدام التجزئة على أساس المنطقة حصل على دقة قدرها %99.24. وكانت النسبة أعلى مقارنة مع الجمع ((VGG16) مع الغابة العشوائية) عند استخدام التجزئة على أساس الحافة حيث كانت النتيجة %98.78.
مجموعة البيانات هذه هي في الأصل مزيج من ثلاث مجموعات بيانات: Figshare، ومجموعة بيانات SARTAJ، ومجموعة بيانات Br35H، التي تحتوي على صور التصوير بالرنين المغناطيسي للأنواع الأربعة من أورام الدماغ التي تم استخدامها.
وأخيراً، تمت مقارنة نتائجنا مع الأبحاث الموجودة في مجال التجزئة والتصنيف على نفس مجموعة البيانات، حيث أثبتت نتائجنا أنها الأفضل. حقق نموذجنا المقترح دقة بلغت %99.24، في حين تراوحت نتائج الأبحاث السابقة من %97.12، %95.73، إلى %87.67.

AUTOMATED DETECTION AND CLASSIFICATION OF HUMAN BRAIN TUMOR USING MACHINE LEARNING

Abstract

The automated system is important for helping doctors and radiologists to detect and classify brain tumors. Solid tumors inside the skull result from uncontrolled and abnormal cell division. The main challenge in detecting brain tumors is the difference in tumor location, shape, size, and the diversity and complexity of brain tumors. Machine learning and Deep learning are the perfect solution to this problem.

The proposed work includes data pre-processing and image segmentation, two segmentation techniques (edge-based segmentation and region-based segmentation) were applied to compare them, where the results using region were better than the results using edge. Morphological operations was applied after the segmentation process and includes the closing processes(dilation, and erosion).

Next, machine learning and deep learning algorithms were applied to classify MRI brain tumors into four types: pituitary, glioma, meningioma, and no tumor in normal cases, based on a specific set of features that improve classification accuracy, save time and cost.

In this work, two proposed models were implemented. The first is the combination Visual Geometry Group 16 (VGG16) with four traditional classifiers: Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), and Naive Bayes (NB). The combination is implemented due to its deep learning capabilities, as it can extract complex features such as details of brain tumors. The second proposed model is a convolutional neural network (CNN).

In this work, experimental results showed that the combination ((VGG16)with random forest) using region-based segmentation obtained the accuracy of 99.24%. The percentage is higher compared to the combination ((VGG16)with random forest) when using edge-based segmentation where was the result 98.78%.

This dataset is originally a combination of three datasets: Figshare, the SARTAJ data set, and the Br35H dataset, containing MRI images of the four types of brain tumors was used.

Finally, our results were compared with existing research in the field of segmentation and classification on the same dataset, where our results proved to be the best. Our proposed model achieved an accuracy of 99.24%, while previous research results ranged from 97.12%, 95.73%, to 87.67%.