دراسة تطبيقية لتحليل التمايز في بعض النماذج الاحصائية

رسالة ماجستير

اسم الباحث : مريم مهدي عناد الخزعلي

اسم المشرف : أ.م.د شروق عبد الرضا سعيد السباح

الكلمات المفتاحية :

الكلية : كلية الادارة والاقتصاد

الاختصاص : علوم الأحصاء

سنة نشر البحث : 2018

تحميل الملف : اضغط هنا لتحميل البحث

المستخلص
ان التحليل التمييزي أسلوب إحصائي يعتمد على عينة من المشاهدات المسحوبة من مجتمعات معلومة لبناء قاعدة يمكنها المساعدة مستقبلاً في تعيين المجتمع الذي تنتمي إليه المشاهدات الجديدة اعتمادا على متغيرات ذات صفات تمييزية, وطبقت كحالة خاصة لتشخيص ثلاثة أنواع من الأورام السرطانية وهي اورام الثدي والعمود الفقري (سرطان العظم) والجهاز التنفسي (سرطان الرئة) لكثرة شيوعها في مجتمعنا حالياً.
و لغرض دراسة هذا الموضوع تم تسجيل قيم المشاهدات لخمسة متغيرات وهي (الجنس, العمر, مهنة المريض, حالة خروج المريض, مدّة بقاء المريض في المستشفى) من (عينة عشوائية بسيطة) بحجم 270 مريض درست في أربع نماذج احصائية وهي (دالة التمييز الخطية) وغير الخطية (دالة التمييز التربيعية ودالة التمييز اللوجستية) والانموذج اللامعلمي (دالة الجار الاقرب)، واستخرجت النتائج وفق البرنامج الاحصائي Stata فضلاً عن الحزمة الاحصائية الجاهزة SPSS , وذلك لتصنيف المشاهدات الى المجموعة التي تنتمي اليها, وتم استعمال معيار خطأ التصنيف كمعيار للمقارنة بين النماذج الاربعة, بهدف الوصول إلى أفضل انموذج باقل خطأ تصنيفي ممكن.
وتم الوصول الى ان انموذج الجار الأقرب اكثر تفوق من بقية الدوال من حيث قلة نسبة التصنيف الخاطئ بالمقارنة مع بقية النماذج.

An Applied study to Anlalyze Discriminant in some Models


The discriminate analysis is a statistical method based on a sample of observations taken from known societies to build a base that can help in identifying the society to which the new observations belong based on variables with discriminatory characteristics and applied to diagnose three types of tumors, namely breast, vertebral column (bone) and the respiratory system (lung) tumors as their prevalent in our society is abundance nowadays.
For the purpose of studying this subject, the values of observations were recorded for five variables (sex, age, occupation, prognosis and duration of hospitalization) for 270 patients (random samples) and they were studied in four statistical models. The models were (linear discrimination function) and nonlinear (quadratic discrimination function and logistic discrimination function) and non-parametric model (nearest neighbor function).
The statistical results were derived from the statistical program Stata as well as the statistical package SPSS to classify the tumors to which group they belong. The classification error criterion was used as a criterion for comparison between the four models, to the best model with the least error of invention in possible.
It was found that the nearest neighbor model was superior to the rest of the models in terms of lack of classification of the wrong as compared to other models.