“التقدير البيزي للانحدار اللوجستي الرتبي”

رسالة ماجستير

اسم الباحث : احمد سعيد جبار صالح

اسم المشرف : د ايناس عبد الحافظ محمد

الكلمات المفتاحية :

الكلية : كلية الادارة والاقتصاد

الاختصاص : علوم الأحصاء

سنة نشر البحث : 2021

تحميل الملف : اضغط هنا لتحميل البحث

ان النماذج التي يتم افتراضها تمثل تأثير عدد من المتغيرات المستقلة في متغير الاستجابة يمكن ان تتأثر بعدد من العوامل المفترضة والتي تكون تأثيراتها متغايرة وبحسب ظروف التجربة .
وتعاني نماذج الانحدار التي تمتلك متغير استجابة من النوع الوصفي من حالات خاصة يجب ان يتم الاخذ بها وتتمثل ب (مخالفة امتلاك متغير الاستجابة للتوزيع الطبيعي ) ولهذا جاءت هذه الدراسة في محاولة لتوظيف اربع طرائق بيزية مختلفة :
) Expected A Posteriori (EAP الطريقة الاولى (طريقة توقع التوزيع البعدي (
) Maximum A posteriori (MAP) الطريقة الثانية (طريقة القيمة العظمى للتوزيع البعدي
) Generalized Maximum Entropy (GME) الطريقة الثالثة (طريقة الانتروبي العظمى العامة
الطريقة الرابعة ( طريقة الانحدارات البيزية مع المعلومات الاولية الوصفيةBayesian Reg. With Category Prior Informing ( BRCPI ) )
مع دراسة تأثير هذه الطرائق ونتائج متوسط مربعات الخطأ العائد إليها وتم فحص كفاءة كل طريقة للمقارنة بعدد من العوامل وهي :
ضمن العوامل { عدد المتغيرات التوضيحية ( p ) ، نسب التلوث ( Prop ) ، نسبة عدد المتغيرات التوضيحية من النوع الوصفي ضمن العدد الكلي لهذه المتغيرات ( Gate ) ، عدد المفردات ( n ) ، قيمة معلمة التوزيع الأولي ( Sig ) }
اظهرت النتائج تأثير امتلاك الطرائق البيزية للانحدار اللوجستي الرتبي بالعوامل المذكورة آنفاً .
1. ان طريقة ( طريقة الانحدارات البيزية مع المعلومات الاولية الوصفية ) كانت هي الافضل لأنها اعطت اقل متوسط مربعات خطأ في حين كانت طريقة ( طريقة القيمة العظمى للتوزيع البعدي ) هي الاسوأ لأنها اعطت اكبر متوسط مربعات خطأ .
2. تأثر نتائج التقدير من النماذج بحجم العينة وذلك لان (n_2 ) اعطت افضل نتائج بينما حجم العينة (n_1 ) اعطت اسوأ نتائج .
3. تأثر نماذج التقدير بـ( قيمة معلمة التوزيع الاولي ) إذ أن (〖Sig〗_3=0.1) اعطت افضل نتائج مقابل (〖Sig〗_1=0.5) اعطت اسوأ نتائج .
4. هنالك تأثير لنسب التلوث في نتائج التقدير إذ أن نسبة التلوث (〖Prop〗_3 ) كانت هي الافضل لأنها اعطت متوسط مربعات خطا هو الاقرب للصفر في حين أن (〖Prop〗_1 ) كانت الاسوأ لأنها اعطت اكبر متوسط .

Bayesian estimation of ordinal logistic regression

Abstract
The models that are hypothesized represent the effect of a number of independent variables on the response variable that can be affected by a number of hypothesized factors whose effects are different depending on the circumstances of the experiment.
Regression models that have a response variable of a descriptive type suffer from special cases that must be taken into account, which is represented by (contrary to the possession of a response variable of a normal distribution), and for this this study came in an attempt to employ four different Bayesian methods :
Expected A Posteriori (EAP (
Maximum A posteriori (MAP)
Generalized Maximum Entropy (GME)
Bayesian Reg. With Category Prior Informing ( BRCPI )
With the study of the effect of these methods and the results of the mean squares of error related to them, the efficiency of each method was examined for comparison with a number of factors, namely:
Within the factors {number of explanatory variables (p), percentages of pollution (Prop), percentage of the number of explanatory variables of descriptive type within the total number of these variables (Gate), number of items (n), value of the initial distribution parameter (Sig) }
The results showed the effect of having Bayesian methods for orderly logistic regression on the aforementioned factors .
1- The method (Bayesian Regressions With Category Prior Informing) was the best because it gave the least mean squares of error, while the method (Maximum A posteriori) was the worst because it gave the largest mean squares of error.
2- The estimation results from the models were affected by the sample size, because ( n_2) gave the best results, while the sample size (n_1) gave the worst results.
3- The estimation models were affected by (the value of the initial distribution parameter), as (〖Sig〗_3=0.1) gave the best results versus (〖Sig〗_1=0.5) which gave the worst results.
4- There is an effect of pollution rates on the results of the estimation, as the pollution rate (〖Prop〗_3) was the best because it gave the mean squares of error that is closest to zero, while (〖Prop〗_1) was the worst because it gave the largest average.