إقتراح مقدرثنائي المعلمات لإنموذج انحدارخطي مع تطبيق عملي

رسالة ماجستير

اسم الباحث : نورالزهراء نعيم عبدعلي

اسم المشرف : شروق عبدالرضا سعيد

الكلمات المفتاحية : 1- الانحدار الخطي2-مقدرثنائي المعلمات3-مشكلة التعدد الخطي4- انحدارالحرف البيزي5- طريقة المربحات الصغرى

الكلية : كلية الادارة والاقتصاد

الاختصاص : علوم الأحصاء

سنة نشر البحث : 2024

تحميل الملف : اضغط هنا لتحميل البحث


يوصف التعدد الخطي(Multi Colinearity) بأنه وجود علاقة خطية تامة او غير تامة بين كل او بعض المتغيرات التوضيحية في إنموذج الانحدار ما يؤدي الى خرق لاحدى فروض المربعات الصغرى الاعتيادية ( OLS) وهي عدم وجود ارتباط بين قيم مشاهدات المتغيرات التوضيحية في إنموذج الانحدار المراد تقديره والذي معه لايمكن فصل اثر المتغيرات بين بعضها البعض ما يؤدي الى انتهاك لأحدى إفتراضات نظرية كاوس – ماركوف التي تنص على ان لاتكون هنالك علاقة خطية بين المتغيرات المستقلة في الإنموذج . ونتيجة لذلك تكون معها المقدرات غير دقيقة وغير مستقرة وغير ممثلة للواقع الذي تمثله تلك الظواهر.
تهدف الرسالة الى اقتراح مقدر ثنائي المعلمات لتقدير معلمات إنموذج الانحدار الخطي له القدرة على مواجهة مشكلة التعدد الخطي يعتمد على المعلومات السابقة حول المعلمات المراد تقديرها ومقارنة هذا المقدر مع [مقدر انحدار الحرف (Ridge Regression estimator) ومقدر انحدار الحرف المعدل (Modified Ridge Regression estimator ) ومقدر انحدار الحرف البيزي (Bayesian Ridge Regression estimator) ومقدر (Lui) ومقدر ( Lui) المعدل ومقدر (Shrinkage estimator) . والمقدر ثنائي المعلمات لإنموذج الانحدار الخطي لـ Kaciranlar ومقدر ثنائي المعلمات لإنموذج الانحدار الخطي (Lokman et al.) ] باستعمال معيار متوسط مربعات الخطأ MSE فضلاً عن معايير (AIC )، (BIC ) ،(HQIC ) لكل إنموذج عن طريق اجراء محاكاة مونت-كارلوا لعينات صغيرة ومتوسطة وكبيرة لدراسة سلوك الطريقة المقترحة . وتم التوصل الى ان الطريقة المقترحة هي الافضل من باقي طرائق التقدير كونها حققت اقل معايير مقارنة ولكن هذه الطريقة كانت مقاربة لطريقة المربعات الصغرى الاعتيادية في حال كون الارتباط بين المتغيرات التوضيحية ضعيف جداً . وكلما زاد حجم العينة زادت افضلية الطريقة المقترحة ،
وفشلت طريقة المربعات الصغرى في تعدي مشكلة التعدد الخطي في حالة كون التعدد الخطي عالي بين المتغيرات التوضيحية في حين كانت الطريقة المقترحة فعالة جداً في حل هذه المشكلة.وعلى ضوء هه النتائج تم سحب عينة عشوائية بسيطة مؤلفة من (100) امرأة لدراسة العوامل المؤثرة على عدد الاطفال المولودين والذي يمثل متغير الاستجابة Y ومجموعة من المتغيرات المؤثرة على الظاهرة بواقع سبعة عشر متغير توضيحي X وتم تطبيق طريقة المربعات الصغرى والطريقة المقترحة على هذه البيانات. ومن خلال برنامجMatlab. Ver.2023 تم تحليل البيانات وتبين بأن الطريقة المقترحة تتفوق على طريقة المربعات الصغرى الاعتيادية لانها تمتلك اقل المعايير فضلا عن معنوية الإنموذج . اذ تم الكشف عن مشكلة التعدد الخطي في البيانات التطبيقية ومعنوية العلاقة بين المتغير المعتمد والمتغيرات المستقلة و كانت قيمة معامل التحديد (R2=0.95) وقمية معامل الارتباط (r=0.97) .

Rp-Proposed Two-Parameter Estimator For Linear Regression Model With An application.pdf

Multicollinearity is described as the presence of a complete or incomplete linear relationship between all or some of the explanatory variables in the regression model, which leads to a violation of one of the assumptions of ordinary least squares (OLS), which is the absence of a correlation between the values of the observations of the explanatory variables in the regression model to be estimated, with which the effect of the variables cannot be separated from each other, which leads to a violation of one of the assumptions of the Gauss-Markov theory, which states that there is no linear relationship between the independent variables in the model. As a result, the estimates are inaccurate, unstable, and unrepresentative of the reality represented by these phenomena. The aim of this thesis is to propose a two-parameter estimator to estimate the parameters of the linear regression model that has the ability to face the problem of multicollinearity based on the previous information about the parameters to be estimated and to compare this estimator with [Ridge Regression estimator, Modified Ridge Regression estimator, Bayesian Ridge Regression estimator, Lui estimator, Modified Lui estimator, Shrinkage estimator, Kaciranlar’s two-parameter estimator for the linear regression model and Lokman et al.’s two-parameter estimator for the linear regression model] using the mean square error (MSE) criterion as well as the (AIC), (BIC), and (HQIC) criteria for each model by conducting Monte-Carlo simulations for small, medium, and large samples to study the behavior of the proposed method. The proposed method was found to be the best of the remaining estimation methods because it achieved the lowest comparison criteria, but this method was close to the usual least squares method in the event that the correlation between the explanatory variables is very weak. The larger the sample size, the better the proposed method is. The least squares method failed to overcome the problem of multicollinearity in the event that multicollinearity is high between the explanatory variables, while the proposed method was very effective in solving this problem. In light of these results, a simple random sample of (100) women was drawn to study the factors affecting the number of children born, which represents the response variable Y and a group of variables affecting the phenomenon, with seventeen explanatory variables X. The least squares method and the proposed method were applied to this data. The data were analyzed through the Matlab program and it was found that the proposed method outperforms the usual least squares method because it has the lowest criteria in addition to the significance of the model. The problem of multicollinearity in the applied data and the significance of the relationship between the dependent variable and the independent variables were revealed. The value of the coefficient of determination was (R2=0.95) and the value of the correlation coefficient was (r=0.97).