استغلال معلومات التغذية الراجعة الصريحة والضمنية لتحسين نظام التوصية

رسالة ماجستير

اسم الباحث : حسين جبيرعودة

اسم المشرف : محسن حسن حسين

الكلمات المفتاحية :

الكلية : كلية علوم الحاسوب وتكنولوجيا المعلومات

الاختصاص : علوم الحاسوب

سنة نشر البحث : 2023

تحميل الملف : اضغط هنا لتحميل البحث

نظم التوصية (RSs) هي أنظمة ذكية لتصفية المعلومات والتي تتعامل مع مشكلة التحميل الزائد للمعلومات. في الآونة الأخيرة ، أصبحت معلومات(social trust) الثقة الاجتماعية عاملاً إضافيًا مهمًا في الحصول على توصيات عالية الدقة بالإضافة إلى ذلك ، تلعب معلومات (textual review) المراجعة النصية دورًا أساسيًا في العديد من أساليب نظم التوصية التي يمكنها تحسين دقة التوصيات.
تعاني تقنيات نظم التوصية من مشاكل مثل (class imbalance) و (sparsity) و (cold-start)، مما يقلل من دقة توصياتها. في هذا العمل ، تم اقتراح نموذجين لتحسين نظام التوصية وهذين النموذجين يستندان إلى استدلالات التغذية الراجعة الضمنية والتقييمات الصريحة. النموذج الأول هو نموذج التنبؤ المستند إلى الثقة (TPM) ويتم تقديم الآخر بنوعين من نماذج التوصية القائمة على المراجعة (RRMs).
في TPM، يتم الحصول على علاقات ثقة صريحة وضمنية بناءً على خاصية نشر الثقة ثم دمج هذه العلاقات للاستفادة من تقييمات اكثر للجيران الجديرين بالثقة للتخفيف من مشكلتي (cold-start) و(sparsity) . وفقًا لذلك ، يتم تطبيق تقنية(weighted voting) المستمدة من ((ensemble classifier لانتخاب تقييمات أفضل الجيران الموثوق بهم. يتم استخدام طريقة (K Nearest Neighbor) من خلال دمج خطي للتقييمات الأصلية والتقييمات المنتخبة من خلال الثقة بواسطة تضمين وزن المساهمة (contribution weight) للحصول على أفضل تغطية ودقة للتنبؤ.
من ناحية أخرى، في RRMs، تم تطوير نموذجين للتوصية بناءً على وجود وغياب المراجعات النصية في مجموعة الاختبار. على وجه الخصوص، شكلت خمس خطوات أساسية هذه النماذج: المعالجة المسبقة للبيانات، تصنيف النص، نمذجة الموضوع، تشابه النص، و خطوة استنتاج أوزان التعديل وبالتالي التخفيف من مشكلتي (class imbalance) و(sparsity) . يتم استخدام نموذج (Naïve Bayes) لدمج أوزان التعديل المستنتجة كتعليقات ضمنية للتوصية بالعناصر الأكثر تفضيلًا للمستخدم المستهدف.
تم إجراء تجارب مكثفة على النماذج المقترحة باستخدام خمس مجموعات من البيانات:(FilmTrust) ،(Epinions) ،(Musical Instruments) ، (Automotive)، و(Amazon Instant Video) . أظهرت النتائج التجريبية أن TPM) و RRMs ) المقترحة تفوقت بشكل ملحوظ على جميع الطرق التي تمت المقارنة معها في كل من مهمتي Rating) Prediction و .(Top-N Recommendation على وجه التحديد، في TPM، تراوحت نسب التحسين تقريبًا من 4% كحد أدنى إلى 20% و 10% كحد أقصى على (FilmTrust) و (Epinions) على التوالي، من حيث مقياس F1 لمهمة (Rating Prediction). بينما، في RRMs، تحسنت دقة التوصيات بحوالي 10% كحد أدنى إلى 61% و 26% و 22% كحد أقصى على (Musical Instruments)، (Automotive)، و (Amazon Instant Video) على التوالي ، من حيث مقياس F1 لـ مهمة (Top-N Recommendation).

Exploiting Explicit and Implicit Feedback Information for Recommendation System Improvement

Recommendation systems (RSs) are intelligent information filtering systems that deal with the information overload problem. Recently, social trust information has become a significant additional factor in obtaining high-quality recommendations. In addition, textual review information plays a core role in many RS methods that can improve the accuracy of recommendations.
RS techniques suffer from problems such as sparsity, cold-start, and class imbalance, which reduce their recommendation accuracy. In this work, two approaches have been proposed for RS improvement. They are based on implicit feedback inferences and explicit feedback ratings. The first one is the trust-based prediction model (TPM) and the other is offered with two tracks of review-based recommendation models (RRMs).
In TPM, explicit and implicit trust relations are obtained depending on the trust propagation attribute. They are incorporated to benefit from more ratings of trustworthy neighbors to alleviate the rating sparsity and cold-start problems. Accordingly, the weighted voting technique of the ensemble classifier is applied for the election of the most appropriate trusted neighbors’ ratings. The K Nearest Neighbor (KNN) method is employed with a linear combination of original and trust-elected ratings to obtain the best coverage and accuracy of the prediction.
In RRMs, on the other hand, two recommendation models are developed based on the presence and absence of textual reviews in the test set. In particular, five essential steps have shaped these models: data preprocessing, text classification, topic modeling, text similarity, and the step of deducing adjustment weights to mitigate the rating sparsity and class imbalance problems. The Naïve Bayes model is used to integrate the adjustment weights as implicit feedback for recommending the preferable items to the target user.
Extensive experiments have been conducted using five real-world datasets: FilmTrust, Epinions, Musical Instruments, Automotive, and Amazon Instant Video. The experimental results show that the proposed TPM and RRMs significantly outperform all methods compared in both rating prediction and Top-N recommendation tasks. Specifically, in TPM, the improvement ratios ranged approximately from 4% as a minimum to 20% and 10% as a maximum on FilmTrust and Epinions respectively, in terms of the F-measure of the rating prediction task. While, in RRMs, the recommendation accuracy improved by about 10% as a minimum to 61%, 26%, and 22% as a maximum on Musical Instruments, Automotive, and Amazon Instant Video respectively, in terms of the F1-measure of the Top-N recommendation task.