طريقة فعالة و متينة لاكتشاف العبث في الاشارة الصوتية واستردادها باستخدام العلامة المائية

رسالة ماجستير

اسم الباحث : يونس محمد جليل

اسم المشرف : الأستاذ الدكتور حيدر اسماعيل شهادي + الأستاذ المساعد الدكتور حميد رسول فرحان

الكلمات المفتاحية : Audio authentication, audio hiding, lifting wavelet transform (LWT), Real-time audio communication, Tampering Detection, Signal Recovery, Speech Watermarking, Singular Value Decomposition, Authentication Code. Speech Signal Attack

الكلية : كلية الهندسة

الاختصاص : علوم الهندسة الكهربائية

سنة نشر البحث : 2022

تحميل الملف : اضغط هنا لتحميل البحث

الخلاصة

تعتبر عمليات التحقق من الموثوقية وارسترجاع البيانات من المواضيع الرئيسية والمهمة في مجال الاتصال. التحقق من المصداقية من العمليات المهمة والتي لها دور اساسي في كشف عمليات انتحال الشخصية . بينما يشير مصطلح الاسترداد الى استرجاع الرسائل المهاجمة من البيانات المتلقات والتي تم الهجوم عليها. حيث ان هذه العملية تشبه الى حد كبير عملية ترميز القناة الناقلة للمعلومات , الذي يمكن من هذه العملية تصحيح الاخطاء في الرسائل المستلمة الناجمة عن ضوضاء القناة. في هذا العمل والمجال , يتم اقتراح نهج توثيق الكلام واسترداد الاجزاء التي تم التلاعب بها وتغييرها .ويستند النهج الى وضع علامة مائية .

يقترح هذا العمل نهجين تم تنفيذهما بواسطة البرامج الحاسوبية. (Matlab 2018b) النظام الاول يتخصص في توثيق الكلام او الملف الصوتي المستلم, وهو مناسب للاتصال اللحظي. يتم تقسيم الموجة الصوتية الى عدد من الاجزاء ذات فترات زمتية 16 ملي ثانية . حيث يتم تحليل كل جزء باستخدام LWT لاستخراج بيانات فريدة من نوعها واستخدامها كبيانات تحقق . يتم تضمين بيانات التحقق لكل جزء ضمن الجزء الذي يليه . اظهرت النتائج التجريبية ان جودة الاشارة المرسلة اكبر من 40 ديسيبل عند قدرة تضمين عالية تصل الى 12.5% من حجم الموجة الاشارة المرسلة. بالاضافة الى ذلك, خلال الوسط الناقل ذو الضوضاء , اثبتت اختبارات قياس المتانة مقاومة عالية للضوضاء المضافة (AWGN) وصولا الى 15 ديسيبل من SNR , والتي تم قياسها باستخدام BER الذي يمثل مقدار الخطأ الحاصل ووجد انه يبلغ اعلى واسوء قيمة مقدارها 3% .

النهج الثاني يتخصص في التحقق من مصداقة الكلام المستلم واسترداد البيانات التي تم العبث بها .يتم اخذ نصف العينات المتواجدة في الملف الصوتي. بعد ذلك يتم تقسيمها الى عدد من الاجزاء ذات حجم 30 ملي ثانية لكي تلبي احتياجات الخطوة القادمة والتي تكون عملية تقليص او ضغط هذه الاجزاء باستخدام عملية ضغط (G.723.1 CODEC) التي تضغط كل جزء بنسبة 10 مرات من حجمه الاصلي. يتم تضمين كل جزء مضغوط في جزئين مختلفين ضمن مجموعتين مختلفتين. حين ان هذه العملية تحمي البيانات المضمنة من الخسارة في حالة تعرض الاشارة المرسلة للهجوم .النهج المقترح لديه القدرة على اكتشاف الاشارة المهاجمة واستعادة الاجزاء المفقودة لهذه الاشارة من الاجزاء الاخرس السليمة والاقل تدميراً . اظهرت النتائج التجريبية ان جودة الاشارة المرسلة والمقاسة باستخدام ال SNR تكون اكبر من 60 ديسيبل عند قدرة تضمين تبلغ 7% من حجم الاشارة .اضافة لذلك , يتم استرداد الاشارة المسترجعة بنسبة 100% وبجودة حوالي 3.94 والتي تم قياسها بواسطة PESQ في حالة هجوم كتم الصوت والاستبدال حتى 80% من حجم الاشارة. أيضًا اظهرت النتائج التجريبية ان النظام.

An Efficient and Robust Approach for Tamper Detection and Recovery using Speech Watermarking

Abstract

Authentication and tampering recovery are major role topics in the field of communications. Authentication is used to detect impersonation, while the term recovery refers to retrieving the attacked messages from the destroyed received data. The recovery process is somewhat like channel coding that can correct errors in the received messages caused by channel noise. This work proposes speech authentication and tampering recovery based on watermarking.
The proposed work (which software implemented by MATLAB R2018b) offers two approaches; The first one is an authentication speech approach that is suitable for real-time communication. The input speech signal is segmented into 16 msec frames. Each frame is decomposed using Lifting Wavelet Transform (LWT) to extract a unique data and used as authentication code. The generated code is embedded within the next frame. The experimental results show that the transmitted signal quality is greater than 40 dB in terms of Signal to Noise Ratio (SNR) at a payload of about 12.5 % of the transmitted signal size. Additionally, in noisy channel, the robustness tests prove the high resistivity against the Additive Gaussian Noise (AWGN) down to 15 dB of SNR, which measured by Bit Error Rate (BER) with worst case of 3 %.
The second proposed approach is speech authentication and tampering recovery. The input speech is down sampled by half, and then framing the resampled signal into 30 msec frames to meet the next step of the speech compression (G.723.1 CODEC) that compress each frame by ratio of 10. Each compressed frame is embedded within two different frames of different groups. This Scenario protects the data from losing in the case of the transmitted signal is attacked. The proposed approach has ability to detect the attacked signal and recover the lost frames of this signal from the other less destroyed frames. The experimental results show that the transmitted signal quality has SNR greater than 60 dB at a payload of 7 % of the signal size. Moreover, the retrieved signal is recovered 100% and at quality about 3.94 that measured by Perceptual Evaluation of Sound Quality (PESQ) in case of Mute and Replacement attacks up to 80% of the signal size. Also, the robustness tests show that the system has high immunity against AWAGN even with noisy channel at 15 dB that gives BER of the retrieved signal at worst case about 0.26 %.