منظومه لأمن الاتصالات الصوتية في الوقت الفعلي اعتمادا على التضمين في قناة صوتية عامة

رسالة ماجستير

اسم الباحث : بنين قاسم عبدعلي

اسم المشرف : دكتور حيدر اسماعيل اشهادي ; دكتور مؤيد سليم كود

الكلمات المفتاحية :

الكلية : كلية الهندسة

الاختصاص : علوم الهندسة الكهربائية

سنة نشر البحث : 2022

تحميل الملف : اضغط هنا لتحميل البحث

الخلاصة

يعتبر بروتوكول نقل الصوت عبر الإنترنت (VoIP) وسيلة لربط المحادثات الصوتيه عبر شبكة الانترنت. حيث يتم استخدامه في العديد من التطبيقات البرمجية مثل Skype، WhatsApp و Google Talk. بشكل عام، يمكن أن تتعرض الاتصالات عبر الإنترنت بسهولة للقرصنة والتنصت. لضمان سرية المعلومات المرسلة وعدم كشفها تقترح هذه الدراسة نهج اتصال سري في الوقت الفعلي يعتمد على توليد قناة خطاب سرية داخل قناة خطاب عامة (شبكة VoIP) بناءً على تقنية إخفاء الصوت. تتطلب العملية قدرة تضمين عالية بطريقة الوقت الفعلي.تم تنفيذ نموذجين لاخفاء الصوت وهما:

النموذج الأول يعتمد على ضغط الكلام السري باستخدام تقنية سريعة وبسيطة مبنية على تقنية تحويل المويجات الرافعة والتي تتميز بسرعتها العالية، اما بالنسبة للنموذج الثاني فيستخدم برنامج ترميز الإنترنت (iLBC) لضغط الكلام السري مع التصحيح التلقائي لتدهور جودة الكلام المنتقل عبر قناة أتصال مدمجة بالضوضاء و فقد لبعض البيانات المرسلة خلالها. في كلا النموذجين المقترحين ولاجل تلبية متطلبات الاتصال الصوتي عبر الأنترنت، يتم ضغط الموجة الصوتية المستخدمة كغلاف بواسطة مشفر G.711 في فترات زمنية متزامنة (لكل 16 أو 20 مللي ثانية) مع موجة الصوت السرية المراد تضمينها لاحقا. بعد ذلك، يتم تضمين بيانات موجة الصوت السرية المضغوطة داخل بيانات الغلاف المضغوط في الوقت الفعلي لكل فترة زمنية لما يناظرها.

في قناة اتصال عديمة الخسائر او الفقد للبيانات، تم الحفاظ على جودة الإشارات الناتجة بعد عملية التضمين بأكثر منdB 41 (للنموذج المقترح الأول) وdB45 (للنموذج المقترح الثاني) من حيث نسبة الإشارة إلى الضوضاء (SNR). أيضًا، تم تحقيق قدرة تضمين عالية تصل إلى 12.5٪ و 25٪ من حجم خطاب الغلاف للنموذجين المقترحين الأول والثاني. علاوة على ذلك، تم استرداد البيانات السرية بالكامل دون أخطاء. كذلك تم فحص متانة الطريقة المقترحة من حيث مناعتها ومقاومتها ضد وجود ضوضاء في قناة الاتصال وكذلك ضد وجود فقد جزء من الموجة بسبب عمليات التوجيه الخاطئة في الشبكة. في قناة مدمجة بالضوضاء، أضهرت النتائج ان النهج المقترح يمكنه التغلب على الضوضاء بنسبة تصل الى أكثر من dB 35 من حيث SNR للنموذج الأول وdB 38 للنموذج الثاني. كما تم استرجاع البيانات السرية بدون فرق محسوس للأذن البشرية ، حيث لم تقل قيمة مقياس التشابة (NC) عن 0.92 في حين كانت قيمة معدل الخطا في عدد البت المسترجعة (BER) أقل 0.0035 لكل من النموذجين المقترحين. عند نسب مختلفة من الخسائر او الفقد للبيانات الناتجة بعد عملية التضمين، تم الحفاظ على جودة الاشارات الناتجة والبيانات المخفية عند 0.88 وdB35 كمتوسط قيم من حيث NC و SNR على التوالي.

Real-Time Scheme for Speech Security in Public Communication based on Embedding Method into Audio Channel

Abstract

Voice over Internet Protocol (VoIP) is a popular and important internet protocol for real-time voice calling. It is used in several software applications such as Skype, WhatsApp, and Google Talk. However, communications over the internet can easily be exposed to hacking and eavesdropping. In this work, a real-time covert communication approach based on audio steganography is introduced; by generating a secure communication channel into a VoIP network. To implement this approach, two models are introduced.
In the first model, a very fast method based on lifting wavelet transform scheme. Lifting wavelet have important specifications over other transform techniques make it superior in time execution. While the second model is based on internet Low Bit Rate (iLBC) Codec as VoIP standard Codec with auto-correction for speech quality degradation over a lossy channel. For both models, G.711 Codec is used to compress the cover speech at synchronous periods (for each 16 or 20 msec) with respect to the secret speech to meet the VoIP requirements.
After that, the compressed cover data is used to embed the corresponding compressed secret data in real-time for each period individually. At a lossless noisy channel, the quality of the stego-signals is preserved at greater than 41 dB (for the first proposed model) and 45 dB (for the second proposed model) in terms of Signal to Noise Ratio (SNR). Also, a high embedding capacity up to 12.5% and 25% from the size of the cover speech for the first and second proposed models, respectively. Moreover, the secret data is fully retrieved without error. In a noisy channel, the robustness test results show that the proposed approaches can immune additive channel noise up to 35 dB in terms of SNR for the first model and 38dB for the second model. Also, the secret data is retrieved without perceptible difference for the human ear, where the value of the Normalized Cross Correlation (NC) is not less than 0.92 and the value of Bit Error Rate (BER) is less than 0.0035 for each of the two introduced models. At a different levels of packet losses, the quality for the stego-signals and hidden data is maintained at 0.88 and 35dB as average values in terms of NC and SNR respectively