Intrusion detection system using deep learning for cybersecurity enhancement

dc.contributor.authorHalbouni, Asmaaen_US
dc.contributor.supervisorTeddy Surya Gunawan, Ph.Den_US
dc.contributor.supervisorMohamed Hadi Habaebi, Ph.Den_US
dc.contributor.supervisorAthaur Rahman Bin Najeeb, Ph.Den_US
dc.description.abstractThe growth of the Internet allowed attacks not to increase only in numbers but also in diversity. Cybersecurity specialists in this field focus on designing an effective intrusion detection system (IDS) to minimize false alarm rates and detect known and unknown threats to networks. Intrusion detection systems take up a large space in the field of network security, where new methods continue to emerge regarding the intrusion detection process. The latest methods came up with the emergence of deep learning. A neural network, the fundamental component of deep learning, can imitate the human brain to perform analytical learning by learning and training. In intrusion detection systems, neural networks can be trained to detect malicious traffic patterns in a given environment. This research is carried out to develop an intrusion detection system using Convolutional Neural Network (CNN) and Long-Short Term Memory (LSTM) to detect and classify intrusions in networks automatically. The optimum CNN-LSTM structure was based on three layers, where all layers have a CNN layer, followed by max-pooling, batch normalization, LSTM, and finally dropout layer. The final layer is connected to a fully connected layer (FC) with a SoftMax unit to perform classification. Preprocessing steps are implemented to prepare the dataset before training the model. The model was trained on three recent binary and multiclass classification datasets, including CIC-IDS, UNSW-NB, and WSN-DS. The confusion matrix determines the system's effectiveness, which contains assessment criteria such as accuracy, precision, detection rate, F1-score, and false alarm rate (FAR). Experimental results demonstrated the proposed model's effectiveness. The CIC-IDS2017 dataset achieved the highest accuracies of 99.64 % and 99.60 %, respectively, and the highest detection rate of 99.70 % and 99.95 %, with the lowest false alarm rate of 0.10 % and 0.12 % when evaluated on binary and multiclass classification. The highest detection rates achieved on the UNSW-NB15 dataset were 94.53 % and 82.51 %, and the accuracies at ???? = 8 were 93.78 % and 81.83 %, respectively. The false alarm rates on binary and multiclass classification were 6 % and 2.3 %. At ???? = 10, the binary WSN-DS dataset achieved the highest accuracy, detection rate, and false alarm rate of 99.67 %, 98.14 %, and 0.18 %, respectively. At ???? = 8, multiclass classification achieved the highest detection rate of 98.83 %, while accuracy and false alarm rate were 98.35 % and 0.80 %, respectively. Finally, the model has been benchmarked with other deep learning models using similar datasets, and the results of our model outperformed benchmarked studies.en_US
dc.description.abstractarabicالنمو السريع في الأنترنت سمح ليس فقط في ازدياد الهجمات التي تتعرض لها شبكات الانترنت وانما أيضا التنوع في شكلها. يركز أخصائيو الأمن السيبراني في مجال تعقب البيانات على تطوير نطام الكشف عن التسلل ) IDS ( من أجل تقليل معدل الانذار الخاطئ واكتشاف الهجمات المعروفة سابقا والغير معروفة في الشبكات. أنظ مة كشف التسلل تشغل حيزا كبيرا في مجال امن الشبكات حيث أن الطرق المتعلقة بعملية اكتشاف التسلل تستمر بالظهور والتطور. أحدث الأساليب جاءت مع ظهور التعلم العميق. الشبكة العصبية، المكون الأساس للتعلم العميق، لديها القدرة على تقليد الدماغ البشري والقيام بأداء تحليلي من خلال التعلم والتدرب. في أنظمة كشف التسلل، الشبكات العصبية لديها القدرة على القيام بالتدريب من أجل اكتشاف أنماط المرور الضارة في بيئة معينة. تم إجراء هذا البحث لتطوير نظام كشف التسلل القائم على استخدام الشبكة العصبية التلافيفية CNN والذاكرة طويلة-قص يرة المدى LSTM ، وذلك من أجل اكتشاف وتصنيف الاختراقات في الشبكات تلقائيًا. التكوين الأمثل للنظام يستند إلى ثلاتة طبقات من CNN-LSTM ، حيث أن كل طبقة من الطبقات الثلاثة تحتوي على طبقة CNN متبوعة بأقصى تجمع، ثم تطبيع الدفعات وطبقة LSTM ، وأخيرا طبقة التسرب. تتصل الطبقة الأخيرة بطبقة متصلة بالكامل FC التي تحتوي على وحدة SoftMax للقيام بعملية التصنيف. تم تنفيذ خطوات المعالجة المسبقة من أجل إعداد مجموعة البيانات قبل أن يتم تدريب النموذج. تم تدريب النموذج بناءً على التصنيف الثنائي والتصنيف متعدد الفئات على ثلاثة مجموعات بيانات حديثة تتضمن CIC-IDS 2017 و UNSW- NB15 و WSN-DS . مصفوفة الإرتباك، التي نقيس مدى فعالية النظام تحتوي على معايير التقييم المتمثلة بالدقة والضبط ومعدل الكشف ومعامل f1 و معدل الإنذار الخاطئ. النتائج التجريبية أظهرت مدى فعالية النموذج. حققت مجموعة البيانات CIC-IDS 2017 أعلى دقة بنسبة 99.64 % و 99.60 %، على التوالي، وكان أعلى معدل كشف 99.70 % و 99.95 % مع أقل معدل معدل إنذار خاطئ بنسبة 0.10 % و 0.12 % بناءً على التصنيف الثنائي والمتعدد الفئات، على التوالي. بناءً على مجموعة البيانات UNSW-NB15 فإن أعلى معدل كشف تم تحقيقه كان 94.53 % و 82.51 % وبلغت الدقة أيضا نسبة 93.78 % و 81.83 % عند K=8 ، بينما كان بلغ معدل الإنذار خاطئ نسبة 6% و 2.3 % بناءً على التصنيف الثنائي والتصنيف متعدد الفئات، على التوالي. عند K=10 حققت مجموعة البيانات WSN-DS ثنائية التصنيف أعلى دقة ومعدل كشف ومعدل إنذار خاطئ بنسب 99.67 ،% 98.14 % و 0.18 %، على التوالي. عند K=8 وبناءً على التصنيف متعدد الفئات فأن أعلى معدل كشف بلغ 98.83 %، بينما بلغت الدقة ومعدل الإنذار الخاطئ نسبة 98.35 % و 0.80 %، على التوالي. وأخيرا، تم قياس النموذج مع نماذج أخرى بناءً على مجموعة الب يانات المستخدمة ، وتفوقت نتائج نموذج هذا البحث على الدراسات المعيارية.en_US
dc.description.kulliyahKulliyyah of Engineeringen_US
dc.description.notesThesis (MSCIE)--International Islamic University Malaysia, 2022.en_US
dc.description.physicaldescription1 online resource (xv, 100 leaves) ; color illustrations.en_US
dc.description.programmeMaster of Science in Computer and Information Engineeringen_US
dc.publisherKuala Lumpur : Kulliyyah of Engineering, International Islamic University Malaysia, 2022en_US
dc.subject.lcshIntrusion detection systems (Computer security)
dc.subject.lcshDeep learning (Machine learning)
dc.titleIntrusion detection system using deep learning for cybersecurity enhancementen_US
dc.typeMaster Thesisen_US

