Publication: Pavement crack detection and characterization using deep learning and pixel level segmentation
cris.virtual.department | #PLACEHOLDER_PARENT_METADATA_VALUE# | |
cris.virtual.orcid | #PLACEHOLDER_PARENT_METADATA_VALUE# | |
cris.virtualsource.department | bd2b5ff7-c8b8-4e26-9032-39ac7ce38e8d | |
cris.virtualsource.orcid | bd2b5ff7-c8b8-4e26-9032-39ac7ce38e8d | |
dc.contributor.author | Arselan Ashraf | |
dc.contributor.supervisor | Ali Sophian, Ph.D | |
dc.contributor.supervisor | Teddy Surya Gunawan, Ph.D | |
dc.date.accessioned | 2024-12-02T01:11:47Z | |
dc.date.available | 2024-12-02T01:11:47Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Pavement cracks pose a significant threat to road safety and infrastructure integrity, leading to potential hazards for vehicles and necessitating costly repairs. The traditional methods for detecting and characterizing these cracks are often manual, time-consuming, and subject to human error, making it challenging to maintain roads efficiently and effectively. This study advances pavement maintenance by applying deep learning and pixel-level segmentation to improve the detection and characterization (classification and sizing) of pavement cracks, crucial for road infrastructure safety and longevity. The research began with extensive data collection, using a GoPro Hero 8 mounted on a vehicle to gather images of roads in Kuala Lumpur and Selangor, Malaysia. Following detailed preprocessing, including image augmentation, blurring, and light intensity variations, a pavement crack dataset was prepared for analysis. The investigation started with a customized YOLOv7 model, achieving 0.9545 recall and 0.9523 precision on the RDD2022 dataset and 0.9158 recall and 0.93 precision on our custom dataset. When benchmarked against traditional methods, such as ConvNets and deep neural networks, the customized YOLOv7 model demonstrated better precision and recall performance. Subsequent work with the YOLOv8x-seg model resulted in improved precision and recall in crack detection, with performance metrics of 0.93 recall and 0.91 precision for alligator cracks, 0.95 recall and 0.84 precision for longitudinal cracks, and 0.806 recall and 0.89 precision for transverse cracks. In direct benchmarking, this model surpassed previous fusion-based deep convolutional methods in both precision and recall. The final phase involved creating an Advanced Hybrid Deep Learning Model incorporating Deep Gradient ResNet and a Modified Attention mechanism, enhancing crack detection and characterization. This model showed a promising precision of 0.84 for alligator cracks, 0.89 for longitudinal cracks, and 0.87 for transverse cracks, with recall rates of 0.96 for alligator cracks, 0.88 for longitudinal cracks, and 0.80 for transverse cracks. The developed model outperformed the benchmarked research utilizing CrackNet model in both precision and recall. Utilizing advanced segmentation and machine vision techniques, the study successfully demonstrated the capability to precisely size pavement cracks, which is vital for targeted maintenance. The research signifies progress in automated pavement crack analysis, contributing to safer and more durable road infrastructures. | |
dc.description.abstractarabic | تشكل شقوق الرصيف تهديداً كبيراً لسلامة الطرق وسلامة البنية التحتية، وهو ما يؤدي إلى مخاطر محتملة على المركبات، ويستلزم إصلاحات مكلفة. وغالباً ما تكون الطرق التقليدية لاكتشاف هذه الشقوق وتوصيفها يدوية، وتستغرق وقتاً طويلاً، وتكون عرضة للخطأ البشري، وتلك العوامل تجعل من الصعب صيانة الطرق بكفاءة وفعالية. تعمل هذه الدراسة على تحسين عملية صيانة الرصيف من خلال تطبيق التعلم العميق (Deep Learning) والتجزئة على مستوى البكسل (Pixel-Level Segmentation) لتحسين عملية اكتشاف شقوق الرصيف وتوصيفها (التصنيف وتحديد الحجم)، وهو أمر حاسم من أجل سلامة البنية التحتية للطرق واستدامتها. بدأ البحث بجمع بيانات مكثفة، باستخدام كاميرا (GoPro Hero 8) مثبتة على مركبة لجمع صور الطرق في كوالالمبور وسيلانجور، في ماليزيا. وبعد إجراء معالجة مسبقة مفصّلة، شملت تحسين الصورة، وتشويشها، وضبط شدة الإضاءة، تمّ إعداد مجموعة البيانات الخاصة بشقوق الرصيف للتحليل. بدأت الدراسة بنموذج (YOLOv7) مخصص، حيث حقق نسبة استدعاء قدرها 0.9545 ودقة قدرها 0.9523 على مجموعة بيانات (RDD2022)، ونسبة استدعاء قدرها 0.9158 ودقة قدرها 0.93 على مجموعة البيانات المخصصة التي لدينا. وعند مقارنته بالطرق التقليدية، مثل الشبكات العصبية الالتفافية (ConvNets) والشبكات العصبية العميقة (Deep Neural Networks)، أظهر نموذج (YOLOv7) المخصص أداءً أفضل من حيث الدقة والاسترجاع. وأسفر العمل اللاحق مع نموذج (YOLOv8x-seg) عن تحسين الدقة والاستدعاء في اكتشاف الشقوق، بمقاييس أداء بلغت 0.93 للاستدعاء و0.91 للدقة، للشقوق التمساحية، و0.95 للاستدعاء و0. 84 للدقة، للشقوق الطولية، و0.806 للاستدعاء و0.89 للدقة، للشقوق العرضية. وبالمقارنة المباشرة، يتفوق هذا النموذج على الطرق السابقة التي تستخدم الشبكات العصبية الالتفافية العميقة المعتمدة على الدمج، من حيث الدقة والاسترجاع. وتضمنت المرحلة النهائية إنشاء نموذج هجين متقدم للتعلم العميق، يدمج بين الشبكة المتبقية ذات التدرج العميق (Deep Gradient ResNet) وآلية الانتباه المعدل (Modified Attention)، وهو ما أدّى إلى تحسين عملية اكتشاف الشقوق وتوصيفها. وقد أظهر هذا النموذج دقة واعدة بلغت 0.84 للشقوق التمساحية، و0.89 للشقوق الطولية، و0.87 للشقوق العرضية، مع معدلات استرجاع بلغت 0.96 للشقوق التمساحية، و0.88 للشقوق الطولية، و0.80 للشقوق العرضية. وبذلك، يتفوق النموذج المطوّر على البحث المقارن به، والذي يستخدم نموذج (CrackNet)، في كلّ من الدقة والاسترجاع. أثبتت الدراسة أنّ استخدام تقنيات التجزئة المتقدمة (Advanced Segmentation) والرؤية الحاسوبية (Machine Vision)، له القدرة على تحديد حجم شقوق الرصيف بدقة، وهو أمر حيوي لتحقيق الصيانة المستهدفة. كما تشير الدراسة إلى تقدم في التحليل الآلي لشقوق الرصيف، الأمر الذي يسهم في إنشاء بنى تحتية للطرق أكثر أماناً ومتانة | |
dc.description.identifier | Thesis : Pavement crack detection and characterization using deep learning and pixel level segmentation / by Arselan Ashraf | |
dc.description.identity | G2114139Arselanashraf | |
dc.description.kulliyah | Kulliyyah of Engineering | |
dc.description.notes | Thesis (Ph.D)--International Islamic University Malaysia, 2024. | |
dc.description.physicaldescription | 1 online resource (xxi, 198 leaves) ; color illustrations. | |
dc.description.programme | Doctor of Philosophy in Engineering | |
dc.identifier.uri | https://studentrepo.iium.edu.my/handle/123456789/23160 | |
dc.language.iso | en | |
dc.publisher | Kuala Lumpur : Kulliyyah of Engineering, International Islamic University Malaysia, 2024 | |
dc.title | Pavement crack detection and characterization using deep learning and pixel level segmentation | |
dc.type | doctoral thesis | |
dspace.entity.type | Publication | |
oairecerif.author.affiliation | #PLACEHOLDER_PARENT_METADATA_VALUE# |