Publication:
A semantic segmentation approach to river sediment identification

dc.contributor.affiliation#PLACEHOLDER_PARENT_METADATA_VALUE#en_US
dc.contributor.authorAhmad Zaky Iswanien_US
dc.contributor.supervisorYasir Mohd. Mustafah, Ph.Den_US
dc.contributor.supervisorAzhar Mohd Ibrahim, Ph.Den_US
dc.date.accessioned2024-10-08T03:19:20Z
dc.date.available2024-10-08T03:19:20Z
dc.date.issued2023
dc.description.abstractSoil erosion is an ecological hazard that, if left unchecked, poses wider threats to the environment. These threats range from inconveniences such as the ruining of landscapes and the reduction of water quality to hazards such as floods and landslides. This thereby necessitates a method to monitor soil erosion, one of which is by monitoring the formation of river sediments. Computer vision techniques have matured in recent years and have been used in many different fields of applications. One form of computer vision technique is called "semantic segmentation," which is a technique that seeks to associate every pixel of an image with its own object class. This presented an opportunity where images of river sedimentation could be analysed and identified accurately to the pixel. In examining further the use of semantic segmentation for river sedimentation purposes, this project looked at three publicly available network architectures: Unet, Linknet, and Feature Pyramid Network (FPN). All these three networks belong to a type of architecture called fully convolutional networks. Three prediction models, one from each architecture, were trained and tested against 100 images of various river sediment formations along the course of the IIUM river. The images are divided into 75 images for training and 25 images for validation. Meanwhile, the model is assessed both quantitatively by Intesection over Union (IoU), and label predictions assessed qualitatively. After training, the sediment IoU scores obtained were as follows: 0.83446103 for Unet, 0.8188789 for Linknet, and 0.20392573 for FPN. The qualitative results outputted however were mixed: the architectures are able to perform somewhat well in identifying sedimentation when the formation of those sediments is uniform, with Unet performing the best, followed by Linknet and then FPN. However, all the architectures struggled in identifying the sediment when non-uniform sedimentation formations are present. One recommendation proposed is to add object classes to reduce intraclass differences and hopefully reduce class confusion by the prediction models. Another recommendation is to develop novel architectures that are able to accommodate intraclass differences while still producing accurate sediment identification.en_US
dc.description.abstractarabicيعدّ تآكل التربة خطراً بيئياً، بحيث إذا ترك دون معالجة فإنه يشكل تهديدات أوسع للبيئة. وتمتدّ هذه التهديدات من مظاهر مزعجة، مثل تدمير المناظر الطبيعية وتقليل جودة المياه، إلى مخاطر أكبر مثل الفيضانات والانهيارات الأرضية. ممّا يتطلب بالتالي استخدام طريقة لرصد تآكل التربة، ومن ذلك مراقبة تكوين الرواسب النهرية. لقد نضجت تقنيات الرؤية الحاسوبية في السنوات الأخيرة وتم استخدامها في العديد من المجالات المختلفة للتطبيقات. يُطلق على أحد أشكال تقنية الرؤية الحاسوبية اسم "التجزئة الدلالية"، وهي تقنية تسعى إلى ربط كل بكسل في الصورة بفئة الكائن الخاصة بها. وقد أتاح هذا فرصة حيث يمكن تحليل صور الرواسب النهرية وتحديدها بدقة على مستوى البكسل. وعند إجراء مزيد من الدراسة لاستخدام التجزئة الدلالية لأغراض الرواسب النهرية، نظر هذا المشروع في ثلاثة تصاميم للشبكات متاحة للجمهور: (Unet) و (Linknet) وشبكة هرم الخصائص (FPN). تنتمي جميع هذه الشبكات الثلاث إلى نوع من التصميم يسمى الشبكات كاملة الالتفاف. تم تدريب واختبار ثلاثة نماذج تنبؤ، واحد من كل تصميم، باستخدام 100 صورة للتشكيلات المختلفة للرواسب النهرية على طول مجرى نهر (IIUM). حيث تم تقسيم الصور إلى 75 صورة للتدريب و25 صورة للتحقق. وفي الوقت نفسه، تم تقييم النموذج كمياً عن طريق التداخل عبر الاتحاد (IoU)، وتقييم تنبؤات التسميات نوعياً. بعد التدريب، تم الحصول على درجات (IoU) للرواسب على النحو الآتي: 0.83446103 لـ (Unet)، و 0.8188789 لـ (Linknet)، و 0.20392573 لـ (FPN). ومع ذلك، كانت النتائج النوعية التي تم الحصول عليها مختلطة؛ فقد كانت التصاميم قادرة على تقديم أداء جيد إلى حد ما في تحديد الترسيب عندما يكون تشكيل تلك الرواسب موحداً، حيث كان أداء (Unet) هو الأفضل، يليه (Linknet) ثم (FPN). ومع ذلك، فقد واجهت جميع التصاميم صعوبة في تحديد الرواسب عند وجود تشكيلات ترسيبية غير منتظمة. إحدى التوصيات المقترحة هي إضافة فئات الكائنات لتقليل الاختلافات داخل الفئة أملاً في تقليل ارتباك نماذج التنبؤ في تحديد الفئة. وهناك توصية أخرى، تتمثل في تطوير تصاميم جديدة قادرة على استيعاب الاختلافات داخل الفئة مع القدرة على التحديد الدقيق للرواسب.en_US
dc.description.callnumberet TA 1638.4 A2865S 2023
dc.description.cpsemailcps2u@iium.edu.myen_US
dc.description.degreelevelMaster
dc.description.emailaz4ky@yahoo.comen_US
dc.description.identifierThesis : A semantic segmentation approach to river sediment identification / by Ahmad Zaky Iswanien_US
dc.description.identityG2013273AhmadZakyIswanien_US
dc.description.kulliyahKulliyyah of Engineeringen_US
dc.description.nationalityINDONESIAen_US
dc.description.notesThesis (MSME)--International Islamic University Malaysia, 2023.en_US
dc.description.physicaldescription1 online resource (xv, 77 leaves) ; color illustrations.en_US
dc.description.programmeMaster of Science in Mechatronics Engineeringen_US
dc.identifier.urihttps://studentrepo.iium.edu.my/handle/123456789/7189
dc.language.isoenen_US
dc.publisherKuala Lumpur : Kulliyyah of Engineering, International Islamic University Malaysia, 2023en_US
dc.rightsOWNED BY STUDENT
dc.subject.lcshImage segmentation
dc.subject.lcshRiver sediments
dc.titleA semantic segmentation approach to river sediment identificationen_US
dc.typeMaster Thesisen_US
dspace.entity.typePublication

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
G2013273AhmadZakyIswani_24.pdf
Size:
3.1 MB
Format:
Adobe Portable Document Format
Description:
24 pages file
Loading...
Thumbnail Image
Name:
G2013273AhmadZakyIswani_SEC.pdf
Size:
11.96 MB
Format:
Adobe Portable Document Format
Description:
Full text secured file

Collections