Publication: A semantic segmentation approach to river sediment identification
dc.contributor.affiliation | #PLACEHOLDER_PARENT_METADATA_VALUE# | en_US |
dc.contributor.author | Ahmad Zaky Iswani | en_US |
dc.contributor.supervisor | Yasir Mohd. Mustafah, Ph.D | en_US |
dc.contributor.supervisor | Azhar Mohd Ibrahim, Ph.D | en_US |
dc.date.accessioned | 2024-10-08T03:19:20Z | |
dc.date.available | 2024-10-08T03:19:20Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Soil erosion is an ecological hazard that, if left unchecked, poses wider threats to the environment. These threats range from inconveniences such as the ruining of landscapes and the reduction of water quality to hazards such as floods and landslides. This thereby necessitates a method to monitor soil erosion, one of which is by monitoring the formation of river sediments. Computer vision techniques have matured in recent years and have been used in many different fields of applications. One form of computer vision technique is called "semantic segmentation," which is a technique that seeks to associate every pixel of an image with its own object class. This presented an opportunity where images of river sedimentation could be analysed and identified accurately to the pixel. In examining further the use of semantic segmentation for river sedimentation purposes, this project looked at three publicly available network architectures: Unet, Linknet, and Feature Pyramid Network (FPN). All these three networks belong to a type of architecture called fully convolutional networks. Three prediction models, one from each architecture, were trained and tested against 100 images of various river sediment formations along the course of the IIUM river. The images are divided into 75 images for training and 25 images for validation. Meanwhile, the model is assessed both quantitatively by Intesection over Union (IoU), and label predictions assessed qualitatively. After training, the sediment IoU scores obtained were as follows: 0.83446103 for Unet, 0.8188789 for Linknet, and 0.20392573 for FPN. The qualitative results outputted however were mixed: the architectures are able to perform somewhat well in identifying sedimentation when the formation of those sediments is uniform, with Unet performing the best, followed by Linknet and then FPN. However, all the architectures struggled in identifying the sediment when non-uniform sedimentation formations are present. One recommendation proposed is to add object classes to reduce intraclass differences and hopefully reduce class confusion by the prediction models. Another recommendation is to develop novel architectures that are able to accommodate intraclass differences while still producing accurate sediment identification. | en_US |
dc.description.abstractarabic | يعدّ تآكل التربة خطراً بيئياً، بحيث إذا ترك دون معالجة فإنه يشكل تهديدات أوسع للبيئة. وتمتدّ هذه التهديدات من مظاهر مزعجة، مثل تدمير المناظر الطبيعية وتقليل جودة المياه، إلى مخاطر أكبر مثل الفيضانات والانهيارات الأرضية. ممّا يتطلب بالتالي استخدام طريقة لرصد تآكل التربة، ومن ذلك مراقبة تكوين الرواسب النهرية. لقد نضجت تقنيات الرؤية الحاسوبية في السنوات الأخيرة وتم استخدامها في العديد من المجالات المختلفة للتطبيقات. يُطلق على أحد أشكال تقنية الرؤية الحاسوبية اسم "التجزئة الدلالية"، وهي تقنية تسعى إلى ربط كل بكسل في الصورة بفئة الكائن الخاصة بها. وقد أتاح هذا فرصة حيث يمكن تحليل صور الرواسب النهرية وتحديدها بدقة على مستوى البكسل. وعند إجراء مزيد من الدراسة لاستخدام التجزئة الدلالية لأغراض الرواسب النهرية، نظر هذا المشروع في ثلاثة تصاميم للشبكات متاحة للجمهور: (Unet) و (Linknet) وشبكة هرم الخصائص (FPN). تنتمي جميع هذه الشبكات الثلاث إلى نوع من التصميم يسمى الشبكات كاملة الالتفاف. تم تدريب واختبار ثلاثة نماذج تنبؤ، واحد من كل تصميم، باستخدام 100 صورة للتشكيلات المختلفة للرواسب النهرية على طول مجرى نهر (IIUM). حيث تم تقسيم الصور إلى 75 صورة للتدريب و25 صورة للتحقق. وفي الوقت نفسه، تم تقييم النموذج كمياً عن طريق التداخل عبر الاتحاد (IoU)، وتقييم تنبؤات التسميات نوعياً. بعد التدريب، تم الحصول على درجات (IoU) للرواسب على النحو الآتي: 0.83446103 لـ (Unet)، و 0.8188789 لـ (Linknet)، و 0.20392573 لـ (FPN). ومع ذلك، كانت النتائج النوعية التي تم الحصول عليها مختلطة؛ فقد كانت التصاميم قادرة على تقديم أداء جيد إلى حد ما في تحديد الترسيب عندما يكون تشكيل تلك الرواسب موحداً، حيث كان أداء (Unet) هو الأفضل، يليه (Linknet) ثم (FPN). ومع ذلك، فقد واجهت جميع التصاميم صعوبة في تحديد الرواسب عند وجود تشكيلات ترسيبية غير منتظمة. إحدى التوصيات المقترحة هي إضافة فئات الكائنات لتقليل الاختلافات داخل الفئة أملاً في تقليل ارتباك نماذج التنبؤ في تحديد الفئة. وهناك توصية أخرى، تتمثل في تطوير تصاميم جديدة قادرة على استيعاب الاختلافات داخل الفئة مع القدرة على التحديد الدقيق للرواسب. | en_US |
dc.description.callnumber | et TA 1638.4 A2865S 2023 | |
dc.description.cpsemail | cps2u@iium.edu.my | en_US |
dc.description.degreelevel | Master | |
dc.description.email | az4ky@yahoo.com | en_US |
dc.description.identifier | Thesis : A semantic segmentation approach to river sediment identification / by Ahmad Zaky Iswani | en_US |
dc.description.identity | G2013273AhmadZakyIswani | en_US |
dc.description.kulliyah | Kulliyyah of Engineering | en_US |
dc.description.nationality | INDONESIA | en_US |
dc.description.notes | Thesis (MSME)--International Islamic University Malaysia, 2023. | en_US |
dc.description.physicaldescription | 1 online resource (xv, 77 leaves) ; color illustrations. | en_US |
dc.description.programme | Master of Science in Mechatronics Engineering | en_US |
dc.identifier.uri | https://studentrepo.iium.edu.my/handle/123456789/7189 | |
dc.language.iso | en | en_US |
dc.publisher | Kuala Lumpur : Kulliyyah of Engineering, International Islamic University Malaysia, 2023 | en_US |
dc.rights | OWNED BY STUDENT | |
dc.subject.lcsh | Image segmentation | |
dc.subject.lcsh | River sediments | |
dc.title | A semantic segmentation approach to river sediment identification | en_US |
dc.type | Master Thesis | en_US |
dspace.entity.type | Publication |