Publication: Skyline queries in large-scale and incomplete graphs using machine learning
| dc.contributor.author | Noor, Ubair | |
| dc.contributor.supervisor | Raini Hassan | |
| dc.contributor.supervisor | Dini Oktarina Dwi Handayani | |
| dc.date.accessioned | 2025-11-24T04:06:26Z | |
| dc.date.available | 2025-11-24T04:06:26Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Skyline queries are widely used in multi-criteria decision-making to identify non-dominated data points which balance conflicting preferences. While skyline computation has been studied extensively in relational and complete databases, limited attention has been given to skyline query processing in large-scale incomplete graph databases. The challenges include the dynamic and evolving nature of graphs with frequent additions and deletions of nodes, the prevalence of missing attribute values that disrupt dominance relationships and reduce query reliability. These challenges become critical in real-world applications such as recommendation systems, urban planning, fraud detection and location-based services, where incomplete or sparse data is common. Traditional approaches relying on relational-to-graph transformation and heavy preprocessing suffer from inefficiency, sparsity, and poor scalability when applied to high-dimensional graph data. The proposed study introduces an optimized framework for skyline query processing in incomplete graph databases by integrating machine learning techniques, including clustering-based optimization with the K-Means algorithm, dynamic data pruning, and adaptive indexing. The framework reduces computational overhead, handles missing values more effectively, and ensures accurate skyline retrieval under incomplete graph database. Experimental evaluation on synthetic graph datasets, designed to real-world incompleteness, demonstrates the framework's effectiveness. The proposed method achieves a reduction in query processing time of 30-50% and a dataset size reduction of up to 44.44% compared to traditional baseline algorithms. Cluster quality was validated using intrinsic metrics such as the Silhouette Score, ensuring the robustness of the groupings. The proposed solution significantly advances skyline query processing for complex, incomplete graph structures, contributing to more efficient and reliable decision-support systems, recommendation engines, and location-based services. | |
| dc.description.abstractarabic | تُستخدم استعلامات الأفق (Skyline) على نطاق واسع في اتخاذ القرارات متعددة المعايير لتحديد النقاط البيانية غير المهيمنة التي توازن بين التفضيلات المتضاربة. في حين تم دراسة حساب الأفق بشكل موسع في قواعد البيانات العلائقية والكاملة، فإن الاهتمام محدود بمعالجة استعلامات الأفق في قواعد بيانات رسومية غير كاملة واسعة النطاق. تشمل التحديات الطبيعة الديناميكية والمتطورة للرسوم البيانية مع إضافة وحذف العقد بشكل متكرر، وانتشار القيم المفقودة في السمات التي تؤثر على علاقات الهيمنة وتقلل من موثوقية الاستعلامات. تصبح هذه التحديات حاسمة في التطبيقات الواقعية مثل أنظمة التوصية، التخطيط الحضري، اكتشاف الاحتيال، والخدمات القائمة على الموقع، حيث يكون من الشائع وجود بيانات غير مكتملة أو متفرقة. تعاني الأساليب التقليدية التي تعتمد على التحويل من العلائقية إلى الرسوم البيانية والمعالجة المبدئية الثقيلة من ضعف الكفاءة والندرة وقلة القابلية للتوسع عند تطبيقها على بيانات بيانية عالية الأبعاد. يقدم هذا البحث إطار عمل محسن لمعالجة استعلامات الأفق في قواعد البيانات البيانية غير المكتملة من خلال دمج تقنيات التعلم الآلي، بما في ذلك التحسين القائم على التجميع باستخدام الخوارزمية التصنيفية K-Mean، والتقليص الديناميكي للبيانات، والفهرسة التكيفية. يعمل الإطار على تقليل العبء الحسابي، والتعامل مع القيم المفقودة بشكل أكثر فعالية، وضمان استرجاع الأفق بدقة في قواعد البيانات البيانية غير المكتملة. أظهرت التقييمات التجريبية على مجموعات بيانات رسومية صناعية، تم تصميمها لتعكس عدم الاكتمال في العالم الحقيقي، فعالية الإطار. وقد حققت الطريقة المقترحة تقليصًا في وقت معالجة الاستعلام بنسبة 30-50٪ وتقليصًا في حجم مجموعة البيانات يصل إلى 44.44٪ مقارنة بالخوارزميات التقليدية. وتم التحقق من جودة التجميع باستخدام مقاييس داخلية مثل درجة الظليّة، مما يضمن قوة التجميعات. يساهم الحل المقترح بشكل كبير في تحسين معالجة استعلامات الأفق للهيكليات البيانية المعقدة وغير المكتملة، مما يساهم في أنظمة دعم القرار الأكثر كفاءة وموثوقية، ومحركات التوصية، والخدمات القائمة على الموقع. | |
| dc.description.callnumber | et QA 76.625 N8187S 2025 | |
| dc.description.cpsemail | cps2u@iium.edu.my | |
| dc.description.identifier | Thesis : Skyline queries in large-scale and incomplete graphs using machine learning / by Ubair Noor | |
| dc.description.identity | G2221587Ubairnoor | |
| dc.description.kulliyah | Kulliyyah of Information and Communication Technology (KICT) | |
| dc.description.notes | Thesis (MCST)--International Islamic University Malaysia, 2025. | |
| dc.description.physicaldescription | 1 online resource (xviii, 153 leaves) ; color illustrations. | |
| dc.description.programme | Master of Computing in Computer Science and Information Technology | |
| dc.identifier.uri | https://studentrepo.iium.edu.my/handle/123456789/33627 | |
| dc.language.iso | en | |
| dc.publisher | Kuala Lumpur : Kulliyyah of Information and Communication Technology, International Islamic University Malaysia, 2025 | |
| dc.rights | OWNED BY IIUM | |
| dc.subject | Skyline Query;graph Database;Machine learning | |
| dc.subject.lcsh | Querying (Computer science) | |
| dc.subject.lcsh | Database management | |
| dc.title | Skyline queries in large-scale and incomplete graphs using machine learning | |
| dc.type | Master Theses | |
| dspace.entity.type | Publication |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- G2221587Ubairnoor_SEC.pdf
- Size:
- 18.51 MB
- Format:
- Adobe Portable Document Format
- Description:
- Full text.
