Publication:
Skyline queries in large-scale and incomplete graphs using machine learning

dc.contributor.authorNoor, Ubair
dc.contributor.supervisorRaini Hassan
dc.contributor.supervisorDini Oktarina Dwi Handayani
dc.date.accessioned2025-11-24T04:06:26Z
dc.date.available2025-11-24T04:06:26Z
dc.date.issued2025
dc.description.abstractSkyline queries are widely used in multi-criteria decision-making to identify non-dominated data points which balance conflicting preferences. While skyline computation has been studied extensively in relational and complete databases, limited attention has been given to skyline query processing in large-scale incomplete graph databases. The challenges include the dynamic and evolving nature of graphs with frequent additions and deletions of nodes, the prevalence of missing attribute values that disrupt dominance relationships and reduce query reliability. These challenges become critical in real-world applications such as recommendation systems, urban planning, fraud detection and location-based services, where incomplete or sparse data is common. Traditional approaches relying on relational-to-graph transformation and heavy preprocessing suffer from inefficiency, sparsity, and poor scalability when applied to high-dimensional graph data. The proposed study introduces an optimized framework for skyline query processing in incomplete graph databases by integrating machine learning techniques, including clustering-based optimization with the K-Means algorithm, dynamic data pruning, and adaptive indexing. The framework reduces computational overhead, handles missing values more effectively, and ensures accurate skyline retrieval under incomplete graph database. Experimental evaluation on synthetic graph datasets, designed to real-world incompleteness, demonstrates the framework's effectiveness. The proposed method achieves a reduction in query processing time of 30-50% and a dataset size reduction of up to 44.44% compared to traditional baseline algorithms. Cluster quality was validated using intrinsic metrics such as the Silhouette Score, ensuring the robustness of the groupings. The proposed solution significantly advances skyline query processing for complex, incomplete graph structures, contributing to more efficient and reliable decision-support systems, recommendation engines, and location-based services.
dc.description.abstractarabicتُستخدم استعلامات الأفق (Skyline) على نطاق واسع في اتخاذ القرارات متعددة المعايير لتحديد النقاط البيانية غير المهيمنة التي توازن بين التفضيلات المتضاربة. في حين تم دراسة حساب الأفق بشكل موسع في قواعد البيانات العلائقية والكاملة، فإن الاهتمام محدود بمعالجة استعلامات الأفق في قواعد بيانات رسومية غير كاملة واسعة النطاق. تشمل التحديات الطبيعة الديناميكية والمتطورة للرسوم البيانية مع إضافة وحذف العقد بشكل متكرر، وانتشار القيم المفقودة في السمات التي تؤثر على علاقات الهيمنة وتقلل من موثوقية الاستعلامات. تصبح هذه التحديات حاسمة في التطبيقات الواقعية مثل أنظمة التوصية، التخطيط الحضري، اكتشاف الاحتيال، والخدمات القائمة على الموقع، حيث يكون من الشائع وجود بيانات غير مكتملة أو متفرقة. تعاني الأساليب التقليدية التي تعتمد على التحويل من العلائقية إلى الرسوم البيانية والمعالجة المبدئية الثقيلة من ضعف الكفاءة والندرة وقلة القابلية للتوسع عند تطبيقها على بيانات بيانية عالية الأبعاد. يقدم هذا البحث إطار عمل محسن لمعالجة استعلامات الأفق في قواعد البيانات البيانية غير المكتملة من خلال دمج تقنيات التعلم الآلي، بما في ذلك التحسين القائم على التجميع باستخدام الخوارزمية التصنيفية K-Mean، والتقليص الديناميكي للبيانات، والفهرسة التكيفية. يعمل الإطار على تقليل العبء الحسابي، والتعامل مع القيم المفقودة بشكل أكثر فعالية، وضمان استرجاع الأفق بدقة في قواعد البيانات البيانية غير المكتملة. أظهرت التقييمات التجريبية على مجموعات بيانات رسومية صناعية، تم تصميمها لتعكس عدم الاكتمال في العالم الحقيقي، فعالية الإطار. وقد حققت الطريقة المقترحة تقليصًا في وقت معالجة الاستعلام بنسبة 30-50٪ وتقليصًا في حجم مجموعة البيانات يصل إلى 44.44٪ مقارنة بالخوارزميات التقليدية. وتم التحقق من جودة التجميع باستخدام مقاييس داخلية مثل درجة الظليّة، مما يضمن قوة التجميعات. يساهم الحل المقترح بشكل كبير في تحسين معالجة استعلامات الأفق للهيكليات البيانية المعقدة وغير المكتملة، مما يساهم في أنظمة دعم القرار الأكثر كفاءة وموثوقية، ومحركات التوصية، والخدمات القائمة على الموقع.
dc.description.callnumberet QA 76.625 N8187S 2025
dc.description.cpsemailcps2u@iium.edu.my
dc.description.identifierThesis : Skyline queries in large-scale and incomplete graphs using machine learning / by Ubair Noor
dc.description.identityG2221587Ubairnoor
dc.description.kulliyahKulliyyah of Information and Communication Technology (KICT)
dc.description.notesThesis (MCST)--International Islamic University Malaysia, 2025.
dc.description.physicaldescription1 online resource (xviii, 153 leaves) ; color illustrations.
dc.description.programmeMaster of Computing in Computer Science and Information Technology
dc.identifier.urihttps://studentrepo.iium.edu.my/handle/123456789/33627
dc.language.isoen
dc.publisherKuala Lumpur : Kulliyyah of Information and Communication Technology, International Islamic University Malaysia, 2025
dc.rightsOWNED BY IIUM
dc.subjectSkyline Query;graph Database;Machine learning
dc.subject.lcshQuerying (Computer science)
dc.subject.lcshDatabase management
dc.titleSkyline queries in large-scale and incomplete graphs using machine learning
dc.typeMaster Theses
dspace.entity.typePublication

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
G2221587Ubairnoor_SEC.pdf
Size:
18.51 MB
Format:
Adobe Portable Document Format
Description:
Full text.