Publication: Generative cognitive behavioral therapy with spoken dialog systems’ support
dc.contributor.affiliation | #PLACEHOLDER_PARENT_METADATA_VALUE# | en_US |
dc.contributor.author | Khalaf, Ayesheh Ahrari | en_US |
dc.contributor.supervisor | Aisha Hassan Abdalla Hashim, Ph.D | en_US |
dc.contributor.supervisor | Rashidah Funke Olanrewaju, Ph.D | en_US |
dc.contributor.supervisor | Akeem Olowolayemo, Ph.D | en_US |
dc.date.accessioned | 2024-10-08T03:19:01Z | |
dc.date.available | 2024-10-08T03:19:01Z | |
dc.date.issued | 2023 | |
dc.description.abstract | One of the objectives and aspirations of scientists and engineers ever since the development of computers has been to interact naturally with machines. Hence features of artificial intelligence (AI) like natural language processing and natural language generation were developed. The field of AI that is thought to be expanding the fastest is interactive conversational systems. Numerous businesses have created various Virtual Personal Assistants (VPAs) using these technologies, including Apple's Siri, Amazon's Alexa, and Google Assistant, among others. While an ongoing effort to increase the friendliness and constancy of informal dialogue systems, most research focuses solely on simulating human-like replies, leaving the features of modeling interlocutors' awareness are unexplored. Meanwhile, cognitive science research reveals that awareness is a crucial indicator of a high-quality informal conversation. To precisely model understanding, Persona Perception (P2) Bot was developed using a transmitter-receiver-based structure. P2 Bot leverages mutual persona perception to improve the quality of customized dialogue generation. Even though many chatbots have been introduced through the years to diagnose or treat psychological disorders, we are yet to have a user-friendly chatbot available. This research aims on improving the quality of conversation generation by implementing the Generative Pre-trained Transformer-2 (GPT-2) model on P2 Bot. GPT-2 is a 1.5B parameter transformer model which produces state-of-the-art accuracy in a zero-shot setting on 7 out of 8 evaluated language modeling datasets. Observations on a large open-source dataset, PERSONA-CHAT, show that the technique is successful, with some improvement above state-of-the-art baselines in both automatic measures and human assessments. The model has achieved 82.2% accuracy on Hits@1(%) in the original data and 68.8% on the revised data. On the human evaluation, the model scored an average of 2.66 meaning the provided responses were coherent and informative. A smart generative cognitive behavioral therapy with spoken dialogue systems support was then developed using the model, which was then implemented using modern technologies in VPAs like voice recognition, Natural Language Understanding (NLU), and text-to-speech. This system is a magnificent device to help with voice-based systems because it can have therapeutic discussions with the users utilizing text and vocal interactive user experience. | en_US |
dc.description.abstractarabic | منذ اختراع أجهزة الكمبيوتر، كان أحد أكبر أهداف الباحثين والمهندسين هو إجراء حوار طبيعي مع الآلات الألكترونية. لذلك، أدخل الذكاء الاصطناعي (AI) معالجة اللغة الطبيعية وتوليد اللغة الطبيعية التي تهتم بأنظمة المحادثة التفاعلية باعتبارها المنطقة الأسرع نموًا في الذكاء الاصطناعي. استخدمت العديد من الشركات هذه التقنيات لإنشاء أنواع مختلفة من المساعدين الشخصيين الافتراضيين (VPAs) مثل Google Assistant و Alexa من Amazon و Apple's Siri وغيرها. بينما يُبذل جهد مستمر لزيادة متعة وثبات أنظمة الحوار غير الرسمي، تركز معظم الأبحاث فقط على محاكاة الردود الشبيهة بالبشر، تاركةً سمات نماذج وعي المحاورين غير مستكشفة. في اثناء ذلك، يكشف البحث العلمي المعرفي أن الوعي مؤشر حاسم للمحادثات غير الرسمية عالية الجودة. لنمذجة الفهم بدقة، تم تطوير روبوتPersona Perception (P2) باستخدام بنية قائمة على جهاز الإرسال والاستقبال. يستفيد P2 Bot من الإدراك الشخصي المتبادل لتحسين جودة إنشاء الحوار المخصص. على الرغم من أن العديد من روبوتات المحادثة قد تم تقديمها على مر السنين لتشخيص الاضطرابات النفسية أو علاجها ، إلا أنه لا يوجد روبوت محادثة سهل الاستخدام. يهدف هذا البحث إلى تحسين جودة توليد المحادثة من خلال تطبيق نموذج GPT-2 على P2 Bot. نموذج GPT-2 هو نموذج محول معامل 1.5B ينتج دقة متطورة حسب التقييم للتعلم من الصفر في 7 من أصل 8 مجموعة بيانات لنمذجة اللغة. تُظهر الملاحظات على مجموعة بيانات كبيرة مفتوحة المصدرPERSONA-CHAT أن التقنية ناجحة، مع بعض التحسينات مقارنة بأحدث طراز للخطوط الأساسية في كل من المقاييس التلقائية والتقييمات البشرية. حقق النموذج دقة 82.2٪ بزيادة 1% عن البيانات الأصلية و 68.8٪ على البيانات المنقحة. وفي التقييم البشري، سجل النموذج متوسط 2.66 مما يعني أن الردود المقدمة كانت متماسكة وغنية بالمعلومات. بعد ذلك، تم تنفيذ النموذج باستخدام تقنيات حديثة في VPAs، مثل التعرف على الصوت وفهم اللغة الطبيعية (NLU) وخوارزمية تحويل النص إلى كلام مع تصنيف الحالة العقلية (MSC) لتطوير معالجة السلوك الإدراكي الذكي الذي يدعم أنظمة الحوار المنطوقة. يمكن لهذا النموذج إجراء محادثات علاجية مع المستخدمين باستخدام واجهة مستخدم للمحادثة النصية والصوتية، مما يجعله نظامًا علاجيًا مميزاً مدعوم بأنظمة استجابة صوتية تفاعلية. | en_US |
dc.description.callnumber | et TK 7895 S65 K451G 2023 | |
dc.description.cpsemail | cps2u@iium.edu.my | en_US |
dc.description.degreelevel | Master | |
dc.description.email | ahrari.ayesheh@live.iium.edu.my | en_US |
dc.description.identifier | Thesis : Generative cognitive behavioral therapy with spoken dialog systems’ support / by Ayesheh Ahrari Khalaf | en_US |
dc.description.identity | G1920382AyeshehAhrariKhalaf | en_US |
dc.description.kulliyah | Kulliyyah of Engineering | en_US |
dc.description.nationality | IRAN | en_US |
dc.description.notes | Thesis (MSCE)--International Islamic University Malaysia, 2023. | en_US |
dc.description.physicaldescription | 1 online resource (xviii, 93 leaves) ; color illustrations. | en_US |
dc.description.programme | Master of Science in Engineering | en_US |
dc.identifier.uri | https://studentrepo.iium.edu.my/handle/123456789/7171 | |
dc.language.iso | en | en_US |
dc.publisher | Kuala Lumpur : Kulliyyah of Engineering, International Islamic University Malaysia, 2023 | en_US |
dc.rights | OWNED BY STUDENT | |
dc.subject.lcsh | Automatic speech recognition -- Data processing | |
dc.subject.lcsh | Psychotherapy -- Data processing | |
dc.subject.lcsh | User interfaces (Computer systems) | |
dc.title | Generative cognitive behavioral therapy with spoken dialog systems’ support | en_US |
dc.type | Master Thesis | en_US |
dspace.entity.type | Publication |