Publication:
Stress classification based on speech features via convolutional neural networks

cris.virtual.department#PLACEHOLDER_PARENT_METADATA_VALUE#
cris.virtual.orcid#PLACEHOLDER_PARENT_METADATA_VALUE#
cris.virtualsource.departmentddc28746-601f-4519-a3e0-52286ed565ec
cris.virtualsource.orcidddc28746-601f-4519-a3e0-52286ed565ec
dc.contributor.authorNur Aishah Zainal
dc.contributor.supervisorAni Liza Asnawi, Ph.D
dc.contributor.supervisorAhmad Zamani Jusoh, Ph.D
dc.contributor.supervisorSiti Noorjannah Ibrahim, Ph.D
dc.date.accessioned2024-11-29T06:19:39Z
dc.date.available2024-11-29T06:19:39Z
dc.date.issued2024
dc.description.abstractA vast investigation has deduced the drawbacks of stress that have caused an impact on society. The observed adverse consequences have been found to contribute to a negative quality of life for individuals. If prolonged without seeking help, it results in severe physical and mental health problems such as post-traumatic stress disorder (PTSD), depression, stroke, insomnia, and others. The present way of detecting stress using the bio-signals method is considered an invasive and ineffective method of detecting patient stress. The local newspaper also reports on the rise in this issue, citing an increase in Malaysian suicide attempts as a result of various issues like the financial crisis, unemployment, and environmental issues. The Malaysian Ministry of Health (KKM) reported that 91.2% of over one hundred thousand inquiries to the psychosocial helpline required emotional support and counselling more than other help. As seen in previous studies, stress speech features provide better accuracy compared to stress images or video-based features. It is also more convenient since it is a non-invasive and contactless approach. It will not generate any unnecessary stress when measuring it since the patients are not required to wear any equipment during the stress measurement. This research study used speech features as the input data to classify stress into three levels (low stress, medium stress, and high stress). The use of three levels of stress classes assists health practitioners in properly producing a suitable remedy for patients. Mel-frequency cepstral coefficients (MFCCs) and Teager Energy Operator-MFCCs (TEO-MFCCs), which are made by combining MFCCs and TEO, are compared in this study. The classification is done using convolutional neural networks (CNN), a deep learning approach. The dataset was taken from an experimental study that was conducted on 50 students in tertiary education. This study’s combination of MFCCs and CNN has produced exceptional performance metrics with an overall accuracy of 95.67%, which beat the previous research that used an unscripted dataset (an experimental study) with 81.86%. Furthermore, our study demonstrated the highest performance outcomes, achieving 99.58% accuracy when utilizing the same proposed system in a scripted dataset. The contribution of this study includes: discovering suitable speech features to detect the presence of stress in speech; designing deep learning algorithms that offer higher accuracy in stress predictions; designing the stress experiment that can elicit the participants’ stress; and lastly, the unscripted dataset consisting of the speech produced by the participants during the stress experiment. Finally, it contributes to the current research field, and in further development, it will be an early stress detection tool using voice that will assist responsible parties in taking prompt action to provide further care to patients.
dc.description.abstractarabicتوصلت الدراسات الحديثة إلى أن مساوئ الضغط النفسي ذات تأثير على المجتمع بشكل كبير، كما أثبتت أن هذه الظاهرة تؤثر تأثيرا سلبيا على نوعية حياة الفرد. وإذا ما استمرت هذه القضية دون البحث عن الوسائل لعلاجها، فإنها ستؤدي إلى مشاكل جسدية وعقلية خطيرة كاضطراب ما بعد الصدمة (PTSD)، والاكتئاب، والسكتة الدماغية، والأرق وغيرها. إن الطريقة الحالية للكشف عن الضغط والتوتر باستعمال طريقة الإشارات الحيوية هي طريقة مجتاحة وغير فعّالة للكشف عن إجهاد المريض. وتحدثت الصحف المحلية عن ارتفاع هذه القضية في الآونة الأخيرة، دالةً على زيادة محاولات الانتحار في ماليزيا إثرَ قضايا متنوعة، مثل الأزمات المالية، والبطالة، والقضايا البيئية. وأفادت وزارة الصحة الماليزية(KKM) بأن 91.2% من أكثر من مائة ألف استفسار لخط المساعدة النفسية والاجتماعية احتاجت دعمًا عاطفيًّا واستشارة، أكثر من أي مساعدة أخرى. ولو نقارن سمات الكلام الضغطي بصور الضغط أو المعالم المستندة إلى الفيديو فإنها توفر دقة أفضل، بالإضافة إلى أنها أكثر ملاءمة لأنها طريقة غير جراحية وغير تلامسية، حسب ما أشارت إليه الدراسات السابقة. ومن ناحية أخرى، فإنها لا تنتج أي ضغط غير ضروري عند قياسه، حيث لا يطلب من المرضى ارتداء أي معدات أثناء قياس الضغط. ويوظف هذا البحث الحالي سمات الكلام كبيانات مدخلة لتصنيف الضغط إلى ثلاثة مستويات، وهي: (الضغط المنخفض، والضغط المتوسط، والضغط العالي). إن استخدام هذه المستويات الثلاثة للضغط يساعد الممارسين الصحيين في إنتاج علاج مناسب للمرضى بطريقة صحيحة. وتقارن هذه الدراسة MFCCs (المعاملاتِ الرأسية ذات التردد الميلي) بـِ TEO-MFCCs (مشغل الطاقة تيجر)، والتي يتم إجراؤها عن طريق الدمج بينMFCCs وبين TEO. ويتم التصنيف باستخدام الشبكات العصبية الالتفافية (CNN)، وهو مدخل التعلم العميق. واختيرت مجموعة البيانات من دراسة تجريبية أجريت على 50 طالبًا في مرحلة التعليم العالي. وأدى الجمع بين MFCCs وبين CNN إلى إنتاج مقاييس أداء استثنائية بدقة إجمالية قدرها 95.67% والتي تجاوزت الدراسات السابقة التي توظف مجموعة بيانات غير مكتوبة (دراسة تجريبية) بنسبة 81.86%. ويضاف إلى ما سبق، دلت الدراسة الحالية على أعلى نتائج الأداء، حيث حققت دقة تصل إلى 99.58% عند توظيف نفس النظام المقترح في مجموعة بيانات مكتوبة. كما توصلت هذه الدراسة إلى هذه النتائج، أهمها: اكتشاف سمات الكلام المناسبة للكشف عن وجود الضغط في الكلام؛ وتصميم خوارزمية التعلم العميق التي توفر دقة أعلى في تنبؤات الضغط؛ وتصميم تجربة الضغط التي يمكن أن تثير ضغط المشاركين؛ ومجموعة البيانات غير المكتوبة التي تتضمن الكلام الذي أنتجه المشاركون أثناء تجربة الضغط. وختامًا، تساهم هذه الدراسة في تطوير مجال البحث الحالي، وستكون لاحقًا أداة للكشف المبكر عن الضغط باستعمال الصوت، مما يساعد الجهات المسؤولة في اتخاذ إجراءات سريعة لتوفير المزيد من الرعاية للمرضى.
dc.description.callnumberet TK 7882 S65 N974S 2024
dc.description.identifierThesis : Stress classification based on speech features via convolutional neural networks / by Nur Aishah binti Zainal
dc.description.identityG2126974Nuraishahzainal
dc.description.kulliyahKulliyyah of Engineering
dc.description.notesThesis (MSCE)--International Islamic University Malaysia, 2024.
dc.description.physicaldescription1 online resource (xxii, 225 leaves) ; color illustrations.
dc.description.programmeMaster of Science in Engineering
dc.identifier.urihttps://studentrepo.iium.edu.my/handle/123456789/23149
dc.language.isoen
dc.publisherKuala Lumpur : Kulliyyah of Engineering, International Islamic University Malaysia, 2024
dc.subject.lcshSpeech processing systems
dc.subject.lcshVoice -- Psychological stress analysis
dc.titleStress classification based on speech features via convolutional neural networks
dc.typemaster thesis
dspace.entity.typePublication
oairecerif.author.affiliation#PLACEHOLDER_PARENT_METADATA_VALUE#

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
G2126974Nuraishahzainal_SEC.pdf
Size:
34.7 MB
Format:
Adobe Portable Document Format
Description:
Full text

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description:

Collections