تشخیص چهره افراد دارای ماسک با استفاده از MediaPipe Facemesh و الگوریتم های یادگیری عمیق

حسابی مقدم, منصور; غفاری, حمیدرضا; خزائی پور, مهدی

doi:10.30508/kdip.2024.452512.1101

تشخیص چهره افراد دارای ماسک با استفاده از MediaPipe Facemesh و الگوریتم های یادگیری عمیق

نوع مقاله : مقاله پژوهشی

نویسندگان

منصور حسابی مقدم ¹

حمیدرضا غفاری ²

مهدی خزائی پور ¹

¹ گروه مهندسی کامپیوتر، واحد بیرجند، دانشگاه آزاد اسلامی، بیرجند، ایران

² گروه فنی و مهندسی- دانشکده برق و کامپیوتر- دانشگاه آزاد اسلامی واحد فردوس-ایران

10.30508/kdip.2024.452512.1101

چکیده

در پاسخ به نیاز اساسی به تشخیص دقیق چهره‌های متنقبضی که ماسک می‌پوشند، این مقاله یک رویکرد نوآورانه ارائه می‌دهد که از روش‌های عمیق یادگیری دو مرحله‌ای موازی به همراه الگوریتم‌های متا-هیوریستیک هیبریدی بهره می‌برد. چالش‌های مرتبط با تشخیص افرادی که ماسک می‌پوشند، از طریق یک چارچوب جامع آدرس داده می‌شوند که از فناوری‌های روز و ورودی‌های متنوع بهره می‌برد. این روش شامل یک استراتژی الگوریتمی موازی است، که تشخیص چهره‌ها با و بدون ماسک به منظور دقت بهینه‌سازی می‌شود. هنگام شناسایی چهره‌های بدون ماسک، الگوریتم خاصی استفاده می‌شود، در حالی که تشخیص چهره‌های با ماسک از یک الگوریتم جداگانه استفاده می‌کند. علاوه بر این، یک ادغام منابع داده متعدد شامل تصاویر چهره با ماسک و ورودی‌های سنسورهای دما، دقت تشخیص را افزایش می‌دهد. مرکز اصلی این تحقیق در خوشه‌بندی داده‌ها واقع شده است، جایی که مجموعه‌داده‌ها بر اساس حجم آنها سازماندهی می‌شوند، سپس با استفاده از یک شبکه عصبی پیچشی پیشنهادی، دسته‌بندی انجام می‌شود. ویژگی‌های تکراری از هر خوشه با دقت حذف می‌شوند و پردازش موازی پسین توسط الگوریتم‌های متمایز انجام می‌شود. در این مطالعه، دو الگوریتم ترکیبی معرفی شده‌اند و با افزایش حجم داده، می‌توان الگوریتم‌های اضافی را به‌سادگی درج کرد تا قابلیت مقیاس‌پذیری و افزایش دقت را فراهم کنند. این رویکرد نوآورانه توانایی بهبود قابل توجه دقت و کارآیی سیستم‌های تشخیص چهره‌های متنقبضی را به نمایش می‌گذارد و نیاز مهمی در حوزه‌های امنیت تا به سلامت عمومی و فراتر از آن را برطرف می‌کند. همچنین با پیشرفت فناوری و پیشرفت تحقیقات در این حوزه، امکان بهبود دقت تشخیص چهره‌های متنقبضی هنوز امیدوارکننده است.

کلیدواژه‌ها

تشخیص چهره

ماسک

MediaPipe

یادگیری عمیق

1. Avazov, K., Abdusalomov, A., Mukhiddinov, M., Baratov, N., Makhmudov, F., & Cho, Y. I. (2022). An improvement for the automatic classification method for ultrasound images used on CNN. International Journal of Wavelets, Multiresolution and Information Processing, 20(02), 2150054.

2. Canal, F. Z., Müller, T. R., Matias, J. C., Scotton, G. G., de Sa Junior, A. R., Pozzebon, E., & Sobieranski, A. C. (2022). A survey on facial emotion recognition techniques: A state-of-the-art literature review. Information Sciences, 582, 593-617.

3. Chen, X., Wang, X., Zhang, K., Fung, K. M., Thai, T. C., Moore, K., ... & Qiu, Y. (2022). Recent advances and clinical applications of deep learning in medical image analysis. Medical image analysis, 79, 102444.

4. Dzedzickis, A., Kaklauskas, A., & Bucinskas, V. (2020). Human emotion recognition: Review of sensors and methods. Sensors, 20(3), 592.

5. Guo, K., Soornack, Y., & Settle, R. (2019). Expression-dependent susceptibility to face distortions in processing of facial expressions of emotion. Vision research, 157, 112-122.

6. Hess, U. (2021). Who to whom and why: The social nature of emotional mimicry. Psychophysiology, 58(1), e13675.

7. JM, S. (2009). Expressing fear enhances sensory acquisition. Nature Neurosci, 43, 822-829.

8. Keltner, D., Sauter, D., Tracy, J., & Cowen, A. (2019). Emotional expression: Advances in basic emotion theory. Journal of nonverbal behavior, 43, 133-160.

9. Ko, B. C. (2018). A brief review of facial emotion recognition based on visual information. sensors, 18(2), 401.

10. Li, W., Zhang, L., Wu, C., Cui, Z., & Niu, C. (2022). A new lightweight deep neural network for surface scratch detection. The International Journal of Advanced Manufacturing Technology, 123(5), 1999-2015.

11. Maithri, M., Raghavendra, U., Gudigar, A., Samanth, J., Barua, P. D., Murugappan, M., ... & Acharya, U. R. (2022). Automated emotion recognition: Current trends and future perspectives. Computer methods and programs in biomedicine, 215, 106646.

12. Mellouk, W., & Handouzi, W. (2020). Facial emotion recognition using deep learning: review and insights. Procedia Computer Science, 175, 689-694.

13. Mukhiddinov, M., Akmuradov, B., & Djuraev, O. (2019, November). Robust text recognition for Uzbek language in natural scene images. In 2019 International Conference on Information Science and Communications Technologies (ICISCT) (pp. 1-5). IEEE.

14. Mukhiddinov, M., Jeong, R. G., & Cho, J. (2020). Saliency cuts: salient region extraction based on local adaptive thresholding for image information recognition of the visually impaired. Int. Arab J. Inf. Technol., 17(5), 713-720.

15. Mukhiddinov, M., Djuraev, O., Akhmedov, F., Mukhamadiyev, A., & Cho, J. (2023). Masked face emotion recognition based on facial landmarks and deep learning approaches for visually impaired people. Sensors, 23(3), 1080.

16. Mukhamadiyev, A., Khujayarov, I., Djuraev, O., & Cho, J. (2022). Automatic speech recognition method based on deep learning approaches for Uzbek language. Sensors, 22(10), 3683.

17. Rakhmatillaevich, K. U., Ugli, M. M. N., Ugli, M. A. O., & Nuruddinovich, D. O. (2018). A novel method for extracting text from naturalscene images and TTS. European science review, 1(11-12), 30-33.

18. Ramdani, C., Ogier, M., & Coutrot, A. (2022). Communicating and reading emotion with masked faces in the Covid era: A short review of the literature. Psychiatry research, 316, 114755.

19. Saxena, A., Khanna, A., & Gupta, D. (2020). Emotion recognition and detection methods: A comprehensive survey. Journal of Artificial Intelligence and Systems, 2(1), 53-79.

20. Susskind, J. M., Lee, D. H., Cusi, A., Feiman, R., Grabski, W., & Anderson, A. K. (2008). Expressing fear enhances sensory acquisition. Nature neuroscience, 11(7), 843-850.

21. Van Kleef, G. A. (2009). How emotions regulate social life: The emotions as social information (EASI) model. Current directions in psychological science, 18(3), 184-188.

22. Xia, C., Pan, Z., Li, Y., Chen, J., & Li, H. (2022). Vision-based melt pool monitoring for wire-arc additive manufacturing using deep learning method. The International Journal of Advanced Manufacturing Technology, 120(1), 551-562.

دوره 4، شماره 12
بهار 1403
صفحه 88-101

XML

اصل مقاله 1.28 M

تعداد مشاهده مقاله 442
تعداد دریافت فایل اصل مقاله 485

اکتشاف و پردازش هوشمند دانش

تشخیص چهره افراد دارای ماسک با استفاده از MediaPipe Facemesh و الگوریتم های یادگیری عمیق

دوره 4، شماره 12بهار 1403صفحه 88-101

فایل ها

هم رسانی

ارجاع به این مقاله

آمار

دوره 4، شماره 12
بهار 1403
صفحه 88-101