اکتشاف و پردازش هوشمند دانش

اکتشاف و پردازش هوشمند دانش

تشخیص چهره افراد دارای ماسک با استفاده از MediaPipe Facemesh و الگوریتم های یادگیری عمیق

نوع مقاله : مقاله پژوهشی

نویسندگان
1 گروه مهندسی کامپیوتر، واحد بیرجند، دانشگاه آزاد اسلامی، بیرجند، ایران
2 گروه فنی و مهندسی- دانشکده برق و کامپیوتر- دانشگاه آزاد اسلامی واحد فردوس-ایران
چکیده
در پاسخ به نیاز اساسی به تشخیص دقیق چهره‌های متنقبضی که ماسک می‌پوشند، این مقاله یک رویکرد نوآورانه ارائه می‌دهد که از روش‌های عمیق یادگیری دو مرحله‌ای موازی به همراه الگوریتم‌های متا-هیوریستیک هیبریدی بهره می‌برد. چالش‌های مرتبط با تشخیص افرادی که ماسک می‌پوشند، از طریق یک چارچوب جامع آدرس داده می‌شوند که از فناوری‌های روز و ورودی‌های متنوع بهره می‌برد. این روش شامل یک استراتژی الگوریتمی موازی است، که تشخیص چهره‌ها با و بدون ماسک به منظور دقت بهینه‌سازی می‌شود. هنگام شناسایی چهره‌های بدون ماسک، الگوریتم خاصی استفاده می‌شود، در حالی که تشخیص چهره‌های با ماسک از یک الگوریتم جداگانه استفاده می‌کند. علاوه بر این، یک ادغام منابع داده متعدد شامل تصاویر چهره با ماسک و ورودی‌های سنسورهای دما، دقت تشخیص را افزایش می‌دهد. مرکز اصلی این تحقیق در خوشه‌بندی داده‌ها واقع شده است، جایی که مجموعه‌داده‌ها بر اساس حجم آنها سازماندهی می‌شوند، سپس با استفاده از یک شبکه عصبی پیچشی پیشنهادی، دسته‌بندی انجام می‌شود. ویژگی‌های تکراری از هر خوشه با دقت حذف می‌شوند و پردازش موازی پسین توسط الگوریتم‌های متمایز انجام می‌شود. در این مطالعه، دو الگوریتم ترکیبی معرفی شده‌اند و با افزایش حجم داده، می‌توان الگوریتم‌های اضافی را به‌سادگی درج کرد تا قابلیت مقیاس‌پذیری و افزایش دقت را فراهم کنند. این رویکرد نوآورانه توانایی بهبود قابل توجه دقت و کارآیی سیستم‌های تشخیص چهره‌های متنقبضی را به نمایش می‌گذارد و نیاز مهمی در حوزه‌های امنیت تا به سلامت عمومی و فراتر از آن را برطرف می‌کند. همچنین با پیشرفت فناوری و پیشرفت تحقیقات در این حوزه، امکان بهبود دقت تشخیص چهره‌های متنقبضی هنوز امیدوارکننده است.
کلیدواژه‌ها

1.      Avazov, K., Abdusalomov, A., Mukhiddinov, M., Baratov, N., Makhmudov, F., & Cho, Y. I. (2022). An improvement for the automatic classification method for ultrasound images used on CNN. International Journal of Wavelets, Multiresolution and Information Processing20(02), 2150054.
2.      Canal, F. Z., Müller, T. R., Matias, J. C., Scotton, G. G., de Sa Junior, A. R., Pozzebon, E., & Sobieranski, A. C. (2022). A survey on facial emotion recognition techniques: A state-of-the-art literature review. Information Sciences582, 593-617.
3.      Chen, X., Wang, X., Zhang, K., Fung, K. M., Thai, T. C., Moore, K., ... & Qiu, Y. (2022). Recent advances and clinical applications of deep learning in medical image analysis. Medical image analysis79, 102444.
4.      Dzedzickis, A., Kaklauskas, A., & Bucinskas, V. (2020). Human emotion recognition: Review of sensors and methods. Sensors20(3), 592.
5.      Guo, K., Soornack, Y., & Settle, R. (2019). Expression-dependent susceptibility to face distortions in processing of facial expressions of emotion. Vision research157, 112-122.
6.      Hess, U. (2021). Who to whom and why: The social nature of emotional mimicry. Psychophysiology58(1), e13675.
7.      JM, S. (2009). Expressing fear enhances sensory acquisition. Nature Neurosci43, 822-829.
8.      Keltner, D., Sauter, D., Tracy, J., & Cowen, A. (2019). Emotional expression: Advances in basic emotion theory. Journal of nonverbal behavior43, 133-160.
9.      Ko, B. C. (2018). A brief review of facial emotion recognition based on visual information. sensors18(2), 401.
10.  Li, W., Zhang, L., Wu, C., Cui, Z., & Niu, C. (2022). A new lightweight deep neural network for surface scratch detection. The International Journal of Advanced Manufacturing Technology123(5), 1999-2015.
11.  Maithri, M., Raghavendra, U., Gudigar, A., Samanth, J., Barua, P. D., Murugappan, M., ... & Acharya, U. R. (2022). Automated emotion recognition: Current trends and future perspectives. Computer methods and programs in biomedicine215, 106646.
12.  Mellouk, W., & Handouzi, W. (2020). Facial emotion recognition using deep learning: review and insights. Procedia Computer Science175, 689-694.
13.  Mukhiddinov, M., Akmuradov, B., & Djuraev, O. (2019, November). Robust text recognition for Uzbek language in natural scene images. In 2019 International Conference on Information Science and Communications Technologies (ICISCT) (pp. 1-5). IEEE.
14.  Mukhiddinov, M., Jeong, R. G., & Cho, J. (2020). Saliency cuts: salient region extraction based on local adaptive thresholding for image information recognition of the visually impaired. Int. Arab J. Inf. Technol.17(5), 713-720.
15.  Mukhiddinov, M., Djuraev, O., Akhmedov, F., Mukhamadiyev, A., & Cho, J. (2023). Masked face emotion recognition based on facial landmarks and deep learning approaches for visually impaired people. Sensors23(3), 1080.
16.  Mukhamadiyev, A., Khujayarov, I., Djuraev, O., & Cho, J. (2022). Automatic speech recognition method based on deep learning approaches for Uzbek language. Sensors22(10), 3683.
17.  Rakhmatillaevich, K. U., Ugli, M. M. N., Ugli, M. A. O., & Nuruddinovich, D. O. (2018). A novel method for extracting text from naturalscene images and TTS. European science review1(11-12), 30-33.
18.  Ramdani, C., Ogier, M., & Coutrot, A. (2022). Communicating and reading emotion with masked faces in the Covid era: A short review of the literature. Psychiatry research316, 114755.
19.  Saxena, A., Khanna, A., & Gupta, D. (2020). Emotion recognition and detection methods: A comprehensive survey. Journal of Artificial Intelligence and Systems2(1), 53-79.
20.  Susskind, J. M., Lee, D. H., Cusi, A., Feiman, R., Grabski, W., & Anderson, A. K. (2008). Expressing fear enhances sensory acquisition. Nature neuroscience11(7), 843-850.
21.  Van Kleef, G. A. (2009). How emotions regulate social life: The emotions as social information (EASI) model. Current directions in psychological science18(3), 184-188.
22.  Xia, C., Pan, Z., Li, Y., Chen, J., & Li, H. (2022). Vision-based melt pool monitoring for wire-arc additive manufacturing using deep learning method. The International Journal of Advanced Manufacturing Technology120(1), 551-562.