МЕТОДИ ОБРОБКИ МАСИВІВ АУДІОДАНИХ ЗА ДОПОМОГОЮ NATURAL LANGUAGE PROCESSING

DOI: 10.31673/2412-4338.2024.033353

  • Коршун Н. В. (Korshun N. V.) Київський столичний університет імені Бориса Грінченка, Київ
  • Крючкова Л. П. (Kriuchkova L. P.) Київський столичний університет імені Бориса Грінченка, Київ
  • Соколов В. Ю. (Sokolov V. Yu.) Київський столичний університет імені Бориса Грінченка, Київ
  • Киричок Р. В. Kyrychok R. V.) Київський столичний університет імені Бориса Грінченка, Київ

Анотація

Стаття присвячена всебічному дослідженню методів обробки аудіоданих за допомогою сучасних технологій Natural Language Processing (NLP). Вона висвітлює важливі аспекти розвитку цієї інноваційної галузі, зокрема акцентується на застосуванні NLP для перетворення інструкцій, сформульованих природною мовою, у виконуваний код. Це досягається через впровадження методів глибокого навчання, семантичного аналізу, а також компіляційних підходів, що дозволяють автоматизувати процес генерації програмного забезпечення на основі текстових запитів.
Важливою частиною статті є огляд різноманітних підходів до обробки аудіоданих, зокрема вибір програм на основі виконання та семантичних правил. Ці підходи значно підвищують точність і ефективність генерації коду, що в свою чергу веде до створення надійних та продуктивних систем, здатних ефективно працювати з великими масивами даних. Один із центральних аспектів, розглянутого в статті, — це трансферне навчання. Цей метод дозволяє підвищити точність аналізу аудіоданих, особливо у вузькоспеціалізованих сферах, таких як медицина або юриспруденція.
Трансферне навчання також зменшує потребу у великих наборах даних для кожної конкретної задачі, що значно полегшує роботу з великими обсягами аудіомасивів. Окрім того, у статті наголошується на важливості попередньої обробки тексту, яка включає такі етапи, як видалення стоп-слів, токенізація та лематизація. Ці процеси дозволяють ефективно структурувати текст для подальшого аналізу та знижують ймовірність помилок при обробці даних.
Загалом, технології NLP розглядаються як критично важливий інструмент для обробки аудіоданих і великих інформаційних масивів. Їхнє застосування може мати величезний вплив у різних галузях, зокрема у бізнесі, медицині, інформаційних технологіях та багатьох інших сферах, де ефективність обробки даних є ключовою для прийняття рішень і оптимізації процесів. Таким чином, стаття підкреслює актуальність і перспективи подальшого розвитку технологій NLP у контексті обробки аудіоданих, що відкриває нові горизонти для інноваційних рішень.

Ключові слова: Natural Language Processing, аудіодані, автентифікація, генерація коду, безпека, дані, глибоке навчання, машинне навчання, обробка тесту.

Список використаних джерел
1. Weaver, W. (1949). Translation. Carlsbad, New Mexico.
2. Vaswani, A., et al. (2017). Attention Is All You Need (Version 7). arXiv. https://doi.org/10.48550/arXiv.1706.03762
3. Romanovskyi, O., et al. (2021). Automated Pipeline for Training Dataset Creation from Unlabeled Audios for Automatic Speech Recognition. In Lecture Notes on Data Engineering and Communications Technologies (pp. 25–36). Springer International Publishing. https://doi.org/10.1007/978-3-030-80472-5_3
4. Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). In Proceedings of the 2019 Conference of the North. Proceedings of the 2019 Conference of the North. Association for Computational Linguistics. https://doi.org/10.18653/v1/n19-1423
5. Radford, A., Narasimhan, K., Salimans, T., & Sutskever, I. (2018). Improving Language Understanding by Generative Pre-Training. URL: https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf
6. Liu, Y., et al. (2019). RoBERTa: A Robustly Optimized BERT Pretraining Approach (Version 1). arXiv. https://doi.org/10.48550/arXiv.1907.11692
7. Sonbol, R., Rebdawi, G., & Ghneim, N. (2022). The Use of NLP-based Text Representation Techniques to Support Requirement Engineering Tasks: A Systematic Mapping Review. IEEE Access. https://doi.org/10.1109/ACCESS.2022.3182372.
8. Feng, S., et al. (2021). A Survey of Data Augmentation Approaches for NLP, 968–988. https://doi.org/10.18653/v1/2021.findings-acl.84.
9. Iosifov, I., Iosifova, O., & Sokolov, V. (2020). Sentence Segmentation from Unformatted Text using Language Modeling and Sequence Labeling Approaches. In 2020 IEEE International Conference on Problems of Infocommunications. Science and Technology (PICST) (Vol. 1, pp. 335–337). IEEE. https://doi.org/10.1109/picst51311.2020.9468084
10. Bakar, N., Kasirun, Z., & Salleh, N. (2015). Feature extraction approaches from natural language requirements for reuse in software product lines: A systematic literature review. J. Syst. Softw., 106, 132–149. https://doi.org/10.1016/j.jss.2015.05.006.
11. Oralbekova, D., Mamyrbayev, O., Othman, M., Kassymova, D., & Mukhsina, K. (2023). Contemporary Approaches in Evolving Language Models. Applied Sciences. https://doi.org/10.3390/app132312901.
12. Yao, X., Zheng, Y., Yang, X., & Yang, Z. (2021). NLP From Scratch Without Large-Scale Pretraining: A Simple and Efficient Framework. arXiv, https://doi.org/10.48550/arXiv.2111.04130.
13. Cai, D., Wu, Y., Wang, S., Lin, F., & Xu, M. (2023). Efficient Federated Learning for Modern NLP. Proceedings of the 29th Annual International Conference on Mobile Computing and Networking. https://doi.org/10.1145/3570361.3592505.
14. Zhou, M., Duan, N., Liu, S., & Shum, H. (2020). Progress in Neural NLP: Modeling, Learning, and Reasoning. Engineering. https://doi.org/10.1016/j.eng.2019.12.014.
15. Scaccia, J., & Scott, V. (2020). 5335 Days of Implementation Science: using Natural Language Processing to Examine Publication Trends and Topics. Implementation Science, 16. https://doi.org/10.1186/s13012-021-01120-4.
16. Kılıçaslan, Y., & Tuna, G. (2013). An NLP-based Approach for Improving Human-Robot Interaction. Journal of Artificial Intelligence and Soft Computing Research, 3, 189–200. https://doi.org/10.2478/jaiscr-2014-0013.
17. Alshemali, B., & Kalita, J. (2020). Improving the Reliability of Deep Neural Networks in NLP: A Review. Knowl. Based Syst., 191, 105210. https://doi.org/10.1016/j.knosys.2019.105210.
18. Iosifov, I. Iosifova, O., Sokolov, V., Skladannyi, P., & Sukaylo, I. (2021). Natural Language Technology to Ensure the Safety of Speech Information. In Proceedings of the Workshop on Cybersecurity Providing in Information and Telecommunication Systems II (Vol. 3187, no. 1, pp. 216–226).
19. Iosifova, O., Iosifov, I., Sokolov, V., Romanovskyi, O., & Sukaylo, I. (2021). Analysis of Automatic Speech Recognition Methods. In Proceedings of the Workshop on Cybersecurity Providing in Information and Telecommunication Systems (Vol. 2923, pp. 252–257).
20. Iosifov, I., Iosifova, O., Romanovskyi, O., Sokolov, V., & Sukailo, I. (2022). Transferability Evaluation of Speech Emotion Recognition Between Different Languages. In Lecture Notes on Data Engineering and Communications Technologies (pp. 413–426). Springer International Publishing. https://doi.org/10.1007/978-3-031-04812-8_35
21. Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient Estimation of Word Representations in Vector Space (Version 3). arXiv. https://doi.org/10.48550/arXiv.1301.3781
22. Pennington, J., Socher, R., & Manning, C. (2014). Glove: Global Vectors for Word Representation. In Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). Association for Computational Linguistics. https://doi.org/10.3115/v1/d14-1162
23. Joulin, A., Grave, E., Bojanowski, P., & Mikolov, T. (2017). Bag of Tricks for Efficient Text Classification. In Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics: Volume 2, Short Papers. https://doi.org/10.18653/v1/e17-2068
24. Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. In Neural Computation (Vol. 9, iss. 8, pp. 1735–1780). MIT Press. https://doi.org/10.1162/neco.1997.9.8.1735
25. Heck, J., & Salem, F. M. (2017). Simplified Minimal Gated Unit Variations for Recurrent Neural Networks (Version 1). arXiv. https://doi.org/10.48550/arXiv.1701.03452
26. Iosifova, O., Iosifov, I., Rolik, O., & Sokolov, V. (2020). Techniques Comparison for Natural Language Processing. In Proceedings of the 2nd International Workshop on Modern Machine Learning Technologies and Data Science (No. I, vol. 2631, pp. 57–67).
27. Romanovskyi, O., et al. (2022). Prototyping Methodology of End-to-End Speech Analytics Software. In Proceedings of the 4th International Workshop on Modern Machine Learning Technologies and Data Science (Vol. 3312, pp. 76–86).

Номер
Розділ
Статті