КОНЦЕПТУАЛЬНА МОДЕЛЬ СИСТЕМИ УПРАВЛІННЯ РОЗПІЗНАВАННЯ ОБРАЗІВ ІЗ ЗАСТОСУВАННЯМ ШІ
DOI: 10.31673/2412-4338.2025.038709
Анотація
Останні інновації в галузі комп'ютерного зору дозволили впровадження складних моделей розпізнавання, здатних обробляти складні образи і робити надійні прогнози на основі величезних обсягів відеоданих. Головними проблемами тренування нейронних мереж в галузі комп’ютерного зору є упередженість даних, що виникає при навчанні систем комп’ютерного зору на упереджених наборах інформації, інтерпретованість даних, що ускладнює інтерпретацію процесів прийняття рішень та потреба в значних обчислювальних ресурсах, особливо в сценаріях застосування в режимі реального часу на пристроях з обмеженими ресурсами. Робота присвячена дослідженню методів підвищення ефективності комп’ютерного зору, зокрема в режимі реального часу та з використанням мінімального обчислювального ресурсу. В статті розглядаються принципи роботи згорткових нейронних мереж та порівнюються характеристики актуальних алгоритмів розпізнавання, таких як R-CNN, R-FCN та YOLO. Головними характеристиками для порівняння були обрані швидкість, точність та використання обчислювальних ресурсів.
На підставі проведеного аналізу для запропонованої моделі системи керування розпізнаванням образів було обрано алгоритм You Only Look Once (YOLO), який вирізняється поєднанням високої швидкості та точності. Це робить його особливо ефективним у завданнях, що потребують миттєвої обробки даних. YOLO виконує обробку зображення за один прохід крізь нейронну мережу, що суттєво пришвидшує процес виявлення об’єктів порівняно з класичними двоетапними методами. У межах реалізації моделі визначено ключові етапи функціонування алгоритму, зокрема використання Non-Maximum Suppression для усунення надлишкових обмежувальних рамок і вибору найточнішої, а також застосування функції втрат, що враховує координати, розміри, рівень впевненості та клас, з метою покращення загальної точності.
Ключові слова: штучний інтелект, розпізнавання образів, згорткові нейронні мережі, You Only Look Once