ОСОБЛИВОСТІ ЗАСТОСУВАННЯ СИСТЕМ РОЗПІЗНАВАННЯ ОБ’ЄКТІВ У РЕЖИМІ РЕАЛЬНОГО ЧАСУ НА МІКРОКОНТРОЛЕРАХ З ПОДАЛЬШИМ ГОЛОСОВИМ ВИВОДОМ ІНФОРМАЦІЇ ДЛЯ ЛЮДЕЙ З ВАДАМИ ЗОРУ
DOI:
https://doi.org/10.30857/2786-5371.2024.3.2Ключові слова:
системи розпізнавання зображень, мікроконтролери, голосовий вивід інформації, згорткові нейронні мережі, TensorFlow, Espeak, MobileNetАнотація
Мета. Дослідження мінімального і максимального часу необхідного на проходження одного повного циклу розпізнавання-оголошення назви об’єкту з урахуванням різної довжини слів, різної швидкості розпізнавання об’єктів, а також фізичних особливостей людей з вадами зору для систем розпізнавання об’єктів у режимі реального часу на мікроконтролерах з подальшим голосовим виводом.
Методика. Створення варіантів комбінацій слів різної довжини з урахуванням можливості задання швидкості генерації мови у Espeak, та середньої швидкості мови в Україні. Розрахунок мінімальної і максимальної відстані до об’єкту на момент початку циклу розпізнавання-оголошення. Встановлено мінімальний і максимальний час необхідний на повний цикл розпізнавання-оголошення назви об’єкту.
Результати. На базі синтезатора мови Espeak та особливостях Українсько мови та мовлення було досліджено час необхідний для оголошення назв об’єктів різної довжини. Встановленого мінімальний та максимальний час проходження повного циклу розпізнавання-оголошення інформації з урахуванням фізичних особливостей людей з вадами зору, швидкості їх руху та швидкості реакції на голосову інформацію. Також отримано мінімальну і максимальну відстань до об’єкту на момент початку циклу, в залежності від часу необхідного на проходження одного повного циклу.
Наукова новизна. Отримано мінімальний і максимальний час необхідний на проходження повного циклу розпізнавання-оголошення інформації з урахуванням фізичних особливостей людей з вадами зору, технічних можливостей сучасних нейронних мереж та програм для синтезу мови, а також мінімальну і максимальну відстань до об’єкту на момент початку циклу. Досліджено мінімальну і максимальну відстань до об’єкту на момент початку циклу розпізнавання-оголошення.
Практична значимість. Отримані результати можуть бути використані при практичному створенні систем онлайн розпізнавання об’єктів, для оцінки можливості застосування тих чи інших нейронних мереж, спираючись на отриманий мінімальний та максимальний час проходження повного циклу розпізнавання-оголошення інформації, а також часу необхідного для проходження кожного з його окремих елементів.