ОСОБЛИВОСТІ ЗАСТОСУВАННЯ СИСТЕМ РОЗПІЗНАВАННЯ ОБ’ЄКТІВ У РЕЖИМІ РЕАЛЬНОГО ЧАСУ НА МІКРОКОНТРОЛЕРАХ З ПОДАЛЬШИМ ГОЛОСОВИМ ВИВОДОМ ІНФОРМАЦІЇ ДЛЯ ЛЮДЕЙ З ВАДАМИ ЗОРУ

Автор(и)

  • РОСТИСЛАВ ДЕНІСОВ Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна
  • ПАВЛО ПОПОВИЧ Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна

DOI:

https://doi.org/10.30857/2786-5371.2024.3.2

Ключові слова:

системи розпізнавання зображень, мікроконтролери, голосовий вивід інформації, згорткові нейронні мережі, TensorFlow, Espeak, MobileNet

Анотація

Мета. Дослідження мінімального і максимального часу необхідного на проходження одного повного циклу розпізнавання-оголошення назви об’єкту з урахуванням різної довжини слів, різної швидкості розпізнавання об’єктів, а також фізичних особливостей людей з вадами зору для систем розпізнавання об’єктів у режимі реального часу на мікроконтролерах з подальшим голосовим виводом.

Методика. Створення варіантів комбінацій слів різної довжини з урахуванням можливості задання швидкості генерації мови у Espeak, та середньої швидкості мови в Україні. Розрахунок мінімальної і максимальної відстані до об’єкту на момент початку циклу розпізнавання-оголошення. Встановлено мінімальний і максимальний час необхідний на повний цикл розпізнавання-оголошення назви об’єкту.

Результати. На базі синтезатора мови Espeak та особливостях Українсько мови та мовлення було досліджено час необхідний для оголошення назв об’єктів різної довжини. Встановленого мінімальний та максимальний час проходження повного циклу розпізнавання-оголошення інформації з урахуванням фізичних особливостей людей з вадами зору, швидкості їх руху та швидкості реакції на голосову інформацію. Також отримано мінімальну і максимальну відстань до об’єкту на момент початку циклу, в залежності від часу необхідного на проходження одного повного циклу.

Наукова новизна. Отримано мінімальний і максимальний час необхідний на проходження повного циклу розпізнавання-оголошення інформації з урахуванням фізичних особливостей людей з вадами зору, технічних можливостей сучасних нейронних мереж та програм для синтезу мови, а також мінімальну і максимальну відстань до об’єкту на момент початку циклу. Досліджено мінімальну і максимальну відстань до об’єкту на момент початку циклу розпізнавання-оголошення.

Практична значимість. Отримані результати можуть бути використані при практичному створенні систем онлайн розпізнавання об’єктів, для оцінки можливості застосування тих чи інших нейронних мереж, спираючись на отриманий мінімальний та максимальний час проходження повного циклу розпізнавання-оголошення інформації, а також часу необхідного для проходження кожного з його окремих елементів.

Завантаження

Дані завантаження ще не доступні.

Біографії авторів

РОСТИСЛАВ ДЕНІСОВ, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна

https://orcid.org/0000-0003-1146-9114

ПАВЛО ПОПОВИЧ, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, Україна

PhD, Associate Professor, Department of Acoustic and Multimedia Electronic Systems

http://orcid.org/0000-0002-1572-3127

Scopus Author ID: 55225965700

Researcher ID: J-6574-2017

##submission.downloads##

Опубліковано

2024-07-29

Як цитувати

ДЕНІСОВ, Р., & ПОПОВИЧ, П. (2024). ОСОБЛИВОСТІ ЗАСТОСУВАННЯ СИСТЕМ РОЗПІЗНАВАННЯ ОБ’ЄКТІВ У РЕЖИМІ РЕАЛЬНОГО ЧАСУ НА МІКРОКОНТРОЛЕРАХ З ПОДАЛЬШИМ ГОЛОСОВИМ ВИВОДОМ ІНФОРМАЦІЇ ДЛЯ ЛЮДЕЙ З ВАДАМИ ЗОРУ. Технології та інжиніринг, (3), 21–30. https://doi.org/10.30857/2786-5371.2024.3.2

Номер

Розділ

ІНФОРМАЦІЙНІ ТЕХНОЛОГІЇ, ЕЛЕКТРОНІКА, МЕХАНІЧНА ТА ЕЛЕКТРИЧНА ІНЖЕНЕРІЯ