ПІДВИЩЕННЯ ТОЧНОСТІ КЛАСИФІКАЦІЇ ОБ’ЄКТІВ НА МІСЦЕВОСТІ НА ОСНОВІ ПОЄДНАННЯ СЕНСОРНИХ МОДАЛЬНОСТЕЙ ІЗ ВИКОРИСТАННЯМ БІНАРНОЇ КРОСЕТРОПІЇ ЯК ФУНКЦІЇ ВТРАТ

В. С. Легкобит; І. В. Стоцький; А. О. Карпенко

doi:10.58254/viti.4.2023.04.44

Автор(и)

В. С. Легкобит Військовий інститут телекомунікації та інформатизації імені Героїв Крут https://orcid.org/0000-0002-9118-4188
І. В. Стоцький Військовий інститут телекомунікації та інформатизації імені Героїв Крут https://orcid.org/0000-0002-5898-3228
А. О. Карпенко Військовий інститут телекомунікації та інформатизації імені Героїв Крут https://orcid.org/0000-0002-8372-6303

DOI:

https://doi.org/10.58254/viti.4.2023.04.44

Ключові слова:

згорткові нейронні мережі, класифікація, орторектифікація

Анотація

У сучасних умовах ведення бойових дій надзвичайної важливості набуло програмне забезпечення, в основу якого покладено техніки машинного навчання для виявлення та класифікації об’єктів інфраструктури на місцевості. У зв’язку з цим актуальним постає завдання підвищення точності класифікації об’єктів на місцевості, оскільки застосування безпілотних літальних апаратів (далі – БпЛА) та космічних систем є життєво важливим для ведення розвідувальної діяльності. Враховуючи характер вхідних даних, а саме статичні зображення місцевості, отримані у вигляді супутникових знімків та знімків з камер БпЛА, для вирішення завдань класифікації доцільно застосовувати згорткові нейронні мережі. У більшості випадків супутникові знімки представлені у вигляді мультиспектральних та гіперспектральних зображень, тому для навчання моделі були використані загальнодоступні набори даних, що запропоновані спільнотою дослідників SpaceNet. Важливим етапом підготовки навчальної вибірки є орторектифікація зображень, а саме додавання інформації про 3D-поверхню до зображень, що надає моделі важливу геометричну інформацію для семантичних класів, таких як будівлі та інші споруди, виправляє геометричні спотворення та сприяє навчанню моделі розпізнавати об’єкти в узгодженому геопросторовому контексті. Під час експериментів було проведено навчання моделі SegNet із використанням normalized Digital Surface Model (nDSM) та без неї. Результати експериментів демонструють, що узагальнена точність класифікації для шести класів об’єктів на тестовому наборі даних зростає на 23,9 %. А експерименти з обмеженням навчальної вибірки продемонстрували, що за потреби достатньо використати половину доступного тренувального набору даних для отримання лише на 4 % нижчої точності класифікації та заощадження близько 10 годин навчання.

Посилання

Козуб А. М., Шумейко В. О., Зуйко В. В., Ніколаєнко О. Є. Аналіз досвіду використання космічних систем та безпілотних авіаційних комплексів в сучасних локальних конфліктах та перспективи їх розвитку // НУОУ. Сучасні інформаційні технології у сфері безпеки та оборони. 2018. № 3 (33).
Епішев В. П., Мотрунич І. І., Періг В. М., Кудак В. І., Найбауер І. Ф., Сухов П. П., Кашуба В. І., Сухов К. П., Варламов І. Д., Албул В. В., Москаленко С. С., Мисливий С. О. Можливості національних оптичних засобів спостереження за космічним простором щодо контролю геостаціонарної орбіти у інтересах збройних сил України // НУОУ. Сучасні інформаційні технології у сфері безпеки та оборони. 2018. № 3 (33).
ImageNet: website. URL: https://www.image-net.org/index.php.
M. Weinmann and M. Weinmann. Geospatial computer vision based on multi-modal data. 2018. DOI: 10.3390/rs10010002.
Goldberg H., Brown M. and Wang S. A benchmark for building footprint classification using orthorectified rgb imagery and digital surface models from commercial satellites. Proceedings of IEEE applied imagery pattern recognition workshop. 2017. DOI: 10.1109/AIPR.2017.8457973.
Chen K., Weinmann M., Gao X., Yan M., Hinz S., Jutzi B. and Weinmann M. Residual shuffling convolutional neural networks for deep semantic image segmentation using multi-modal data. ISPRS annals of photogrammetry, remote sensing & spatial information sciences. 2018. DOI: 10.5194/
isprs-annals-IV-1-29-2018.
Medium: website. URL: https://medium.com/the-downlinq/spacenet-6-announcing-the-winners-df817712b515.
WangL., Yang B., Chen Y., Zhang X., Orchard J. Improving neural-network classifiers using nearest neighbor partitioning. IEEE Trans NNL System. 2017. DOI: 10.1109/TNNLS.2016.2580570.
Shuangrong Liu, Lin Wang, Bo Yang, Jin Zhou, Zhenxiang Chen, Huifen Dong. Improvement of Neural-Network Classifiers Using Fuzzy Floating Centroids. DOI: 10.1109/TCYB.2020.2987904.
Zhu C., Wang Z. Entropy-based matrix learning machine for imbalanced data sets. Pattern Recognit Lett. 2017. DOI: 10.1016/j.patrec.2017.01.014.
Aurelio, YS, de Almeida, GM, de Castro, CL and Braga, AP. Learning from imbalanced data sets with weighted cross-entropy function. 2019. DOI: 10.1007/s11063-018-09977-1.
Badrinarayanan V., Kendall A. and Cipolla R. Seg-Net: a deep convolutional encoder-decoder architecture for image segmentation. IEEE Trans. Pattern Analytic. Mach Intelligence. 2017. DOI: 10.1109/TPAMI.2016.2644615.
Daniel Voigt Godoy. Deep Learning with PyTorch Step-by-Step: A Beginner’s Guide. Copyright
2020-2022.

ПІДВИЩЕННЯ ТОЧНОСТІ КЛАСИФІКАЦІЇ ОБ’ЄКТІВ НА МІСЦЕВОСТІ НА ОСНОВІ ПОЄДНАННЯ СЕНСОРНИХ МОДАЛЬНОСТЕЙ ІЗ ВИКОРИСТАННЯМ БІНАРНОЇ КРОСЕТРОПІЇ ЯК ФУНКЦІЇ ВТРАТ

Автор(и)

DOI:

Ключові слова:

Анотація

##submission.downloads##

Опубліковано

Номер

Розділ

Схожі статті

flags

ISSN

author

journal

FOUNDERcicst