АНАЛІЗ МОДЕЛЕЙ МАШИННОГО НАВЧАННЯ ДЛЯ ВИЯВЛЕННЯ ШКІДЛИВОГО ПРОГРАМНОГО КОДУ В ФАЙЛАХ PDF: ВИБІР ОПТИМАЛЬНОЇ МОДЕЛІ

Автор(и)

DOI:

https://doi.org/10.58254/viti.7.2025.19.213

Ключові слова:

кібербезпека, шкідливий програмний код, PDF-файл, машинне навчання, JavaScript

Анотація

В останні роки спостерігається різке зростання складних кібератак із використанням зловмисно
закодованих документів, оскільки збільшуються об’єми інформації, яка передається. Файли, які виконуються,
прикріплені до електронних листів або вебсторінок, можуть бути небезпечними, про що відомо більшості
користувачів Інтернету. Тим не менш, документи є корисним інструментом для розповсюдження шкідливого
програмного забезпечення, оскільки люди не знають про них. Поширення зловмисно закодованих документів зі
збільшенням кількості передачі інформації призвело до зростання кількості складних атак. Файли формату
портативних документів (Portable Document Format, далі – PDF) стали основним вектором атаки шкідливого
програмного коду завдяки їх адаптивності та широкому використанню. Виявлення шкідливого програмного
коду у файлах PDF є складним завданням через його здатність включати різні шкідливі елементи, такі як
вбудовані сценарії, експлойти та шкідливі URL-адреси. У цій статті проведено аналіз у підходах машинного
навчання та представлено порівняльний аналіз методів машинного навчання (далі – ML), включаючи Naive
Bayes (далі – NB), K-Near Neighbor (далі – KNN), Average One Dependency Estimator (далі – A1DE), Random
Forest (далі – RF) та Support Vector Machine (далі – SVM) для виявлення шкідливих PDF-файлів. Це дослідження
базується на різних типах критеріїв тестування, з відсотковим поділом та K-кратною перехресною
перевіркою, для отримання більш об’єктивних результатів. Результати дослідження підкреслюють
ефективність моделей машинного навчання у точному виявленні шкідливого програмного коду в PDF-файлах,
визначать найбільш ефективні методи та надають уявлення про розробку надійних систем для захисту від
зловмисних дій. Подальші напрямки досліджень в області виявлення шкідливих PDF-файлів повинні бути
зосереджені на дослідженні методів глибокого навчання, що може підвищити продуктивність і точність
моделей.

Cover_7_2025

##submission.downloads##

Опубліковано

2025-05-17

Схожі статті

<< < 1 2 3 4 > >> 

Ви також можете розпочати розширений пошук схожих статей для цієї статті.