Параметризований математичний апарат мутаційного аналізу систем машинного навчання
DOI: 10.31673/2412-9070.2026.318108
Анотація
Забезпечення якості та надійності моделей машинного навчання є актуальним науковим завданням, особливо в контексті їх зростаючого застосування у критичних щодо безпеки прикладних галузях. Мутаційний аналіз є одним із найбільш зрілих методів оцінювання якості тестових наборів, однак його застосування до систем машинного навчання ускладнене через стохастичність навчання та інференсу, відсутність детермінованого оракула, а також вплив еквівалентних і тривіальних мутантів на результуючу оцінку. Ключовою проблемою є відсутність єдиної математичної формалізації, яка охоплювала б існуючі підходи як частинні випадки та забезпечувала їх коректне порівняння, оскільки поняття мутаційної оцінки у різних роботах визначається по-різному залежно від обраного правила фіксації відмінності між оригінальною моделлю і мутантом та від способу агрегування результатів.
У статті запропоновано формалізацію мутаційного аналізу для систем машинного навчання як параметризованої обчислювальної системи. Визначено базові об'єкти процесу: параметризоване відображення навченої моделі, множину операторів мутації, множину згенерованих мутантів, тестовий набір та узагальнену метрику якості, що охоплює поширені показники для задач класифікації та регресії. Узагальнену мутаційну оцінку визначено як параметризований функціонал, що задається парою компо-нентів - правилом «вбивства» мутанта у пороговому або статистично обґрунтованому варіанті та агрегатором результатів по множині мутантів. Статистичний ва-ріант правила поєднує критерій значущості з оцінкою розміру ефекту, що забезпечує відтворюваність для стохастичних моделей. Показано, що існуючі підходи є частиними реалізаціями запропонованого апарату. Сформульовано оптимізаційну задачу відбору підмножини операторів мутації і тестових прикладів, що максимізує мутаційну оцінку за умов ресурсних обмежень. Запропонований апарат забезпечує формальну основу для коректного порівняння підходів до мутаційного тестування та для розроблення ефективних алгоритмів мутаційного аналізу моделей машинного навчання.
Ключові слова: мутаційне тестування, математична модель, машинне навчання, моделі машинного навчання, обробка великих масивів даних.