Міжмовне виявлення омонімів із використанням змагального вирівнювання векторних представлень та зваженого за різницею рангів методу CSLS

DOI: 10.31673/2412-9070.2026.017410

  • Пилипенко А. І. (Pylypenko A.) Київський національний університет імені Тараса Шевченка
  • Данилко Д. Є. (Danylko D.) Київський національний університет імені Тараса Шевченка

Анотація

У цій статті представлено новий метод виявлення міжмовних омонімів, який поєднує змагальне вирівнювання векторних представлень слів із зваженим за різницею рангів показником CSLS (Cross-domain Similarity Local Scaling). Запропонований підхід покращує якість вирівнювання для типологічно близьких, малоресурсних мов, використовуючи польсько-українські пари слів як приклад дослідження. Спочатку векторні представлення слів вирівнюються за допомогою некерованого змагального методу з подальшим уточненням через CSLS. Потім семантична подібність обчислюється за допомогою CSLS і додатково коригується шляхом застосування штрафів за різницю рангів на основі взаємних рангів найближчих сусідів. Експериментальні результати показують, що така модифікація CSLS суттєво підвищує здатність розрізняти три семантичні групи, зокрема ізолюючи омонімічні пари слів. Класифікатор на основі правил із оптимізованими порогами CSLS досягає середнього макро-значення F1 = 0.916, що підтверджує ефективність запропонованого методу.

Ключові слова: міжмовні омоніми; векторні представлення слів; CSLS; змагальне вирівнювання; некероване навчання; семантична подібність; різниця рангів; FastText.

Номер
Розділ
Статті