© Державна наукова установа “Інститут інформації, безпеки і права Національної академії правових наук України”, 2021
Ми будемо Вам вдячні, якщо при використанні матеріалів сайту Ви зробите посилання на сайт ДНУ ІІБП НАПрН України.
УДК 004.67
ЛАНДЕ Д.В.,
СНАРСЬКИЙ А.О.,
|
доктор технічних наук,
доктор фізико-математичних наук, професор
|
||
|
|||
Постановка проблеми. На даний час актуальним є завдання визначення того, які з важливих структурних елементів тексту виявляються інформаційно-значущими, такими, що визначають інформаційну структуру тексту. Використання таких елементів як опорних слів дозволяє формувати онтології, тезауруси, пошукові образи, зокрема, при обробці законодавчих актів та іншої нормативно-правової інформації. Такі елементи можуть, зокрема, використовуватися також для ідентифікації таких компонентів тексту, як коллокації, надфразова єдність [1].
Опірні слова для пошуку в тексті та автоматичного екстрагування значущих фрагментів вибираються з урахуванням такої властивості слів, як “розпізнавальна” або дискримінантна сила. При аналізі текстів з правової тематики, зокрема, при вирішенні завдання формування електронної енциклопедії на основі аналізу всього масиву законодавчих актів України, оцінка дискримінантної сили окремих слів має найважливіше значення [2].
Метою статті є опис і практичне обгрунтування методики виявлення опірних слів за допомогою так званих мереж мови (Language Network), що пропонується авторами. Разом з послідовним аналізом текстів, побудова мереж, вузлами яких є їх елементи – слова або словосполучення, фрагменти природної мови, дозволяє виявляти структурні елементи тексту, без яких він втрачає свою зв’язність…
|
© Державна наукова установа “Інститут інформації, безпеки і права Національної академії правових наук України”, 2021
Ми будемо Вам вдячні, якщо при використанні матеріалів сайту Ви зробите посилання на сайт ДНУ ІІБП НАПрН України.
01024, Україна, м. Київ, вул. Пилипа Орлика, 3
тел/факс (044) 235-22-90
E-mail: pravo@ippi.org.ua
WWW: ippi.org.ua