ЛАНДЕ Д.В., ЯНЬЦІН ЧЖАО, МОЦЗІ ВЕЙ, ШІВЕЙ ЧЖУ, ЦЗЯНЬПІН ҐО, Система анотування китайської правової інформації (ст. 68-75)

DOI: 

https://doi.org/10.37750/2616-6798.2018.3(26).270631

УДК 004.44:002.513.5

ЛАНДЕ Д.В.,

 

ЯНЬЦІН ЧЖАО,

 
МОЦЗІ ВЕЙ,

ШІВЕЙ ЧЖУ,

ЦЗЯНЬПІН ҐО,

доктор технічних наук, керівник наукового центру НДІ інформатики і права НАПрН України

заступник директора Інституту інформаційних досліджень Шандуньської академії наук, КНР (ІІД ШАН)

старший науковий співробітник ІІД ШАН

завідувач відділу ІІД ШАН

інженер ІІД ШАН 

 
Анотація. Роботу присвячено методу автоматичного реферування правової інформації КНР, представленої китайською мовою. Розглянуто модель реферату правового документа і принципи його формування. Для вирішення завдання визначення рівня важливості речень з вихідного документа було запропоновано перейти до визначення вагових значень окремих ієрогліфів, а не слів в тексті документів і рефератів.
Ключові слова: автоматичне реферування, правова інформація, китайська мова, теорія інформації, мережева модель
Summary. Article is devoted to a method of automatic text summarization of the legal information provided in Chinese. The model of the legal document abstract and the procedure of his formation is considered. To determine the level of importance of sentences, it was suggested to proceed to determine the weight values of separate hieroglyphs, rather than words in the text of documents and abstracts. Also consideration of model of documents as networks of sentences for detection of the most important sentences on parameters of this network was offered.
Keywords: automatic summarization, legal information, Chinese language, information theory, network model.
Аннотация. Работа посвящена методу автоматического реферирования правовой информации КНР, представленной на китайском языке. Рассмотрена модель реферата правового документа и принципы его формирования. Для решения задачи определения уровня важности предложений из исходного документа было предложено перейти к определению весовых значений отдельных иероглифов, а не слов в тексте документов и рефератов.
Ключевые слова: автоматическое реферирование, правовая информация, китайский язык, теория информации, сетевая модель
 
 
      Постановка проблеми. З постановки завдань штучного перекладу і автоматичного реферування практично починалася комп’ютерна обробка природних мов. Перші фундаментальні роботи з автоматичного реферування текстів з'явилися ще в середині минулого століття [1]. Завдання пов'язане з рішенням найважливішої проблеми – скороченням обсягів інформації, що споживається людиною, боротьби з інформаційним шумом. Це завдання дуже актуальне саме сьогодні через постійне зростання інформаційного простору. Автоматичне реферування відомо всім користувачам мережевих пошукових систем – у відповідь на запит вони отримують не тільки назву документа, але і короткий автоматично створений опис (сніпет), користувачі мобільних пристроїв хочуть бачити короткий опис статей, перш ніж переходять до докладного читання. Особи, які приймають важливі управлінські рішення, повинні ознайомлюватися з тисячами документів на добу, свідомо відкидаючи інформаційний шум...