ЛАНДЕ Д.В., Побудова моделей предметних областей з юриспруденції за даними сервісу Wikipedia (стор. 39-46)

DOI: 

https://doi.org/10.37750/2616-6798.2016.4(19).272973

УДК 004.7:001.8

Ланде Д.В.,
доктор технічних наук,
Інститут проблем реєстрації інформації НАН України,
Науково-дослідний інститут інформатики і права НАПрН України
 
 
Анотація. У роботі наводиться алгоритм побудови моделей різних предметних областей  з юриспруденції на базі автоматичного аналізу даних сервісу Wikipedia. Показано, як виявляється термінологічна база, що динамічно змінюється при розвитку сервісу-першоджерела, формується мережева структура, розраховується вага різних термінів-понять за двома різними критеріями – ступенями вузлів і PageRank. На прикладах показана адекватність підходів, що пропонуються, а також, що кластери в термінологічних мережах можуть розглядатися як основа для виявлення окремих наукових напрямків.
Ключові слова: модель предметної області, термінологічна база, Wikipedia, зв'язкі понять, юриспруденція, сканування мережевого сервісу.
Аннотация. В работе приводится алгоритм построения моделей предметных областей по юриспруденции на основе автоматического анализа данных  сервиса Wikipedia. Показано, как определяется терминологическая база, динамически изменяемая при развитии сервиса-первоисточника,  формируется сетевая структура, рассчитывается вес разных терминов-понятий по двум разным критериям – степеням узлов и PageRank. На примерах показана адекватность предлагаемых  подходов,  а также то, что кластеры в терминологических сетях могут рассматриваться как основа для выявления отдельных научных направлений.
Ключевые слова: модель предметной области, терминологическая база, Wikipedia, связи понятий, юриспруденция, сканирование сетевого сервиса.
 Summary. The algorithm of creation of models of subject domains on jurisprudence on the basis of automatic data analysis Wikipedia service is offered in the article. It is shown how the terminology database is defined, the network structure is created, weight of different terms-concepts is calculated by two different criteria – node degree and PageRank. Adequacy of the  approaches offered is shown by example, and also the fact that clusters of terminological networks can be considered as a basis for detection of certain scientific directions.
Keywords: subject domain model, terminology-oriented database, Wikipedia, links of concepts, jurisprudence, scanning of network service.
 
 
       Постановка проблеми. Сьогодні під моделлю предметної області, зокрема, розуміють спеціальним чином сформовану мережу понять, онтологію. Побудова великої галузевої онтології – складна науково-практична проблема [1; 2]. Перший етап цього процесу – побудова термінологічної основи онтології і визначення семантичних зв’язків [3].
        Аналіз останніх публікацій. Вивченню моделей предметних областей, так само як і сервісу Wikipedia (http://wikipedia.com), присвячена велика кількість робіт, що підтверджує актуальність проведених досліджень [4]. Серед них, зокрема, методи побудови мереж співавторів, визначення значущих вузлів, структури мережі, дослідження цитування, а також відповідних корпусів [5]...