В Институте информационных технологий НАНА состоялся очередной научный семинар.
Доклад на тему «Автоматическое удаление терминов из текстов (Закон Ципфа)» представила сотрудница института Сабина Фоменко. Она проинформировала об анализе текстов, анализаторах и закон Ципфа.
Выступившая сказала, что лучшим способом нахождения терминов в тексте является поиск терминов с помощью поисковых систем, а также рассказала об этапах выбора терминологии с использованием этой методики. Она предоставила информацию об анализаторах ключевых слов Ranks, SEOworkers, RankQuest, анализаторах семантики и лексики текстов TextAnalyser.net, Readability index calculator, а также об анализаторах Text to HTML ratio, рассказала об их возможностях.
Она довела до сведения, что Джордж Ципфа предложил закон Ципфа в 1949 году, который имеет универсальные черты, а также отметила, что наряду с применением их в текстах, возможно ассоциировать города по количеству жителей и т. д. Она рассказала о первом законе Ципфа и представила график зависимости скорости от степени. Она подчеркнула, что в результате исследования была выявлено, что наиболее важные слова находятся в середине диаграммы.
В заключение С. Фоменко отметила, что преимуществом представленных методов является простота реализации и качество работы. Она сказала, что такие методы не требуют обучения, что они позволяют группировать термины и связывать их.
Состоялся обмен мнениями относительно доклада, были озвучены ответы на вопросы.
© Все права защищены. При использовании информации гиперссылка на сайт www.iсt.az обязательна.