Исследуются технологии и методы, основанные на контент-анализ и анализ ссылок в борьбе с веб-спамами

01 Май 2019 - 10:00 | Конференции, собрания

В Институте информационных технологий НАНА состоялся научный семинар Отдела №16. Доклад на тему «Технологии и методы, основанные на контент-анализ и анализ ссылок в борьбе с веб-спамами» представил докторант отдела Хайям Нуралиев. Он предоставил информацию о веб-спамах, их типах и методах поисковых систем.

По его словам, существует два основных подхода, основанных на ссылочный и контент-анализ, определяющих веб-спам на сайте. Векторные, вероятностные и статистические языковые модели используются для обнаружения контент спамов в поисковых системах.

Затем выступивший рассказал о ссылочном спаме, заявив, что он имеет такие ссылочные разновидности, как «outgoing» и «ncoming». Он отметил, что в ссылочных спамах создатели спама изменяют результаты поисковых систем, непосредственно давая прямую ссылку на целевую страницу.

X.Нуралиев проинформировал об алгоритмах и технологиях, основанных на контент-анализ и анализ ссылок.  Он сказал, что спамов на основе ссылок делятся на такие группы, как «PageRank», «TrustRank», «Truncated PageRank» и «Estimation of Supporters».

Он довел до сведения, что в борьбе с веб-спамами используются такие методы поисковых систем, как «Google Penguin», «Google Sandbox» и «Google Panda». Выступивший рассказал об их преимуществах.

На семинаре принял участие заведующий отделом, член-корреспондент НАНА, доктор технических наук Рамиз Алыгулиев. Он озвучил свои предложения и рекомендации относительно обсуждаемого вопроса.

В заключение семинара состоялся обмен мнениями относительно доклада, были озвучены ответы на вопросы.

© Все права защищены. При использовании информации гиперссылка на сайт www.iсt.az обязательна.