В Институте информационных технологий НАНА состоялся научный семинар Отдела №16. Доклад на тему «Технологии и методы, основанные на контент-анализ и анализ ссылок в борьбе с веб-спамами» представил докторант отдела Хайям Нуралиев. Он предоставил информацию о веб-спамах, их типах и методах поисковых систем.
По его словам, существует два основных подхода, основанных на ссылочный и контент-анализ, определяющих веб-спам на сайте. Векторные, вероятностные и статистические языковые модели используются для обнаружения контент спамов в поисковых системах.
Затем выступивший рассказал о ссылочном спаме, заявив, что он имеет такие ссылочные разновидности, как «outgoing» и «ncoming». Он отметил, что в ссылочных спамах создатели спама изменяют результаты поисковых систем, непосредственно давая прямую ссылку на целевую страницу.
X.Нуралиев проинформировал об алгоритмах и технологиях, основанных на контент-анализ и анализ ссылок. Он сказал, что спамов на основе ссылок делятся на такие группы, как «PageRank», «TrustRank», «Truncated PageRank» и «Estimation of Supporters».
Он довел до сведения, что в борьбе с веб-спамами используются такие методы поисковых систем, как «Google Penguin», «Google Sandbox» и «Google Panda». Выступивший рассказал об их преимуществах.
На семинаре принял участие заведующий отделом, член-корреспондент НАНА, доктор технических наук Рамиз Алыгулиев. Он озвучил свои предложения и рекомендации относительно обсуждаемого вопроса.
В заключение семинара состоялся обмен мнениями относительно доклада, были озвучены ответы на вопросы.
© Все права защищены. При использовании информации гиперссылка на сайт www.iсt.az обязательна.