Поисковая система Яндекс с 2009 года начала использовать технологию машинного обучения, которая получила название Матрикснет. Новая разработка предназначена для определения степени ранжирования документов в индексе поисковых машин, при этом она имеет устойчивую структуру к переобучению. Работает она за счет обработки множества данных, в том числе и оценок асессоров.
Так как ранжирование страницы может рассчитываться по большому количеству факторов, то и формула, которая будет обработана в Матрикснет, будет огромной. Другие методики неспособны обрабатывать быстро сложные математические формы и строить логические цепочки из разных комбинаций. Матрикснет обрабатывает десятки тысяч коэффициентов ранжирования, что улучшает качество поисковой выдачи.
В Матрикснет можно сделать настройку формулы под определенный класс ключевых запросов. Например, можно настроить выдачу под запросы о музыке или кино. При этом формула не будет влиять на качество выдачи по другим запросам.
Матрикснет – это автомат, который имеет высокую чувствительность к показателям коэффициентов ранжирования в разных диапазонах. Это сложный механизм машинного обучения, который в большом количестве «шумов» в интернете определяет важную информацию.
В интернете собрано колоссальное количество информации, которая должна быть обработана поисковой системой и выбрана только та, которая отвечает запросу пользователя. Но и выбрать нужные документы в индексе – это половина дала. Необходимо упорядочить результаты по мере уменьшения релевантности страницы. Это нужно сделать максимально быстро и качественно. Матрикснет позволяет обрабатывать очень большое количество информации, анализируя многочисленные факторы ранжирования без увеличения вычислительной мощности.
Поиск работает сразу с тысячами серверов. На каждом отдельном сервере ищется информация, дающая ответ на ключевой запрос пользователя, которая передается поисковой системе в качестве ответа. Таких ответов может быть десятки тысяч, поэтому поисковая система формирует единый список ссылок на документы, которые отвечают по релевантности, ключевому запросу.
Матрикснет, как мы уже говорили, - это метод машинного обучения, который был разработан поисковой системой Яндекс. Основная его цель строится на улучшении алгоритма ранжирования страниц в поисковой выдаче за счет самообучающегося алгоритма. Первоначально Яндекс использовал матрикснет для обработки рекламных объявлений. При помощи его можно было спрогнозировать вероятность кликов по 120 факторам ранжирования. В обработке использовались социально-демографические данные Крипта, а также поведенческие факторы. Таким образом алгоритм самостоятельно обучался и совершенствовался, добавлялись новые факторы ранжирования.
Отбор происходил таким образом, что рекламное объявление появлялось на партнерском сайте в том случае, когда стоимость клика позволяет получить максимальную прибыль и дать ответ на запрос пользователя.
Поисковые системы стараются дать полный ответ на запрос пользователя, не только в рекламе, но и в поисковой выдаче. Матрикснет способствует расширению факторов, которые влияют на поисковую выдачу и позволяет более точно подобрать ответы на запросы. Это нужно учитывать при продвижении сайтов в интернете, а также при создании и внедрении рекламной компании.
Об авторе |
|