01033, г. Киев
ул.Владимировская 40/2

+38 067 612 2045
info@mir09.com

Пн. - Пт. 9.00 - 19.00
СБ.-ВС. выходной

seo pictures

Для удобства обработки данных поисковая система заносит все найденные в интернете страницы в индекс, который помогает сжать их объемы для оптимального хранения. Чтобы понимать, за счет чего возможно сокращение объема информации, необходимо знать, как документ представляется в поисковой системе.

Сначала происходит очистка страницы от различных нетекстовых элементов, таких как графика, HTML-теги и т. п. В результате остается чистый текст, пригодный для дальнейшей обработки.

Далее все слова из текста располагаются в алфавитном порядке, а все элементы, которые словами не являются (пробелы, знаки препинания и пр.), отбрасываются. При этом поисковая машина не заносит в индекс слова в той форме, в которой они приведены в тексте. С помощью алгоритма лингвистической обработки все слова приводятся к начальным грамматическим формам или основам. Это позволяет сократить место в индексе и сделать поиск более точным. Из обработанных основ составляется подобие словаря, где указываются адрес страницы и конкретное место расположения каждой основы (номер вхождения). В поисковом индексе хранятся только номера основ, а сами основы располагаются отдельно. Если на странице находится несколько вхождений одного слова, то в индексе указываются номер этой страницы и все вхождения этого слова на ней. Получается что-то вроде обратной копии всех страниц интернета. Такой индекс поисковой машины называется инвертированным, или инверсным.

seo pictures

Поисковые машины сохраняют и прямой индекс, который представляет собой сжатую текстовую копию всех страниц интернета. Это значительно экономит время, например при показе цитат.

  • Процесс поиска связанной информации

Чтобы понять, что именно ищет пользователь, поисковая система проводит тщательный лингвистический анализ запроса. Сначала определяется язык, на котором сформулирован запрос. Индикаторами языка являются алфавит, используемый в запросе, а также характерные особенности сочетания букв, присущие различным языковым группам.

Далее проводится работа по трактовке морфологии. Поисковая система различает не только слова из запроса во всех их морфологических формах, но и синонимы, однако при ранжировании предпочтение отдается точному вхождению.

Также поисковым системам приходится разграничивать омонимы (слова с одинаковым написанием, но разными значениями). Например, одно и то же слово может быть истолковано и как глагол, и как существительное.

Определиться с наиболее вероятным списком форм помогает статистика совместной встречаемости слов и грамматических признаков.

Определившись с тематикой запроса (сняв омонимию), поисковая система пытается расширить запрос. Например, он может иметь или сокращение, или аббревиатуру, или очень близкий синоним, а может, на каком-то сайте будет написан латинскими буквами. Чтобы такие сайты не выпадали из поля поиска, запросы расширяются наиболее частотными однокоренными словами, синонимами и вариантами написания. Чтобы не производить расширения определенных групп запросов, например для запроса «ООО Заяц» не подбирать слова «зайка», «зайчик» и т. д., поисковая система определяет, что этот запрос относится к объекту «название организации», и не использует приведенные расширения при поиске. Среди групп объектов — географические названия, имена людей, названия организаций и т. п.

Еще один используемый прием обработки запроса — проработка грамматических и орфографических ошибок:

Следует отметить, что все действия по лингвистическому анализу запроса поисковая система успевает выполнить за доли секунды. В результате лингвистической обработки тот запрос, который вводит пользователь, и тот, который обрабатывается поисковой системой, сильно отличаются друг от друга.

Язык, на котором сформулированы запросы к поисковым машинам, называется информационно-поисковым языком, или языком поисковых запросов. Информационно-поисковый язык состоит из логических операторов, морфологии языка, регистра слов, префиксов обязательности, возможности учета расстояния между словами и расширенного поиска. Подобное представление запроса помогает быстрее ориентироваться в индексных базах.

Набор команд языка запросов может изменяться в зависимости от особенностей конкретной поисковой машины. Но есть определенные правила, которые используют все. Рассмотрим наиболее распространенные из них.

1. Команды логического объединения и исключения. Символы «+» и «-» в запросе позволяют добавлять какие-либо слова в текст или исключать их из него. Слово, помеченное «+», обязательно будет присутствовать в документах, которые найдет поисковая система по запросу. Слова, помеченного «-», в выдаче не будет.

2. Поиск точной фразы (обозначается как кавычки «"..."»). Позволяет перечислить слова, которые обязательно должны встречаться в пределах одного предложения в заданной форме.

3. «Логическое ИЛИ» (обозначается символом «|» в Яндексе и "OR" в Google). Дает возможность осуществлять поиск по документам, в которых присутствует только одно из перечисленных слов.

Как правило, поисковые системы учитывают все словоформы исходного запроса согласно правилам русского языка. Поэтому в выдаче можно увидеть документы, в которых встречаются не только точные вхождения запроса, но и различные его формы. Для того чтобы выполнить поиск по точной словоформе, перед запросом необходимо поставить восклицательный знак. Если запрос состоит из двух и более слов, можно использовать уже знакомые нам кавычки.

Меняя местами слова в тексте запроса, можно заметить следующее: если слова располагаются в разных предложениях, в одном случае поисковая система не считает страницу со всеми словами в тексте релевантной запросу, а в другом — считает. Расположение ключевых слов в тексте можно оценить, посмотрев сохраненную копию страницы из поисковой выдачи. В ней подсвечиваются все учитывающиеся ключи.

Используя информационно-поисковый язык запросов, можно находить необходимую информацию за максимально короткое время. Также знание языка запросов дает возможность анализировать выдачу с различных сторон. Это помогает написать текст, который будет влиять на позиции и станет интересен пользователям.

  • Поиск релевантной информации

Сегодня почти невозможно придумать запрос, по которому поисковая система сможет найти менее 10 источников. Для большинства осмысленных запросов результат поиска — сотни, тысячи, миллионы страниц. Интернет растет, а следовательно, и страниц становится все больше. Поэтому основная цель поисковой системы — показать наиболее релевантную информацию, только те страницы, которые соответствуют запросу.

Как происходит поиск релевантной информации?

Сначала пользователь вводит запрос в поисковую строку. Роботы поисковой системы переформируют запрос и выполняют поиск в индексных базах, созданных при индексации сайтов. Все страницы, которые робот найдет по данному запросу, будут считаться релевантными. Заключительный шаг — процесс ранжирования найденных страниц (выстраивание их в порядке убывания от наиболее релевантных к наименее релевантным). Ранжированный список сайтов, а точнее, ссылок на конкретные страницы сайта, будет показан на страницах результатов поиска.

seo pictures

Посмотрите наши услуги SEO-продвижение Киев и обратитесь к нам для консультации! Удачи!

manager MIR09

Manager Виталий Маврин

Используйте команды языка запросов, чтобы сэкономить время, с помощью операторов Яндекса и Google.

Полезные статьи

Совет профи

manager MIR09
Виталий Маврин

Пример использования операторов языка запросов: скопируйте какую-либо фразу с вашего сайта, введите ее в поисковую строку Яндекса или Google в кавычках и проверьте, дублирует ли кто-то вашу информацию.

Tags

Нужна помощь? Поддержка 08:00-18:00 /

+38 067 612 2045