٠ Экспресс-расписание ٠ Полигон ٠ Электронные учебники

   Оглавление     Уроки:  1   2   3   4   5   6   7   Далее > 

 Выход х 

 

На главную страницу >

 

Поиск информации в сети Internet

Урок 7.


  1. Проблема поиска и поисковые системы
  2. Поиск по ключевым словам
  3. Советы при поиске в системе Яндекс
  4. Синтаксис языка запросов
  5. Поиск по каталогам

7.4. Синтаксис языка запросов

В системе Яндекс существует специальный язык запросов, использовать который более сложно, чем форму расширенного поиска но при его использовании можно получить наилучший результат.

Поисковый запрос вводится в поисковое поле, он может содержать ключевые слова и специальные символы, позволяющие установить взаимосвязи между этими словами и ввести дополнительные параметры. Большинство этих символов представлено в следующей таблице.

Синтаксис языка запросов системы Яндекс.

Символ Назначение Пример
" " поиск фразы "красная шапочка"
(эквивалентно красная /+1 шапочка)
+ обязательное наличие слова в найденном документе +быть или +не быть
~~ или - не должно быть слова в пределах документа (И НЕ) путеводитель по парижу ~~ (агентство | тур)
~ не должно быть слова в пределах предложения (И НЕ) банки ~ закон
! искать только указанную форму слова !Путин
пробел или & логическое И (в пределах предложения) фабрика звезд
&& логическое И (в пределах документа) музыка && (фабрика звезд)
| логическое ИЛИ рисунок | картинка | фото | коллаж
/(n m) расстояние между словами (-назад +вперед) поставщики /2 кофе
музыкальное /(-2 4) образование
вакансии ~ /+1 студентов
&&/(n m) расстояние в предложениях (-назад +вперед) банк && /1 налоги
( ) группировка слов (технология | изготовление) (сыра | творога)

Основные положения языка запросов:

  1. Если ключевые слова являются устойчивым словосочетанием или единой фразой, то заключите их в кавычки.
  2. Если слова не объединены кавычками, то каждое слово будет само по себе и перед каждым их них можно поставить знак плюс «+», если слово обязательно должно быть в найденных документах, минус «-», если слово не должно быть в найденных документах (пробел ставится перед знаком, но не после). Если перед словом поставить знак ~ (тильда), то этого слова не должно быть в пределах предложения в совокупности с рядом стоящим в запросе словом. Примечание: по умолчанию будут найдены и те документы, которые удовлетворяют хотя бы одному из ключевых слов. Такие ссылки будут иметь низкую ревалентность и будут находиться в конце результатов запроса.
  3. Независимо от того, в какой форме вы употребили слово в запросе, Яндекс учитывает все формы этого слова по правилам русского языка. Чтобы этого не происходило, поставьте знак восклицания перед неизменяемым словом.
  4. Все слова, написанные через пробел или знак & (логическое И) должны одновременно находиться в найденных документах в пределах предложения. Все слова, написанные через && должны одновременно находиться в найденных документах, но расстояние между ними не оговаривается.
  5. Слова, написанные через символ | (логическое ИЛИ) являются заменяющими друг друга (синонимами), и будут найдены документы, удовлетворяющие хотя бы одному из этих слов.
  6. Можно указать расстояние между словами. Если пронумеровать слова в предложении, то расстояние между словами – это разность номеров слов. Например, если между двумя словами может находиться только одно слово, то расстояние между ними равно 2 (3 минус 1). Число указывается после знака /, например региональный /2 центр. В этом случае будут найдены документы, в которых эти слова находятся либо вместе, либо между ними есть еще одно слово. Запись /2 эквивалентна записи /(-2 +2), в такой форме можно указать максимальное и минимальное количество слов, например, от 3 до 5 записывается /(3 5). Минус и плюс указывают на порядок слов: минус – обратный порядок. Если перед символом / указать &&, то расстояние будет вычисляться в предложениях.
  7. Для группировки отдельных частей запроса используйте круглые скобки.

Поиск в зонах и элементах web-страницы.

Web-страница состоит из определенных зон и элементов. Соответственно можно осуществлять поиск в зонах и в элементах. Например, для поиска в заголовке страницы (заголовок отображается в заголовке окна обозревателя) указывают: $title (выражение), поиск в тексте ссылок аналогичен (см. следующую таблицу), а общий синтаксис таков:

$имя_зоны (выражение)

Примечание: выражение может быть представлено как одним ключевым словом, так и несколькими словами, объединенными указанными выше знаками логических операций.

Для поиска в элементах используется синтаксис:

#имя_элемента=(выражение)

Элементы отличаются от зон тем, что в большинстве своем не видны пользователю, просматривающему страницу. Так, например, ключевые слова указываются в невидимом заголовке Web-страницы и не выводятся в обозревателе. Их можно увидеть только выполнив Вид ® В виде HTML. Большинство документов имеют описание (abstract), которое также не выводится на страницу. Подписи рисунков видны только в том случае, если загрузка рисунков отключена, либо если навести мышь на рисунок, то подпись появится в виде подсказки.

Синтаксис поиска в элементах и зонах.

Синтаксис Назначение Пример
$title (выражение) поиск в заголовке $title (Яндекс)
$anchor (выражение) поиск в тексте ссылок $anchor (Яндекс | Апорт)
#keywords=(выражение) поиск в ключевых словах #keywords=(поисковая система)
#abstract=(выражение) поиск в описании #abstract=(искалка | поиск)
#image="значение" поиск файла изображения #image="tort*"
#hint=(выражение) поиск в подписях к изображениям #hint=(lenin | ленин)
#url="значение" поиск на заданном сайте (странице) #url="www.comptek.ru*"
#link="значение" поиск ссылок на заданный URL #link="www.yandex.ru*"
#mime="значение" поиск в документах данного (pdf или rtf) типа #mime="pdf"

Сортировка результатов запроса.

После того, как поисковая система выберет страницы, удовлетворяющие запросу, она сортирует ссылки на эти страницы в порядке убывания их ревалентности.

Ревалентность – это степень соответствия содержания документа поисковому запросу. Релевантность документа зависит от ряда факторов, в том числе от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.

Пользователь может повлиять на порядок сортировки, используя операторы веса и уточнения запроса.

Вес указывается для того, чтобы увеличить ревалентность документов, содержащих слово или выражение, вес которого указан.

Синтаксис: слово:число или (поисковое_выражение):число

Чем больший вес указан у слова (или выражения), тем выше ревалентность документов его содержащих.

Например, по запросу родина Путина:5 в результатах поиска наверху списка окажутся документы, где чаще встречается именно слово Путин.

Уточняющее слово или выражение применяется для того, чтобы увеличить релеватность документов, их cодержащих.

Синтаксис: <- слово или <- (уточняющее_выражение)

Например, по запросу телефон <- автоответчик будут найдены все документы, содержащие слово телефон, но первыми будут выданы страницы, содержащие слово автоответчик.

Примечание: кроме сортировки по ревалентности Вы можете выбрать сортировку по дате документов, щелкнув по соответствующей ссылке.



   Оглавление     Уроки:  1   2   3   4   5   6   7   Далее > 

 Вверх ^ 

 
  Copyright © 2004 Павел С. Батищев.
Региональный КЦ: "Помощь образованию!"
mailto:pbatishev@yandex.ru