Список стоп-слов

В статье о шинглах я уже описывала, как на этапе канонизации текстов поисковыми системами отбрасываются слова, союзы, знаки препинания и т.д.

После канонизации при проверке уникальности текстов оказывается, что выражения «Что посеешь, то и пожнешь» и «Чем более ты посеешь, тем более и пожнешь» абсолютно одинаковы.

Поэтому, тем, кто занимается размножением текстов для статей и ссылок обязательно нужно обращать внимание на стоп-слова («шум»).

К стоп-словам относятся:

  1. Цифры.
  2. Знаки препинания
  3. Отдельные буквы алфавита
  4. Союзы, междометия, местоимения, частицы, предлоги, причастия

Вот их перечень от А до Я:

а, без, более, бы, был, была, были, было, быть, в, вам, вас, весь, во, вот, все, всего, всех, вы, где, да, даже, для, до, его, ее, если, есть, ещё, же, за, здесь, и, из, из-за, или, им, их, к, как, как-то, ко, когда, кто, ли, либо, мне, может, мы, на, надо, наш, не, него, неё, нет, ни, них, но, ну, о, об, однако, он, она, они, оно, от, очень, по, под, при, с, со, так, также, такой, там, те, тем, то, того, тоже, той, только, том, ты, у, уже, хотя, чего, чей, чем, что, чтобы, чьё, чья, эта, эти, это, я

  1. Еще говорят, что стоп-словами могут оказаться слова, использующиеся на большинстве сайтов. 

Например: сайт, здравствуйте, заказ, телефон, admin и т.д.

Но эти данные не точны.

 

К стоп-словам не подбираются синонимы. В текстах ссылок их желательно употреблять как можно меньше.

Добавить комментарий