В статье о шинглах я уже описывала, как на этапе канонизации текстов поисковыми системами отбрасываются слова, союзы, знаки препинания и т.д.
После канонизации при проверке уникальности текстов оказывается, что выражения «Что посеешь, то и пожнешь» и «Чем более ты посеешь, тем более и пожнешь» абсолютно одинаковы.
Поэтому, тем, кто занимается размножением текстов для статей и ссылок обязательно нужно обращать внимание на стоп-слова («шум»).
К стоп-словам относятся:
- Цифры.
- Знаки препинания
- Отдельные буквы алфавита
- Союзы, междометия, местоимения, частицы, предлоги, причастия
Вот их перечень от А до Я:
а, без, более, бы, был, была, были, было, быть, в, вам, вас, весь, во, вот, все, всего, всех, вы, где, да, даже, для, до, его, ее, если, есть, ещё, же, за, здесь, и, из, из-за, или, им, их, к, как, как-то, ко, когда, кто, ли, либо, мне, может, мы, на, надо, наш, не, него, неё, нет, ни, них, но, ну, о, об, однако, он, она, они, оно, от, очень, по, под, при, с, со, так, также, такой, там, те, тем, то, того, тоже, той, только, том, ты, у, уже, хотя, чего, чей, чем, что, чтобы, чьё, чья, эта, эти, это, я
- Еще говорят, что стоп-словами могут оказаться слова, использующиеся на большинстве сайтов.
Например: сайт, здравствуйте, заказ, телефон, admin и т.д.
Но эти данные не точны.
К стоп-словам не подбираются синонимы. В текстах ссылок их желательно употреблять как можно меньше.