Сервис по проверке обратных ссылок
Back Links Manager
Сервис по проверке обратных ссылок
+
Генератор статей и текстовых ссылок
 

Счетчики



Яндекс.Метрика

www.megastock.ru

Здесь находится аттестат нашего WM идентификатора 297917048748
Проверить аттестат

уведомление о рисках

Урок 1. Как проверяется уникальность полученных статей?

Есть несколько методов проверки схожести текстов между собой.

Самый популярный – проверка методом шинглов.

Что же такое шингл?

Шингл – это несколько подряд идущих слов.

Длина шингла – это сколько подряд идущих слов.

 

Пример.

Допустим есть такое текст:

слово1 слово2 слово3 слово4 слово5 слово6 слово7 слово8 слово9 слово10.

Вот его шинглы (длина шингла в примере взята равной 5):

слово1 слово2 слово3 слово4 слово5
слово2 слово3 слово4 слово5 слово6
слово3 слово4 слово5 слово6 слово7
слово4 слово5 слово6 слово7 слово8
слово5 слово6 слово7 слово8 слово9
слово6 слово7 слово8 слово9 слово10

Т.е. если этот текст разбить на шинглы длиной 5, мы получим 6 шинглов.

Как происходит проверка текстов на схожесть?

Проверить 2 и более текстов на схожесть можете здесь:

Попробуйте вставить 2 текста (1 вариант): 

словоA слово2 слово3 слово4 слово5 слово6 слово7 слово8 слово9 слово10

словоB слово2 слово3 слово4 слово5 слово6 слово7 слово8 слово9 слово10

И нажмите кнопку "Сравнить"

Результатом будет: Схожесть текстов 71%

 

Попробуйте вставить другие 2 текста (2-й вариант):

слово1 слово2 слово3 слово4 словоA слово6 слово7 слово8 слово9 слово10


слово1 слово2 слово3 слово4 словоB слово6 слово7 слово8 слово9 слово10

Результатом будет: Схожесть текстов 9%

Казалось бы, разницы почти нет. В первом варианте отличаются только первые слова, а во втором только 5-е. А результат – как небо и земля!

 

Алгоритм проверки двух текстов между собой на схожесть таков:

Каждый текст разбивается на шинглы

Пример приведем для 1-го варианта текста (длина шингла 5):

словоA слово2 слово3 слово4 слово5 слово6 слово7 слово8 слово9 слово10

словоB слово2 слово3 слово4 слово5 слово6 слово7 слово8 слово9 слово10


шинглы 1-го текста
словоA слово2 слово3 слово4 слово5
слово2 слово3 слово4 слово5 слово6
слово3 слово4 слово5 слово6 слово7
слово4 слово5 слово6 слово7 слово8
слово5 слово6 слово7 слово8 слово9
слово6 слово7 слово8 слово9 слово10

шинглы 2-го текста
словоB слово2 слово3 слово4 слово5
слово2 слово3 слово4 слово5 слово6
слово3 слово4 слово5 слово6 слово7
слово4 слово5 слово6 слово7 слово8
слово5 слово6 слово7 слово8 слово9
слово6 слово7 слово8 слово9 слово10


в обоих предложениях разных шинглов 7 штук

словоA слово2 слово3 слово4 слово5
словоB слово2 слово3 слово4 слово5
слово2 слово3 слово4 слово5 слово6
слово3 слово4 слово5 слово6 слово7
слово4 слово5 слово6 слово7 слово8
слово5 слово6 слово7 слово8 слово9
слово6 слово7 слово8 слово9 слово10

а схожих 5 штук

слово2 слово3 слово4 слово5 слово6
слово3 слово4 слово5 слово6 слово7
слово4 слово5 слово6 слово7 слово8
слово5 слово6 слово7 слово8 слово9
слово6 слово7 слово8 слово9 слово10

процент схожести текстов  5/7=0,71 = 71 %

Со вторым текстом предлагаем попробовать самим получить эти 9% схожести.

 

Примечание.

При генерации реальных статей, прежде, чем статья разбивается на шинглы, предварительно удаляются все знаки препинания, удаляются Стоп-слова, и только потом разбивается на шинглы.

По этой причине предложения следующие предложения схожи на 100% при проверке:

Мальдивы  – это райский уголок на  Земле.
Действительно, Мальдивы  – райский уголок на  Земле.

Увидеть список стоп-слов Вы можете  нажав "Посмотреть/редактировать список стоп-слов", в генераторе текстов.

 

Сколько нужно подобрать синонимов к каждому слову в тексте? 

Этот вопрос постоянно задают новички. Точного ответа нет на этот вопрос, но можно показать на примерах, как влияет пропущенных 2-3 слова.

Заходим в личный кабинет, в меню " Генератор текстов"

Выставляем следующие параметры генерации:

Количество ссылок/статей, которое нужно сгенерировать, не более   2000
Длина шингла (для списков синонимов): 10
Проверить уникальность статей (галка)
Длина шингла: 5
Схожесть текстов не более  10%

Если представить, что в статье 50 слов (в реальных их около 220), и к каждому слову мы подобрали по 1-му синониму

a1 b1 - это синонимы 1-го слова, и т.д.

w1 z1 x1 - слова без синонимов 

Вставьте этот текст:

 

[a1|b1] [a2|b2] [a3|b3] [a4|b4] [a5|b5] [a6|b6] [a7|b7] [a8|b8] [a9|b9] [a10|b10]
[a11|b11] [a12|b12] [a13|b13] [a14|b14] [a15|b15] [a16|b16] [a17|b17] [a18|b18] [a19|b19] [a20|b20]
[a21|b21] [a22|b22] [a23|b3]  [a24|b24] [a25|b25] [a26|b26] [a27|b27] [a28|b28] [a29|b29] [a30|b30]
[a31|b31] [a32|b32] [a33|b3]  [a34|b34] [a35|b35] [a36|b36] [a37|b37] [a38|b38] [a39|b39] [a40|b40]
[a41|b41] [a42|b42] [a43|b43] [a44|b44] [a45|b45] [a46|b46] [a47|b47] [a48|b48] [a49|b49] [a50|b50]

В результате генерации статей Вы получите: 53 статьи

 

Давайте рассмотрим случай, когда Вы пропустили несколько слов, и оставили их без синонимов. К примеру, синонимов вы придумали только в 45 словам из 50-ти.

[a1|b1] w1 [a3|b3] [a4|b4] [a5|b5] [a6|b6] [a7|b7] [a8|b8] [a9|b9] [a10|b10]
[a11|b11] [a12|b12] w2 [a14|b14] [a15|b15] [a16|b16] [a17|b17] [a18|b18] [a19|b19] [a20|b20]
[a21|b21] [a22|b22] [a23|b3]  [a24|b24] w3 [a26|b26] [a27|b27] [a28|b28] [a29|b29] [a30|b30]
[a31|b31] [a32|b32] [a33|b3] w4 [a35|b35] [a36|b36] [a37|b37] [a38|b38] [a39|b39] [a40|b40]
[a41|b41] w5 [a43|b43] [a44|b44] [a45|b45] [a46|b46] [a47|b47] [a48|b48] [a49|b49] [a50|b50]

результат: 32 статьи

 

2 подряд идущих слова без синонимов

[a1|b1] w1 z1 [a4|b4] [a5|b5] [a6|b6] [a7|b7] [a8|b8] [a9|b9] [a10|b10]
[a11|b11] [a12|b12] w2 z3 [a15|b15] [a16|b16] [a17|b17] [a18|b18] [a19|b19] [a20|b20]
[a21|b21] [a22|b22] [a23|b3]  [a24|b24] [a25|b25] w3 z3 [a28|b28] [a29|b29] [a30|b30]
[a31|b31] [a32|b32] w4 z4 [a35|b35] [a36|b36] [a37|b37] [a38|b38] [a39|b39] [a40|b40]
[a41|b41] [a42|b42] w5 z5 [a45|b45] [a46|b46] [a47|b47] [a48|b48] [a49|b49] [a50|b50]

результат: 29 статьи

 

а это по 3 слова подряд без синонимов

[a1|b1] w1 z1 x1 [a5|b5] [a6|b6] [a7|b7] [a8|b8] [a9|b9] [a10|b10]
[a11|b11] [a12|b12] w2 z3 x2 [a16|b16] [a17|b17] [a18|b18] [a19|b19] [a20|b20]
[a21|b21] [a22|b22] [a23|b3]  [a24|b24] x3 w3 z3 [a28|b28] [a29|b29] [a30|b30]
[a31|b31] x4 w4 z4 [a35|b35] [a36|b36] [a37|b37] [a38|b38] [a39|b39] [a40|b40]
[a41|b41] [a42|b42] w5 z5 x5 [a46|b46] [a47|b47] [a48|b48] [a49|b49] [a50|b50]

результат: 15 статей

  

Вывод, что бы получить большее  кол-во статей - нужно:

 

1. По возможности использовать больше синонимов к каждому слову

2. Места, где синонимы отсутствуют , в прилегающих списках  нужно увеличивать кол-во синонимов.

[a1|b1|c1|d1] w1 z1 x1 [a2|b2|c2|d2]

 

Размножение статей

Рекомендуем!

Регистрация доменов в зоне .ru и .рф 95 рублей