Как защитить сайт от кражи контента?

programmer

Ословед
Или хотя бы затруднить его использование?

Некоторые советы:

Если именно о грабберах...

1) "Рандомный" html-код. Смотрим общую структуру CMS, откуда начинается контент, за какие тэги мог бы цеплятся граббер и так или иначе дублируем это в html коде. Допустим если контент отделяется <p id="dd">dfdf</p> - то добавляем где-нибудь ещё такой же тэг случайным образом - добавляя туда мусорный контент (можно закрыть от индексирования или видимости). Граббер начнет тянуть "не то".

1.1) Вариация способа, когда сами тэги оформления немного рандомно меняются. Тогда граббер просто не всегда сможет зацепиться и сработать.

2) Класть в контент "скрытую" метку с какой-то информацией. После этого проверять наличие этого скрытой метки на сайте который "тырит" контент. Скрытый код может быть разным (например можно слово какое-то ключевое написать с использованием русских букв, или пробелы по разному нарисовать или комментарий специфический). Есть смысл записывать соответствие "метка" - IP - HTTP_USER_AGENT - реферер. Если где-то на сайте "врага" найдена такая метка, то IP можно смело банить.

3) Банить анонимные прокси, да и открытые тоже. Можно пользоваться базой с maxmind.com (GeoIP). Банить левых юзер-агентов.

4) Для совсем параноиков есть граф.код. Особенно пригождается на сайтах с достаточно постоянной аудиторией. Граф.код вводится один раз при попытке, допустим, просмотра полной новости. После этого IP прошедшего проверку вносится в белый список. Что бы не забанить яндекс и прочие поисковики - сразу внести их IP в белый список, или проверять по reverse DNS и вносить при соответствии. Заодно и от слабых слабых ддосов помогает немного иногда
smile.gif

что ещё можно сделать? ваши идеи

attachment.php
Weber за создание и поддержку темы!
 

DarkByte

Ословед
Недавно придумал интересую защиту от копирования контента, пока ещё не проверял на деле, но по идеи должно работать :)
Есть такой символ управляющий: & # 8238; (пробелы убрать), позволяет перевернуть текст слева направо.
Дык вот если перед выводом на страницу текста, перевернуть его скриптом и добавить этот символ,
то на странице он будет отображаться нормально, но если его скопировать, то он скопируется перевёрнутым :)
Так можно защититься от копипастеров, а от граберов прийдётся прятать этот символ куда нибудь...

На своём сайте, в качестве защиты от копипастеров добавил сообщение об авторских правах,
которое появляется не чаще 1 раза в сутки, при попытке скопировать текст с сайта,
а так же скрипт записывает в БД кто и откуда скопировал информацию (какую именно получается реализовать не во всех браузерах)

Есть ещё способ, который поможет защититься как от граберов так и от копипастеров, но помоему это самый наихудший выход из ситуации, которым мы спрячем текст даже от поисковых ботов, что не есть хорошо. Суть метода, выводить весь текст картинками, причём каждое слово отдельной картинкой (можно и каждую букву, но это проще будет сграбить).

Либо вместо текста вставить флешку, которая уже будет выводить текст, хотя флешка всё равно должна будет его откуда то взять, но там уже можно использовать какой нибудь метод шифрования, врядли ктото будет копаться... А некоторые поисковые боты, например гугл, уже научились работать с текстом во флешках.
 

Архангел66

Самец :)
Поищи по ключевому слову "google alert" вроде интересная идея... недавно натнулся случайно, ещё не тестировал.
 

DarkByte

Ословед
можно на хост zend повешать, вроде он, судя по описанию, может изолированно исходник контента обфусцировать - вариант для параноиков
Насколько я помню zend шифрует php скрипты, чтобы например при продаже не смогли посмотреть\модифицировать исходный код, сомневаюсь что оно тут чем то сможет помочь...
 
Сверху