Остъргването на съдържанието (известен още като изстъргване на уеб, събиране на уеб, извличане на уеб данни и др.) е процедурата за копиране на данни от уебсайт. "Скреперите" (чистачки) съдържание са хората или софтуерът, които копират данните. Уеб изстъргването не е лошо нещо.

Всъщност всички уеб браузъри са основно скрепери на съдържание. Има много легитимни цели за извършване на изстъргване на съдържание, като например уеб индексиране за търсачки, например.

Вижте статията ни на Как да спрем Google да индексира вашия блог на WordPress

Истинската загриженост е дали драскачите на съдържанието на вашия уебсайт са вредни или не. Състезателите може да искат да откраднат съдържанието ви и го публикуват като принадлежащ на тях. Ако можете да кажете на законни потребители от лоши момчета, имате по-голям шанс да се защитите. Тази статия обяснява основите на изстъргването в мрежата, както и някои методи за да се отървете от него (или поне да намалят тяхното значение).

Но преди, ако никога не сте инсталирали WordPress открийте Как да инсталирате a WordPress блог в 7 стъпки et Как да се намери, инсталиране и активиране на WordPress тема на вашия блог 

След това обратно към защо сме тук.

Видове скрепери със съдържание

Има много различни начини за изтегляне на съдържание за изтегляне на данни. Важно е да знаете различните методи и технологията, която използват. Методите варират от ниски технологии (ръчно копиране и поставяне на съдържание) до сложни роботи (автоматизиран софтуер, способен да симулира човешка дейност в браузър). Ето обобщение на това, което може да трябва да направите:

  • Паяците: Обхождането на мрежата е голяма част от начина, по който работят скреперите на съдържание. Паяк като Googlebot ще започне с избирането на една уеб страница и преминаване от връзка към връзка, за да изтеглите уеб страници.
  • Shell скриптове: Можете да използвате Linux Shell за създаване на скрепери за съдържание със скриптове като GNU Wget за изтегляне на съдържание.
  • HTML скрепер: те са подобни на скриптове на черупки. Този тип скрепер е много разпространен. Той работи, като получава HTML структурата на уебсайт за намиране на данни.
  • Екрани на изглед: Стъклочистачката е програма, която улавя данни от уебсайт, имитирайки поведението на човешки потребител, който използва компютър за сърфиране в Интернет.
  • Човешко копие: Тук човек ръчно копира съдържание от вашия уебсайт. Ако някога сте публикували онлайн, може би сте забелязали, че плагиатството е широко разпространено. След като първоначалното ласкателство изчезне, реалността, че някой печели от вашата работа, се вписва.

Има няколко начина да направите същото. Изброените по -горе категории скрепери не са изчерпателен списък. Освен това има много припокриване между категориите.

Прочетете и нашата статия Как и защо да провеждате качествен одит на съдържанието си

Как да защитим блога си

1. Ограничаване и блокиране на скоростта

Можете да се борите с много ботове, като първо откриете проблема. Типично е за автоматизиран робот да спам вашия сървър с изключително голям брой заявки. Регулирането на скоростта, както подсказва името, ограничава сървърните заявки от отделен клиент, като задава правило.

Можете да правите неща като измерване на милисекундите между заявките. Ако взаимодействието с вашия уеб сайт е твърде бързо, тогава знаете, че това е бот. След това блокирайте този IP адрес. Можете да блокирате IP адресите въз основа на редица критерии, включително страната им на произход.

2. Регистрация и връзка

Регистрация и вход са популярен начин да държите съдържанието далеч от любопитни очи. Можете да възпрепятствате напредъка на роботите. Всичко, което трябва да направите, е да обвържете достъпа до вашето съдържание с връзка. Тук важат основите на сигурността на връзката. Имайте предвид, че страниците, изискващи регистрация и вход, няма да бъдат индексирани от търсачките.

3. Меденки и неверни данни

В компютърната наука „медените съдове“ са виртуални ужилващи операции. Закръглявате потенциалните нападатели, като поставяте капани с меден съд, за да откриете трафик от скрепери за съдържание. Има безброй начини да направите това.

Например можете да добавите невидима връзка към вашата уеб страница. След това създайте алгоритъм, който блокира IP адреса на клиента, който е щракнал върху връзката. По-сложните медни съдове могат да бъдат трудни за създаване и поддръжка. Добрата новина е, че има много проекти с отворен код Honeypot. Вижте това страхотно списък на страхотни медни съдове на github.

4. Използвайте CAPTCHA

Captcha означава „ Напълно автоматизирана обществено Тюринг тест, за да кажа, Компютри и хора Апарт основно, тест за разграничаване на хора от роботи. Captcha може да бъде скучен, но също така е полезен. Можете да използвате, за да блокирате области, които смятате, че бот може да иска да насочи, като бутон за имейл на вашия Формуляр за връзка. В WordPress има много добри плъгини за Captcha, включително „ Captcha От Jetpack.

Открийте и някои премиум приставки за WordPress  

Можете да използвате други WordPress плъгини за да придадете модерен външен вид и да оптимизирате работата с вашия блог или уебсайт.

Предлагаме ви тук няколко премиум WordPress приставки, които ще ви помогнат да направите това.

1. Лента за арформи

ARForms има ново разширение, което приема плащания през шлюза за плащане Stripe. Нарича се „ARForms Stripe“. Последният интегрира входящите форми и плащанията в един процес.

Можете да клиенти на сметки с динамична сума веднага след подаване на формуляра ARForms.

Прочетете и нашата статия Как да използвате Stripe на WooCommerce и Easy Digital Download

Просто трябва да създадете формуляр с ARForms, да го конфигурирате с Stripe и всичко е готово! Можете да зададете плащане от Stripe за нула време.

Изтегляне | демонстрация | уеб хостинг

2. AX социален поток

Ако желаете показват множество емисии на социални медии на вашия уебсайт, след това приставката WordPress социален съвет ще ви позволи да направите това, като ви предостави шест начина за преглед на активността на вашия акаунт. Ще се възползвате и от поддръжка за 17 социални мрежи и няколко персонализирани оформления.

Характеристиките му са наред с останалите: 6 различни режима на показване на емисии, поддръжка за голяма част от социалните мрежи, напълно отзивчиво оформление поддръжка за рекламни банери, Многоезична поддръжка, мениджър на теми, подробна документация и др ...

Изтегляне | демонстрация | уеб хостинг

3. Интерактивни световни карти

Интерактивните карти на света ви помагат да създавате колкото искате геолокационни карти, континенти, държави или региони ... и това с интерактивни и цветни маркери.

Той е съвместим с най-новите версии на WordPress и пасва идеално на Приставка за Visual Composer.

Открийте нашите 8 WordPress плъгини, за да персонализирате външния вид на вашия уеб сайт

Благодарение на Интерактивните карти на света ще можете да покажете няколко типа региони като: карта на целия свят, континент или субконтинент, държава и много други.

Изтегляне демонстрация | уеб хостинг

Други препоръчани ресурси

Също така ви каним да се консултирате с ресурсите по-долу, за да отидете по-далеч в управлението на вашия уебсайт и блог.

Заключение

Има! Това е всичко за този урок, надявам се, че ще ви помогне да създадете практичен списък със задачи, за да защитите ефективно WordPress блогНе се колебайте да го направите споделете съвета с приятелите си в социалните си мрежи.

Ще можете обаче да се консултирате с нас грабене на ресурси, ако имате нужда от повече елементи, за да осъществите вашите проекти за създаване на интернет сайтове, като се консултирате с нашето ръководство за Създаване на блог на WordPress.

Но междувременно ни кажете за вашите Връзка и предложения в специалния раздел.

... 

Тя ПИН на Pinterest