Back to Question Center
0

Raspat web: Bons bons i dolents - Explicació Semalt

1 answers:

Els bots representen prop del 55% de tot el trànsit web. Significa que la major part del trànsit del vostre lloc web prové dels robots d'Internet en lloc dels éssers humans. Un bot és l'aplicació de programari que s'encarrega d'executar tasques automatitzades en el món digital. Els robots normalment realitzen tasques repetitives a gran velocitat i són sobretot indesitjables per l'ésser humà. Són responsables de petits llocs de treball que solem donar per descomptat, incloent-hi la indexació dels motors de cerca, el seguiment de la salut del lloc web, la mesura de la velocitat, l'alimentació de les API i la recuperació del contingut web. Els bots també s'utilitzen per automatitzar l'auditoria de seguretat i escanejar els vostres llocs per trobar vulnerabilitats, remediándolos a l'instant.

Explorant la diferència entre els bons i els malos:

Els robots es poden dividir en dues categories diferents, bons motius i bots dolents. Els bons robots visiten els vostres llocs i ajuden els motors de cerca a rastrejar diferents pàgines web. Per exemple, Googlebot rastreja molts llocs web als resultats de Google i ajuda a descobrir noves pàgines web a Internet. Utilitza algorismes per avaluar quins blocs o llocs web s'han de rastrejar, la freqüència amb que s'ha de fer el rastreig i quantes pàgines s'han indexat fins ara. Els robots dolents són els responsables de realitzar tasques malicioses, incloent-hi el raspat del lloc web, comentaris spam i atacs DDoS. Representen més del 30 per cent de tot el trànsit a Internet..Els hackers executen els bots malament i realitzen una varietat de tasques malicioses. Exploren milions a milers de milions de pàgines web i tenen com a objectiu robar o esborrar contingut de manera il·legal. També consumeixen l'ample de banda i cerquen contínuament els connectors i el programari que es poden utilitzar per penetrar en els vostres llocs web i bases de dades.

Quin és el mal?

En general, els motors de cerca veuen el contingut raspat com a contingut duplicat. És perjudicial per als rànquings del vostre motor de cerca i els rascades capturen els vostres feeds RSS per accedir-hi i tornar a publicar el vostre contingut. Guanyen molts diners amb aquesta tècnica. Malauradament, els motors de cerca no han implementat cap manera de desfer-se dels bots dolents. Això significa que si el vostre contingut es copia i es penja amb regularitat, el rànquing del vostre lloc es fa malbé en poques setmanes. Els motors de cerca penalitzen els llocs que contenen contingut duplicat i no poden reconèixer quina pàgina web va publicar per primera vegada una part del contingut.

No tot el raspat web és dolent

Hem d'admetre que el raspat no sempre és perjudicial i maliciós. És útil per als propietaris de llocs web quan vulguin difondre les dades a tantes persones com sigui possible. Per exemple, els llocs del govern i els portals de viatges proporcionen dades útils per al públic en general. Aquest tipus de dades solen estar disponibles a través de les API, i els raspadors s'utilitzen per recollir aquestes dades. De cap manera, és perjudicial per al vostre lloc web. Fins i tot quan esborreu aquest contingut, no deteriorarà la reputació del vostre negoci en línia.

Un altre exemple de rascades autèntiques i legítimes són llocs d'agregació com ara portals de reserves d'hotels, llocs d'entrades de concerts i punts de venda. Els robots que s'encarreguen de distribuir el contingut d'aquestes pàgines web obtenen dades a través de les API i esborreu segons les seves instruccions. Pretén impulsar el trànsit i extreure informació per a administradors web i programadors.

December 14, 2017
Raspat web: Bons bons i dolents - Explicació Semalt
Reply