Skip to content
  • Categories
  • Recent
  • Tags
  • Popular
  • World
  • Users
  • Groups
Skins
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • Default (No Skin)
  • No Skin
Collapse

FòrumCAT

  1. Home
  2. Uncategorized
  3. Molts tuts denunciant l'scrapping de #Meta però el bot que fa l'scrapping més agressiu és el de Amazon:

Molts tuts denunciant l'scrapping de #Meta però el bot que fa l'scrapping més agressiu és el de Amazon:

Scheduled Pinned Locked Moved Uncategorized
metascraping
5 Posts 3 Posters 0 Views
  • Oldest to Newest
  • Newest to Oldest
  • Most Votes
Reply
  • Reply as topic
Log in to reply
This topic has been deleted. Only users with topic management privileges can see it.
  • spla@mastodont.catS This user is from outside of this forum
    spla@mastodont.catS This user is from outside of this forum
    spla@mastodont.cat
    wrote last edited by spla@mastodont.cat
    #1

    Molts tuts denunciant l'scraping de #Meta però el bot que fa l'scraping més agressiu és el de Amazon:

    grep 'meta-externalagent' /var/log/nginx/mastodont.cat.access.log | awk '{print $1}' | wc -l
    857
    grep 'Amazonbot' /var/log/nginx/mastodont.cat.access.log | awk '{print $1}' | wc -l
    11823
    En el que portem de dia, Meta ha fet 857 "scraps" però Amazon 11.823.

    #scraping

    xorsch@mastodont.catX jolupa@misskey.canpavon.catJ 2 Replies Last reply
    0
    • spla@mastodont.catS spla@mastodont.cat

      Molts tuts denunciant l'scraping de #Meta però el bot que fa l'scraping més agressiu és el de Amazon:

      grep 'meta-externalagent' /var/log/nginx/mastodont.cat.access.log | awk '{print $1}' | wc -l
      857
      grep 'Amazonbot' /var/log/nginx/mastodont.cat.access.log | awk '{print $1}' | wc -l
      11823
      En el que portem de dia, Meta ha fet 857 "scraps" però Amazon 11.823.

      #scraping

      xorsch@mastodont.catX This user is from outside of this forum
      xorsch@mastodont.catX This user is from outside of this forum
      xorsch@mastodont.cat
      wrote last edited by
      #2

      @spla

      Deu ni do ... han d'estar generant mes tràfic que el porno i l'spam junts.

      Com no existeixi un mecanisme per fer una denúncia dels fets i tingui conseqüències reals, els que tinguin serveis exposats ho patireu.

      Són com atacs DDOS legals?

      spla@mastodont.catS 1 Reply Last reply
      0
      • xorsch@mastodont.catX xorsch@mastodont.cat

        @spla

        Deu ni do ... han d'estar generant mes tràfic que el porno i l'spam junts.

        Com no existeixi un mecanisme per fer una denúncia dels fets i tingui conseqüències reals, els que tinguin serveis exposats ho patireu.

        Són com atacs DDOS legals?

        spla@mastodont.catS This user is from outside of this forum
        spla@mastodont.catS This user is from outside of this forum
        spla@mastodont.cat
        wrote last edited by spla@mastodont.cat
        #3

        @xorsch aquest mati he activat una configuració de nginx que els hi planta cara, quan intenten l'scrap no obtenen res, només que la connexió s'ha tallat.
        Sí, seria com un DDOS, potser alegal?

        1 Reply Last reply
        0
        • spla@mastodont.catS spla@mastodont.cat

          Molts tuts denunciant l'scraping de #Meta però el bot que fa l'scraping més agressiu és el de Amazon:

          grep 'meta-externalagent' /var/log/nginx/mastodont.cat.access.log | awk '{print $1}' | wc -l
          857
          grep 'Amazonbot' /var/log/nginx/mastodont.cat.access.log | awk '{print $1}' | wc -l
          11823
          En el que portem de dia, Meta ha fet 857 "scraps" però Amazon 11.823.

          #scraping

          jolupa@misskey.canpavon.catJ This user is from outside of this forum
          jolupa@misskey.canpavon.catJ This user is from outside of this forum
          jolupa@misskey.canpavon.cat
          wrote last edited by
          #4

          @spla@mastodont.cat Gràcies a deu no tinc la visita de cap bot, ni a Misskey ni al bloc. Al robots.txt tinc prohibit que cap bot, sigui el que sigui faci res. I aquest mati he posat les regles al Nginx per si de cas... Mai se sap... Sort amb aquesta lluita!

          spla@mastodont.catS 1 Reply Last reply
          0
          • jolupa@misskey.canpavon.catJ jolupa@misskey.canpavon.cat

            @spla@mastodont.cat Gràcies a deu no tinc la visita de cap bot, ni a Misskey ni al bloc. Al robots.txt tinc prohibit que cap bot, sigui el que sigui faci res. I aquest mati he posat les regles al Nginx per si de cas... Mai se sap... Sort amb aquesta lluita!

            spla@mastodont.catS This user is from outside of this forum
            spla@mastodont.catS This user is from outside of this forum
            spla@mastodont.cat
            wrote last edited by
            #5

            @jolupa gràcies! 💪

            1 Reply Last reply
            0
            Reply
            • Reply as topic
            Log in to reply
            • Oldest to Newest
            • Newest to Oldest
            • Most Votes


            • Login

            • First post
              Last post
            0
            • Categories
            • Recent
            • Tags
            • Popular
            • World
            • Users
            • Groups