Skip to content
  • Categories
  • Recent
  • Tags
  • Popular
  • World
  • Users
  • Groups
Skins
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • Default (No Skin)
  • No Skin
Collapse

FòrumCAT

  1. Home
  2. Uncategorized
  3. #Amazon és el bot més agressiu a l'hora xafardejar mastodont.cat:

#Amazon és el bot més agressiu a l'hora xafardejar mastodont.cat:

Scheduled Pinned Locked Moved Uncategorized
amazonscraping
9 Posts 5 Posters 0 Views
  • Oldest to Newest
  • Newest to Oldest
  • Most Votes
Reply
  • Reply as topic
Log in to reply
This topic has been deleted. Only users with topic management privileges can see it.
  • spla@mastodont.catS This user is from outside of this forum
    spla@mastodont.catS This user is from outside of this forum
    spla@mastodont.cat
    wrote last edited by spla@mastodont.cat
    #1

    #Amazon és el bot més agressiu xafardejant mastodont.cat en un dia

    cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" |wc -l
    18473

    18.473 "escrapejades" en total, principalment enllaços a mitjans externs però:

    cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/@" | wc -l
    907
    o sigui, 907 intents d'obtenir tuts de diversos usuaris.

    cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/tags" | wc -l
    271 -> tuts d'etiquetes

    #scraping

    caelumtangi@mastodont.catC spla@mastodont.catS maquinari_cat@mastodon.socialM worr@mastodont.catW 4 Replies Last reply
    1
    0
    • spla@mastodont.catS spla@mastodont.cat

      #Amazon és el bot més agressiu xafardejant mastodont.cat en un dia

      cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" |wc -l
      18473

      18.473 "escrapejades" en total, principalment enllaços a mitjans externs però:

      cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/@" | wc -l
      907
      o sigui, 907 intents d'obtenir tuts de diversos usuaris.

      cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/tags" | wc -l
      271 -> tuts d'etiquetes

      #scraping

      caelumtangi@mastodont.catC This user is from outside of this forum
      caelumtangi@mastodont.catC This user is from outside of this forum
      caelumtangi@mastodont.cat
      wrote last edited by
      #2

      @spla fem una etiqueta exclusivament per aquest bot, i l' insultem! 😅

      spla@mastodont.catS 1 Reply Last reply
      0
      • caelumtangi@mastodont.catC caelumtangi@mastodont.cat shared this topic
      • caelumtangi@mastodont.catC caelumtangi@mastodont.cat

        @spla fem una etiqueta exclusivament per aquest bot, i l' insultem! 😅

        spla@mastodont.catS This user is from outside of this forum
        spla@mastodont.catS This user is from outside of this forum
        spla@mastodont.cat
        wrote last edited by
        #3

        @Caelumtangi 😅

        1 Reply Last reply
        0
        • spla@mastodont.catS spla@mastodont.cat

          #Amazon és el bot més agressiu xafardejant mastodont.cat en un dia

          cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" |wc -l
          18473

          18.473 "escrapejades" en total, principalment enllaços a mitjans externs però:

          cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/@" | wc -l
          907
          o sigui, 907 intents d'obtenir tuts de diversos usuaris.

          cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/tags" | wc -l
          271 -> tuts d'etiquetes

          #scraping

          spla@mastodont.catS This user is from outside of this forum
          spla@mastodont.catS This user is from outside of this forum
          spla@mastodont.cat
          wrote last edited by spla@mastodont.cat
          #4

          Des de les 7 de la tarda d'ahir, #fail2ban està bloquejant automàticament totes les IPs de bots xafarders, no només Amazonbot. Ara mateix ja ha bloquejat un total de 1.171 IP, bloqueig actiu de 327.
          Edito: cap robot obté res de mastodont.cat, només "veuen" que s'ha interromput la connexió gràcies a una configuració específica de nginx (el programari que serveix continguts).

          #scraping #BotsXafarders

          4 1 Reply Last reply
          0
          • spla@mastodont.catS spla@mastodont.cat

            #Amazon és el bot més agressiu xafardejant mastodont.cat en un dia

            cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" |wc -l
            18473

            18.473 "escrapejades" en total, principalment enllaços a mitjans externs però:

            cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/@" | wc -l
            907
            o sigui, 907 intents d'obtenir tuts de diversos usuaris.

            cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/tags" | wc -l
            271 -> tuts d'etiquetes

            #scraping

            maquinari_cat@mastodon.socialM This user is from outside of this forum
            maquinari_cat@mastodon.socialM This user is from outside of this forum
            maquinari_cat@mastodon.social
            wrote last edited by
            #5

            @spla Repassa la rotació de logs, no sigui que de tant bloquejar t'ompli el disc de porquería 😀

            spla@mastodont.catS 1 Reply Last reply
            0
            • maquinari_cat@mastodon.socialM maquinari_cat@mastodon.social

              @spla Repassa la rotació de logs, no sigui que de tant bloquejar t'ompli el disc de porquería 😀

              spla@mastodont.catS This user is from outside of this forum
              spla@mastodont.catS This user is from outside of this forum
              spla@mastodont.cat
              wrote last edited by
              #6

              @maquinari_cat és automàtica des de sempre 💪

              1 Reply Last reply
              0
              • spla@mastodont.catS spla@mastodont.cat

                #Amazon és el bot més agressiu xafardejant mastodont.cat en un dia

                cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" |wc -l
                18473

                18.473 "escrapejades" en total, principalment enllaços a mitjans externs però:

                cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/@" | wc -l
                907
                o sigui, 907 intents d'obtenir tuts de diversos usuaris.

                cat /var/log/nginx/mastodont.cat.access.log.1 | grep "Amazonbot" | grep "/tags" | wc -l
                271 -> tuts d'etiquetes

                #scraping

                worr@mastodont.catW This user is from outside of this forum
                worr@mastodont.catW This user is from outside of this forum
                worr@mastodont.cat
                wrote last edited by
                #7

                @spla Has pensat en Anubis per bloquejar els bots? Diferents projects de FOSS l'ha trobat molt efectiu

                (i una nota: es diu "scraping," no "scrapping." "scrapping" vol dir una cosa completament diferent)

                spla@mastodont.catS 1 Reply Last reply
                0
                • worr@mastodont.catW worr@mastodont.cat

                  @spla Has pensat en Anubis per bloquejar els bots? Diferents projects de FOSS l'ha trobat molt efectiu

                  (i una nota: es diu "scraping," no "scrapping." "scrapping" vol dir una cosa completament diferent)

                  spla@mastodont.catS This user is from outside of this forum
                  spla@mastodont.catS This user is from outside of this forum
                  spla@mastodont.cat
                  wrote last edited by spla@mastodont.cat
                  #8

                  @worr vaig estar mirant Anubis però no sé com s'integraria amb un servidor Mastodon, no crec que agradi massa veure la pàgina de verificació d'Anubis abans de veure el contingut que es vol.
                  Gràcies per la correcció a "scraping"!

                  1 Reply Last reply
                  0
                  • spla@mastodont.catS spla@mastodont.cat

                    Des de les 7 de la tarda d'ahir, #fail2ban està bloquejant automàticament totes les IPs de bots xafarders, no només Amazonbot. Ara mateix ja ha bloquejat un total de 1.171 IP, bloqueig actiu de 327.
                    Edito: cap robot obté res de mastodont.cat, només "veuen" que s'ha interromput la connexió gràcies a una configuració específica de nginx (el programari que serveix continguts).

                    #scraping #BotsXafarders

                    4 This user is from outside of this forum
                    4 This user is from outside of this forum
                    4n0n1m8@mastodont.cat
                    wrote last edited by
                    #9

                    @spla

                    1 Reply Last reply
                    0
                    Reply
                    • Reply as topic
                    Log in to reply
                    • Oldest to Newest
                    • Newest to Oldest
                    • Most Votes


                    • Login

                    • First post
                      Last post
                    0
                    • Categories
                    • Recent
                    • Tags
                    • Popular
                    • World
                    • Users
                    • Groups