Looks like we will join the AI hype train, baby! So to start, let's talk about poisoning AI, and how we can brew something. Did I grab your attention?
Looks like we will join the AI hype train, baby! So to start, let's talk about poisoning AI, and how we can brew something. Did I grab your attention?
Fins a 658 diferents IP del robot d'Apple (Applebot/0.1; +http://www.apple.com/go/applebot) estan llistades en el log de nginx però no intenten xafardejar ni tuts, ni enllaços ni res, només miren robots.txt a veure si tenen permís per fer-ho.
When you block the @internetarchive because it's is no the IA, but AI companies who violate platform policies ... and then:
"Reddit struck a deal with Google for both Google Search and AI training data early last year, and a few months later, it started blocking major search engines from crawling its data unless they pay. "
https://www.theverge.com/news/757538/reddit-internet-archive-wayback-machine-block-limit
Is Meta Scraping the Fediverse for AI?
Is a large corporate entity scraping a community-run open social network to train AI models for profit?
https://wedistribute.org/2025/08/is-meta-scraping-the-fediverse-for-ai/
WordPress asset leaking: It's easy to download any asset uploaded to WordPress, even if it's not published
https://lars.ingebrigtsen.no/2025/08/10/dont-upload-secret-files-to-wordpress/
#wordpress #security #scraping #privacy #-
Per el que estic veient hi ha dos patrons:
- el bot de #Meta intenta obtenir imatges tant dels avatars com de les capçaleres de perfils i també emojis
- el bot de Amazon i DataForSeoBot intenten obtenir els enllaços a articles de mitjans.
El bot de Amazon ha fet peticions a mastodont.cat des de 433 IP diferents, això només avui:
grep 'Amazonbot/0.1' /var/log/nginx/mastodont.cat.access.log | awk '{print $1}' | sort -u | wc -l
433
Es cansarà de no rebre res?
Oberlandesgericht Dresden, Beschluss vom 24.06.2025, 4 U 424-25: Kontrollverlust und Schadenersatz bei Datenschutzverstößen: Ausschluss durch eigene Datenpublikation. #Scraping #Soziale #Netzwerke #Schadensersatz #Immaterieller #Schaden #teamdatenschutz #dsgvoportal https://www.dsgvo-portal.de/gerichtsentscheidungen/2025-06-24-OLGDD-4-U-424-25-Scraping-Soziale-Netzwerke-Schadensersatz-Immaterieller-Schaden-2402.php
Oberlandesgericht Schleswig, Urteil vom 20.03.2025, 5 U 96-23: Schadensersatz- und Unterlassungsanspruch bei Scraping von personenbezogenen Daten. #Schadensersatz #Immaterieller #Schaden #Soziale #Netzwerke #Scraping #teamdatenschutz #dsgvoportal https://www.dsgvo-portal.de/gerichtsentscheidungen/2025-03-20-OLGSCH-5-U-96-23-Schadensersatz-Immaterieller-Schaden-Soziale-Netzwerke-Scraping-2397.php
Landgericht Erfurt, Beschluss vom 03.04.2025, 8 O 895-23: Vorlagebeschluss wegen Zweifeln an der Schadensannahme bei bloßem Kontrollverlust. #Scraping #Schadensersatz #Immaterieller #Schaden #Soziale #Netzwerke #teamdatenschutz #dsgvoportal https://www.dsgvo-portal.de/gerichtsentscheidungen/2025-04-03-LGERF-8-O-895-23-Scraping-Schadensersatz-Immaterieller-Schaden-Soziale-Netzwerke-2392.php
Oberlandesgericht Köln, Urteil vom 03.04.2025, 15 U 41-23: Schadensersatzanspruch wegen Scraping. #Scraping #Schadensersatz #Immaterieller #Schaden #Soziale #Netzwerke #teamdatenschutz #dsgvoportal https://www.dsgvo-portal.de/gerichtsentscheidungen/2025-04-03-OLGK-15-U-41-23-Scraping-Schadensersatz-Immaterieller-Schaden-Soziale-Netzwerke-2391.php
Capitalism's only skill is to steal the work of others and further exploit the working class!
Perplexity is allegedly scraping websites it's not supposed to, again
'AI startup Perplexity is crawling and scraping content from websites that have explicitly indicated they don’t want to be scraped, according to internet infrastructure provider Cloudflare.'
AI site Perplexity uses “stealth tactics” to flout no-crawl edicts, Cloudflare says - AI search engine Perplexity is using stealth bots and other ... - https://arstechnica.com/information-technology/2025/08/ai-site-perplexity-uses-stealth-tactics-to-flout-no-crawl-edicts-cloudflare-says/ #robots.txt #security #scraping #biz #ai
Oberlandesgericht Köln, Urteil vom 03.04.2025, 15 U 40-23: Schadensersatzanspruch wegen Scraping. #Scraping #Schadensersatz #Soziale #Netzwerke #Telefonnummer #teamdatenschutz #dsgvoportal https://www.dsgvo-portal.de/gerichtsentscheidungen/2025-04-03-OLGK-15-U-40-23-Scraping-Schadensersatz-Soziale-Netzwerke-Telefonnummer-2388.php
Oberlandesgericht Frankfurt a.M., Urteil vom 08.04.2025, 6 U 79-23: Schadenersatz nach Datenscraping wegen Kontrollverlust und Missbrauchsbefürchtungen. #Soziale #Netzwerke #Schadensersatz #Scraping #Datenminimierung #teamdatenschutz #dsgvoportal https://www.dsgvo-portal.de/gerichtsentscheidungen/2025-04-08-OLGFFM-6-U-79-23-Soziale-Netzwerke-Schadensersatz-Scraping-Datenminimierung-2386.php
Oberlandesgericht Koblenz, Urteil vom 20.05.2025, 4 U 779-23: Ansprüche nach Daten-Scraping. #Scraping #Soziale #Netzwerke #Telefonnummer #Schadensersatz #teamdatenschutz #dsgvoportal https://www.dsgvo-portal.de/gerichtsentscheidungen/2025-05-20-OLGKO-4-U-779-23-Scraping-Soziale-Netzwerke-Telefonnummer-Schadensersatz-2383.php
Oberlandesgericht Hamm, Urteil vom 04.06.2025, I-11 U 152-24: Keine Ansprüche nach Daten-Scraping ohne Kontrollverlust über die Daten. #Soziale #Netzwerke #Schadensersatz #Immaterieller #Schaden #Scraping #teamdatenschutz #dsgvoportal https://www.dsgvo-portal.de/gerichtsentscheidungen/2025-06-04-OLGH-I-11-U-152-24-Soziale-Netzwerke-Schadensersatz-Immaterieller-Schaden-Scraping-2379.php
Oberlandesgericht München, Urteil vom 06.06.2025, 36 U 1891-24 e: Ansprüche nach Scraping-Vorfall. #Schadensersatz #Immaterieller #Schaden #Soziale #Netzwerke #Scraping #teamdatenschutz #dsgvoportal https://www.dsgvo-portal.de/gerichtsentscheidungen/2025-06-06-OLGM-36-U-Schadensersatz-Immaterieller-Schaden-Soziale-Netzwerke-Scraping-2378.php
ArchiveBox, ett öppet verktyg för arkivering
https://oppetmoln.se/20250728/archivebox-ett-oppet-verktyg-for-arkivering