Brutkey

Half-Illithid Og
@jussi_og@mementomori.social

Edelliseen buustaukseen liittyen. Mikä mementomorin tilanne instanssina on tässä Metan scraping-jutussa ja vastaavanlaisissa tapauksissa, @rolle@mementomori.social? Tällaisena ei-teknisenä tyyppinä tulee tietenkin mieleen, onko tällaisille asioille ylipäänsä tehtävissä mitään, vai täytyykö vain alistua siihen, että nuo epäeettiset jätit tekevät mitä haluavat.

Jakke Lehtonen
@jagster@kvarkki.nexus

@jussi_og@mementomori.social @magdalenahai@mstdn.social @rolle@mementomori.social En tiedä mitä mementomorissa tehdään, mutta jos Meta on käyttänyt tunnistettavaa user agentia, niin sen estäminen on täysin triviaalia.

Ja haluaisin alleviivata, että tässä keskitytään nyt täysin turhaan Metaan. Pitäisi melskata siitä, että botit ja spiderit ovat koko ajan käyneet sisältöä läpi. Ei tässä ole mitään uutta. Eikä tämän julkituoneilla olekaan agendana se, että botti menee sisältöä läpi, vaan Meta. Eikä siinä mitään, Metaa saakin potkia päähän.

Mutta silti saisi kysyä, että mistä Google on saanut koulutusmateriaalinsa. Tai Amazon. Tai miksi tämä olisi tekijänoikeudellisesti suurempi juttu kuin OpenAI (ei se olekaan, vaan että on tarkoituksenmukaista repiä otsikoita Metasta, ei varsinaisesta asiasta).


Janne Pekkala
@jannepekkala@mementomori.social

@jagster@kvarkki.nexus @jussi_og@mementomori.social @magdalenahai@mstdn.social @rolle@mementomori.social agentin esto robots.txt tiedostolla on trivialia, mutta yhtä triviaalia on, että se kierretään. Käytännössä hakukoneiden virallisia hämähäkkejä lukuunottamatta, taitaa olla jo enemmän sääntö, kuin poikkeus, että nuo hämikset yrittää naamioida itsensä peruskäyttäjiksi ja jopa vaihtavat selainta (agentti) ja yhteyttä (ip-osoite) kesken toimintansa. Juurikin sen vuoksi, että pääsevat tuon "esteen" ohitse. Kyllähän sitten on cloudflare ja muut ddos-sinkholet, joilla sitä voi myös estää, mutta se on ihan samaa kilpajuoksua.