avec cette remarque “Il y a néanmoins un risque de faux positifs, d’où la présence d’une liste d’exception et la possibilité pour tout un chacun d’en ajouter manuellement”
J’avoue que je n’ai pas spécialement prêté attention à ça, et je crois que j’ai ce site dans mes flux depuis longtemps (il s’appelait Toolinux avant, dans le giron du groupe Linagora). Je ne sais pas depuis quand il “serait généré par IA”. Du coup ce serait lui même une sorte d’aggrégateur généré automatiquement (par IA) ? On peut aussi se poser la question de savoir comment fonctionne l’extension utilisée pour détecter cela. Et puis quand bien même, l’IA pourrait parfois être utile … Le mieux serait de contacter le site et de leur poser la question (je ne promets rien , mais la personne qui l’a signalé peut peut être investiguer de son côté ?)
Bonjour,
Cet article ne sera pas promu car il est en anglais ! Seuls les articles FR qui concernent l’informatique autour des LL/FLoSS sont permis. À moins que je ne me trompe…
En fait, l’URL que j’avais soumise était celle qui laisse apache servir la version FR ou EN en fonction des en-têtes fournies par le visiteur. Il suit Accept-Language sauf si un cookie prend la priorité (le cookie est mis lorsqu’on regarde une version en particulier).
Mais effectivement, pour être sûr de tomber sur la VF, c’est celle en index.fr.html qu’il faut utiliser (et c’est donc celle-ci que je soumettrai la prochaine fois).
Par le biais de F-Droid, tu as le magasin d’app nommé “Neo Store”…
Par ce biais, la version Android de Freetube est installable sur les smartphones ad hoc ;)
J’ai eu plus de chances avec moins de requêtes par minute mais poste filtrage par user-agent (qui date de plusieurs semaines), quasi 100% des IP appartiennent à Alibaba.
Perso j’ai constaté la même chose que Dryusdan sur pas mal de mes infra… Si bien que j’ai du développer un outil pour bloquer tout ça.
Sinon concernant le reste :
“aucune IA digne de ce nom et commerciale ne se fait passer pour un Windows 95” : si, on a plein d’exemples comme ça, mais en tant qu’adminsys c’est vrai qu’on passe pas notre temps à poster nos logs en ligne, mais il y a des bases de partages si besoin.
“une attaque par déni de service distribué, ça n’a rien à voir avec du scraping” : Alors en fait si, de plus en plus d’ailleurs, par exemple j’ai eu le cas (moi aussi sur ma forge git, quel hasard) de crawlers IA qui venaient sur mon infra avec pas moins de 70 000 IP différentes qui faisaient chacune 1 ou 2 requêtes seulement. Surement pour ne pas être banni facilement (c’est loupé eheh).
“Mais comme il y a un ennemi commun (l’IA)” : Non, l’ennemi commun ce sont les humains qui font de l’IA absurde (et capitaliste à outrance) comme ça et pourrissent le web, ces nécromanciens du rêve sont juste néfastes et seront bloqués et ridiculisés autant que possible.
Si les IA étaient dignes de ce nom, elles respecteraient les robots.txt, scraperaient à un rythme décent et on aurait pas besoin d’avoir 15 000 articles qui expliquent comment les bloquer malgré leurs contournements des blocages, déjà…
Le simple fait que vous ayez fait un article « arrêtez de bloquer les IA » est déjà une preuve que les entreprises faisant de l’IA font n’importe quoi et ne sont donc pas dignes de confiance. Parce que si elles l’étaient, la question ne se poserait pas, le trafic serait passé inaperçu pour la plupart des gens.
Le site qui parle de l’extension : https://next.ink/187365/actualites-generees-par-ia-notre-extension-signale-plus-de-4-000-sites/
avec cette remarque “Il y a néanmoins un risque de faux positifs, d’où la présence d’une liste d’exception et la possibilité pour tout un chacun d’en ajouter manuellement”
J’avoue que je n’ai pas spécialement prêté attention à ça, et je crois que j’ai ce site dans mes flux depuis longtemps (il s’appelait Toolinux avant, dans le giron du groupe Linagora). Je ne sais pas depuis quand il “serait généré par IA”. Du coup ce serait lui même une sorte d’aggrégateur généré automatiquement (par IA) ? On peut aussi se poser la question de savoir comment fonctionne l’extension utilisée pour détecter cela. Et puis quand bien même, l’IA pourrait parfois être utile … Le mieux serait de contacter le site et de leur poser la question (je ne promets rien , mais la personne qui l’a signalé peut peut être investiguer de son côté ?)
A+
Site d’informations généré par IA.
Bonjour, Cet article ne sera pas promu car il est en anglais ! Seuls les articles FR qui concernent l’informatique autour des LL/FLoSS sont permis. À moins que je ne me trompe…
En lien : https://pivot-to-ai.com/2025/05/25/ai-resorts-to-robot-blackmail-because-anthropic-asked-for-a-story-of-robot-blackmail/
Petit article pour me lancer sur ce site
En fait, l’URL que j’avais soumise était celle qui laisse apache servir la version FR ou EN en fonction des en-têtes fournies par le visiteur. Il suit Accept-Language sauf si un cookie prend la priorité (le cookie est mis lorsqu’on regarde une version en particulier).
Mais effectivement, pour être sûr de tomber sur la VF, c’est celle en
index.fr.htmlqu’il faut utiliser (et c’est donc celle-ci que je soumettrai la prochaine fois).La v. FR de l’URL est :
Dans l’état, c’est l’article en anglais qui est lié !
oui, dans l’immense majorité des cas, un simple ps2pdf input.pdf output.pdf est largement suffisant.
pas compliqué ? euh, oui, j’ai quand même un doute… d’autant avec
ps2pdf, tel que :ps2pdf -dPDFSETTINGS=/ebook input.pdf output.pdfMise à jour de l’article initial. Clarification de l’ensemble qui était vraiment brouillon. Mode mémo qui va droit à l’essentiel
Il y a aussi https://git.gammaspectra.live/git/go-away, avec des modes sans JavaScript.
Par curiosité, pourquoi Korben bof ?
Par le biais de F-Droid, tu as le magasin d’app nommé “Neo Store”… Par ce biais, la version Android de Freetube est installable sur les smartphones ad hoc ;)
Merci pour ton retour ;)
Très clair et très intéressant, merci !
Voir la réponse d’un post-adolescent : https://www.journalduhacker.net/s/zcovzl/adolescence_et_num_rique_retour_dexp
Même constat que Dryusdan sur mon infra :
J’ai eu plus de chances avec moins de requêtes par minute mais poste filtrage par user-agent (qui date de plusieurs semaines), quasi 100% des IP appartiennent à Alibaba.
Perso j’ai constaté la même chose que Dryusdan sur pas mal de mes infra… Si bien que j’ai du développer un outil pour bloquer tout ça.
Sinon concernant le reste :
“
aucune IA digne de ce nom et commerciale ne se fait passer pour un Windows 95” : si, on a plein d’exemples comme ça, mais en tant qu’adminsys c’est vrai qu’on passe pas notre temps à poster nos logs en ligne, mais il y a des bases de partages si besoin.“
une attaque par déni de service distribué, ça n’a rien à voir avec du scraping” : Alors en fait si, de plus en plus d’ailleurs, par exemple j’ai eu le cas (moi aussi sur ma forge git, quel hasard) de crawlers IA qui venaient sur mon infra avec pas moins de 70 000 IP différentes qui faisaient chacune 1 ou 2 requêtes seulement. Surement pour ne pas être banni facilement (c’est loupé eheh).“
Mais comme il y a un ennemi commun (l’IA)” : Non, l’ennemi commun ce sont les humains qui font de l’IA absurde (et capitaliste à outrance) comme ça et pourrissent le web, ces nécromanciens du rêve sont juste néfastes et seront bloqués et ridiculisés autant que possible.Si les IA étaient dignes de ce nom, elles respecteraient les robots.txt, scraperaient à un rythme décent et on aurait pas besoin d’avoir 15 000 articles qui expliquent comment les bloquer malgré leurs contournements des blocages, déjà…
Le simple fait que vous ayez fait un article « arrêtez de bloquer les IA » est déjà une preuve que les entreprises faisant de l’IA font n’importe quoi et ne sont donc pas dignes de confiance. Parce que si elles l’étaient, la question ne se poserait pas, le trafic serait passé inaperçu pour la plupart des gens.