﻿﻿{"id":2329,"date":"2026-02-12T16:56:27","date_gmt":"2026-02-12T15:56:27","guid":{"rendered":"https:\/\/elearningsamba.com\/index.php\/wikipedia-vs-archive-today-700-000-liens-en-sursis\/"},"modified":"2026-02-12T16:56:27","modified_gmt":"2026-02-12T15:56:27","slug":"wikipedia-vs-archive-today-700-000-liens-en-sursis","status":"publish","type":"page","link":"https:\/\/elearningsamba.com\/index.php\/wikipedia-vs-archive-today-700-000-liens-en-sursis\/","title":{"rendered":"Wikipedia vs archive.today &#8211; 700 000 liens en sursis"},"content":{"rendered":"<p>Un peu moins de 700 000 liens, c&#8217;est le nombre de r\u00e9f\u00e9rences vers <strong>archive.today<\/strong> que Wikipedia envisage de supprimer d&#8217;un coup ! Et la raison est assez dingue&#8230; en fait le service d&#8217;archivage a planqu\u00e9 du code DDoS dans son CAPTCHA afin d&#8217;attaquer le blog d&#8217;un mec qui a eu le malheur de chercher l&#8217;identit\u00e9 du fondateur du site.<\/p>\n<p>L&#8217;histoire est tordue vous allez voir&#8230;<\/p>\n<p>En 2023, un blogueur du nom de <strong>Jani Patokallio<\/strong> publie<br \/>\n<a href=\"https:\/\/gyrovague.com\/2023\/08\/05\/archive-today-on-the-trail-of-the-mysterious-guerrilla-archivist-of-the-internet\/\">un article sur son blog Gyrovague<\/a><br \/>\npour tenter d&#8217;identifier le cr\u00e9ateur d&#8217;archive.today, un certain &#8220;Denis Petrov&#8221; (probablement un pseudo). Pas de quoi fouetter un chat, sauf que le principal int\u00e9ress\u00e9 n&#8217;a visiblement pas kiff\u00e9.<\/p>\n<p>Du coup, un bout de JavaScript s&#8217;est retrouv\u00e9 comme de par hasard dans la page CAPTCHA du service,<br \/>\n<a href=\"https:\/\/gyrovague.com\/2026\/02\/01\/archive-today-is-directing-a-ddos-attack-against-my-blog\/\">ex\u00e9cutant une requ\u00eate vers le blog de Patokallio<\/a><br \/>\ntoutes les 300 millisecondes. Chaque visiteur qui passait par le CAPTCHA devenait alors un soldat involontaire d&#8217;une attaque DDoS.<\/p>\n<p>Et le bonhomme ne s&#8217;est pas arr\u00eat\u00e9 l\u00e0&#8230; il a ensuite menac\u00e9 de cr\u00e9er un site porno avec le nom du blogueur. On est vraiment dans la r\u00e9ponse proportionn\u00e9e, clairement.<\/p>\n<p>Le souci, c&#8217;est que Wikipedia utilise archive.today de mani\u00e8re MASSIVE. Cela repr\u00e9sente 695 000 liens r\u00e9partis sur environ 400 000 pages. C&#8217;est le deuxi\u00e8me fournisseur d&#8217;archives de toute l&#8217;encyclop\u00e9die !<\/p>\n<p>Du coup, les \u00e9diteurs se retrouvent face \u00e0 un sacr\u00e9 dilemme. D&#8217;un c\u00f4t\u00e9, on a ceux qui veulent tout blacklister parce que &#8220;<em>la s\u00e9curit\u00e9 de vos lecteurs, \u00e7a passe avant les citations<\/em>&#8220;. Et de l&#8217;autre, ceux qui rappellent que le service contient des archives qu&#8217;on ne trouve NULLE PART ailleurs, m\u00eame pas sur la<br \/>\n<a href=\"https:\/\/korben.info\/archiver-page-web.html\">Wayback Machine<\/a><br \/>\n.<\/p>\n<p>Bon courage pour trouver un rempla\u00e7ant les mecs !<\/p>\n<p>Et petit d\u00e9tail qui n&#8217;en est pas un, au passage&#8230; En fait, archive.today sert aussi \u00e0 contourner des paywalls. C&#8217;est pratique pour v\u00e9rifier des sources, ou lire de supers articles sans payer mais techniquement c&#8217;est ill\u00e9gal.<\/p>\n<p>Mais quand la source originale a disparu, on fait comment ? Et c&#8217;est l\u00e0 tout l&#8217;int\u00e9r\u00eat de ces services d&#8217;archivage.<\/p>\n<p>Bon, les paywalls, on comprend tous pourquoi \u00e7a existe. Produire de l&#8217;info de qualit\u00e9, \u00e7a co\u00fbte un bras. Sauf que c&#8217;est quand m\u00eame un truc un peu naze. Vous bossez, vous produisez un contenu top, et au final y&#8217;a que 10 personnes qui payent pour le lire. Et ce sont les m\u00eames 10 personnes qui sont pigistes et qui vont reprendre votre info pour la diffuser gratuitement sur leur m\u00e9dia ! On le voit avec Mediapart&#8230; des enqu\u00eates \u00e9normes derri\u00e8re un paywall, et toute la presse qui reprend leurs scoops sans payer. Je trouve \u00e7a vraiment dommage.<\/p>\n<p>Moi, ce que j&#8217;aime dans le fait d&#8217;\u00e9crire sur le web, c&#8217;est que vous me lisiez. Et mettre du contenu derri\u00e8re un paywall, \u00e7a voudrait dire que plein d&#8217;entre vous ne me liraient plus. C&#8217;est pour cela que m\u00eame le contenu que je r\u00e9serve en avant-premi\u00e8re sur<br \/>\n<a href=\"https:\/\/patreon.com\/korben\">Patreon<\/a><br \/>\n, au bout de quelques semaines, je le lib\u00e8re pour tout le monde.<\/p>\n<p>Quand je vois The Verge par exemple qui en met dans tous les sens&#8230; ben j&#8217;y vais plus. J&#8217;ai pas envie de payer un abonnement de plus pour une valeur ajout\u00e9e pas folle. C&#8217;est un peu comme les bandeaux cookies, \u00e0 savoir un effet de bord regrettable du web moderne. On doit faire avec parce que personne n&#8217;a trouv\u00e9 mieux comme id\u00e9e&#8230;<\/p>\n<p>Bref, entre les DDoS vengeurs, les 700 000 liens en sursis et les paywalls qui<br \/>\n<a href=\"https:\/\/korben.info\/cloudflare-bloque-ia-pay-per-crawl.html\">pourrissent tout<\/a><br \/>\n&#8230; le web ouvert, c&#8217;est pas gagn\u00e9 les amis. Voil\u00e0 voil\u00e0.<\/p>\n<p>\n<a href=\"https:\/\/www.techspot.com\/news\/111296-wikipedia-may-remove-almost-700000-links-amid-archivetoday.html\">Source<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un peu moins de 700 000 liens, c&#8217;est le nombre de r\u00e9f\u00e9rences vers archive.today que Wikipedia envisage de supprimer d&#8217;un coup ! Et la raison est assez dingue&#8230; en fait le service d&#8217;archivage a planqu\u00e9 du code DDoS dans son CAPTCHA afin d&#8217;attaquer le blog d&#8217;un mec qui a eu le malheur de chercher l&#8217;identit\u00e9 du fondateur du site. L&#8217;histoire est tordue vous allez voir&#8230; En 2023, un blogueur du nom de Jani Patokallio publie un article sur son blog Gyrovague pour tenter d&#8217;identifier le cr\u00e9ateur d&#8217;archive.today, un certain &#8220;Denis Petrov&#8221; (probablement un pseudo). Pas de quoi fouetter un chat, sauf que le principal int\u00e9ress\u00e9 n&#8217;a visiblement pas kiff\u00e9. Du coup, un bout de JavaScript s&#8217;est retrouv\u00e9 comme de par hasard dans la page CAPTCHA du service, ex\u00e9cutant une requ\u00eate vers le blog de Patokallio toutes les 300 millisecondes. Chaque visiteur qui passait par le CAPTCHA devenait alors un soldat involontaire d&#8217;une attaque DDoS. Et le bonhomme ne s&#8217;est pas arr\u00eat\u00e9 l\u00e0&#8230; il a ensuite menac\u00e9 de cr\u00e9er un site porno avec le nom du blogueur. On est vraiment dans la r\u00e9ponse proportionn\u00e9e, clairement. Le souci, c&#8217;est que Wikipedia utilise archive.today de mani\u00e8re MASSIVE. Cela repr\u00e9sente 695 000 liens r\u00e9partis sur environ 400 000 pages. C&#8217;est le deuxi\u00e8me fournisseur d&#8217;archives de toute l&#8217;encyclop\u00e9die ! Du coup, les \u00e9diteurs se retrouvent face \u00e0 un sacr\u00e9 dilemme. D&#8217;un c\u00f4t\u00e9, on a ceux qui veulent tout blacklister parce que &#8220;la s\u00e9curit\u00e9 de vos lecteurs, \u00e7a passe avant les citations&#8220;. Et de l&#8217;autre, ceux qui rappellent que le service contient des archives qu&#8217;on ne trouve NULLE PART ailleurs, m\u00eame pas sur la Wayback Machine . Bon courage pour trouver un rempla\u00e7ant les mecs ! Et petit d\u00e9tail qui n&#8217;en est pas un, au passage&#8230; En fait, archive.today sert aussi \u00e0 contourner des paywalls. C&#8217;est pratique pour v\u00e9rifier des sources, ou lire de supers articles sans payer mais techniquement c&#8217;est ill\u00e9gal. Mais quand la source originale a disparu, on fait comment ? Et c&#8217;est l\u00e0 tout l&#8217;int\u00e9r\u00eat de ces services d&#8217;archivage. Bon, les paywalls, on comprend tous pourquoi \u00e7a existe. Produire de l&#8217;info de qualit\u00e9, \u00e7a co\u00fbte un bras. Sauf que c&#8217;est quand m\u00eame un truc un peu naze. Vous bossez, vous produisez un contenu top, et au final y&#8217;a que 10 personnes qui payent pour le lire. Et ce sont les m\u00eames 10 personnes qui sont pigistes et qui vont reprendre votre info pour la diffuser gratuitement sur leur m\u00e9dia ! On le voit avec Mediapart&#8230; des enqu\u00eates \u00e9normes derri\u00e8re un paywall, et toute la presse qui reprend leurs scoops sans payer. Je trouve \u00e7a vraiment dommage. Moi, ce que j&#8217;aime dans le fait d&#8217;\u00e9crire sur le web, c&#8217;est que vous me lisiez. Et mettre du contenu derri\u00e8re un paywall, \u00e7a voudrait dire que plein d&#8217;entre vous ne me liraient plus. C&#8217;est pour cela que m\u00eame le contenu que je r\u00e9serve en avant-premi\u00e8re sur Patreon , au bout de quelques semaines, je le lib\u00e8re pour tout le monde. Quand je vois The Verge par exemple qui en met dans tous les sens&#8230; ben j&#8217;y vais plus. J&#8217;ai pas envie de payer un abonnement de plus pour une valeur ajout\u00e9e pas folle. C&#8217;est un peu comme les bandeaux cookies, \u00e0 savoir un effet de bord regrettable du web moderne. On doit faire avec parce que personne n&#8217;a trouv\u00e9 mieux comme id\u00e9e&#8230; Bref, entre les DDoS vengeurs, les 700 000 liens en sursis et les paywalls qui pourrissent tout &#8230; le web ouvert, c&#8217;est pas gagn\u00e9 les amis. Voil\u00e0 voil\u00e0. Source<\/p>\n","protected":false},"author":1,"featured_media":2330,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"give_campaign_id":0,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_kadence_starter_templates_imported_post":false,"footnotes":""},"class_list":["post-2329","page","type-page","status-publish","has-post-thumbnail","hentry"],"campaignId":"","_links":{"self":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/2329","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/comments?post=2329"}],"version-history":[{"count":0,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/pages\/2329\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media\/2330"}],"wp:attachment":[{"href":"https:\/\/elearningsamba.com\/index.php\/wp-json\/wp\/v2\/media?parent=2329"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}