domenica, Giugno 16, 2024
HomeTecnologiaPerdere la memoria storica del web. Sotto attacco Internet Archive

Perdere la memoria storica del web. Sotto attacco Internet Archive

Internet Archive, che ospita 835 miliardi di pagine web, sta sperimentando un rapido decadimento dei suoi contenuti. Un recente studio del Pew Research Center ha rivelato che il 38% delle pagine web esistenti nel 2013 sono scomparse, così come l’8% di quelle del 2023.

Lo studio ha inoltre scoperto che il 54% delle pagine di Wikipedia si collegano a pagine inesistenti nella sezione dei riferimenti. Questo problema è diffuso nelle pagine di gestione e delle notizie.

Sulle piattaforme di social media, quasi un tweet su cinque svanisce nel giro di pochi mesi, principalmente a causa della cancellazione degli account.

Nonostante i tentativi di Internet Archive di preservare il web attraverso la sua “Wayback Machine”, il compito è arduo. L’archivio non riesce a catturare tipi di siti Web più complessi e le pagine a essi non collegate potrebbero essere completamente trascurate.

Ad aggravare il problema, ampie porzioni di Internet ora sono sotto il controllo di privati. I colossi dei social media come Facebook e Instagram di Meta Platforms Inc. e X di Elon Musk, ex Twitter, impongono rigide restrizioni di visualizzazione, rendendo l’archiviazione difficile.

Inoltre, l’emergere di bot che pubblicano e interagiscono con i post, noti come “sludge”, complica la raccolta di parti significative di Internet.

Il deterioramento dei collegamenti è un problema crescente che influisce sulla longevità dei collegamenti ipertestuali su Internet. Nel corso del tempo, i collegamenti ipertestuali si deteriorano e diventano inattivi e inaccessibili, creando sfide per gli utenti che cercano informazioni valide e preziose su Internet.

“The first web page rendered in the first web browser. Enquire within upon everything.” by adactio is licensed under CC BY 2.0.

Il miliardario tecnologico Musk ha espresso il suo sostegno all’Internet Archive, definendolo un “bene pubblico che dovrebbe esistere”. ma tra gli altri problemi Internet Archive deve far fronte a diversi aspetti giudiziari dei suoi contenuti.

Ma quello tecnico non è l’unico problema che sta vivendo Internet Archive. Di recente quattro importanti editori (Hachette Book Group, HarperCollins Publishers, Penguin Random House e Wiley) hanno depositato una memoria che si oppone al ricorso di Internet Archive, nel caso sul copyright Hachette Book Group.

La causa originale era stata intentata dagli editori nel giugno 2020 e sosteneva che Internet Archive aveva digitalizzato “milioni di libri stampati, distribuendo i risultanti ebook bootleg gratuitamente dal suo sito, senza il consenso degli editori e dei loro autori o del pagamento di eventuali canoni di licenza.”

Nella causa di un anno fa, il giudice John G. Koeltl della corte distrettuale degli Stati Uniti nel distretto meridionale di New York, aveva scritto: “Gli editori hanno stabilito un caso ‘prima facie’ di violazione del copyright” e la sua opinione includeva un fermo rimprovero al controverso concetto di “prestito digitale controllato”.

Tuttavia l’Internet Archive ha mantenuto la promessa di ricorrere in appello, sostenendo che il giudice Koeltl non aveva compreso i fatti del caso e aveva sbagliato nella sua decisione. Per questo motivo l’associazione degli editori degli Stati Uniti ha annunciato il deposito di una nuova memoria, riproponendo le sue ragioni.

A rendere ancora più dura la vita di Internet Archive si è infine aggiunta una serie di attacchi digitali nelle ultime settimane. L’organizzazione no-profit ha annunciato in un post sul blog che è attualmente al suo “terzo giorno di difesa da un attacco informatico DDoS intermittente”.

Durante il fine settimana del Memorial Day, l’organizzazione ha pubblicato su Twitter/X che la maggior parte dei suoi servizi non sono disponibili a causa di malintenzionati che colpiscono il suo sito web con “decine di migliaia di richieste di informazioni false al secondo”. Martedì mattina ha avvertito che “continua a subire interruzioni del servizio” perché gli aggressori non hanno smesso di prenderlo di mira.

Tuttavia, i dati del sito Web non sembrano essere interessati. “Per fortuna le raccolte sono al sicuro, ma ci dispiace che l’attacco denial-of-service ci abbia messo offline a intermittenza durante questi ultimi tre giorni”, ha detto in una nota Brewster Kahle, il fondatore dell’Internet Archive.

L’Internet Archive non ha ancora identificato la fonte degli attacchi, ma ha parlato di come le biblioteche e istituzioni simili vengano prese di mira più frequentemente in questi giorni. Una delle istituzioni menzionate è la British Library, il cui sistema informativo online è stato tenuto in ostaggio da un gruppo di hacker l’anno scorso a scopo di riscatto.

“DDoS” by EpicTop10.com is licensed under CC BY 2.0.
RELATED ARTICLES

LASCIA UN COMMENTO

Per favore inserisci il tuo commento!
Per favore inserisci il tuo nome qui

ARTICOLI CORRELATI