O nas
Kontakt

Szukasz artykułu online z 2013 roku? Nowe badania wskazują, że mógł zniknąć

Laura Kowalczyk

Accessing a web page

Nowe badanie przeprowadzone przez amerykańskie Pew Research Center wykazało, że prawie 40 procent wszystkich stron internetowych utworzonych w 2013 roku nie jest już dostępnych z powodu zjawiska, które nazywają „cyfrowym rozkładem”.

Jeśli szukasz artykułu online z 2013 roku, istnieje ryzyko, że zniknął.

Z nowego badania przeprowadzonego przez Pew Research Center w USA wynika, że ​​38 procent wszystkich stron internetowych, które istniały w 2013 roku, nie jest już dostępnych z powodu zjawiska, które nazywają „cyfrowym rozkładem”.

Kiedy badacze rozszerzyli ramy czasowe, odkryli, że mniej więcej jedna czwarta wszystkich stron internetowych utworzonych w latach 2013–2023 już nie istnieje. Z tej liczby 8 proc. tych stron powstało w 2023 r.

„Internet to niewyobrażalnie rozległe repozytorium współczesnego życia… ale mimo że użytkownicy na całym świecie korzystają z sieci, aby uzyskać dostęp do książek, zdjęć, artykułów informacyjnych i innych zasobów, treści te czasami znikają z pola widzenia” – czytamy w badaniu.

W badaniu zdefiniowano niedostępne linki jako stronę, która już nie istnieje na serwerze hosta (wyświetla się komunikat 404 nie znaleziono).

Badacze zebrali losową próbkę stron internetowych z Common Crawl – wyszukiwarki archiwów internetowych, która pozwala uzyskać migawkę tego, jak Internet wygląda w danym momencie.

Zespół pobierał próbki z około 90 000 stron internetowych rocznie w latach 2013–2023, aby sprawdzić, czy nadal istnieją.

Na Wikipedii odkryli, że około 54 procent przeanalizowanych stron miało co najmniej jeden uszkodzony link w sekcji odnośników.

Około 23 procent witryn informacyjnych zawierało uszkodzony link, a 21 procent stron rządowych – tak.

Badacze przyjrzeli się bliżej witrynom rządowym i odkryli, że przeciętna strona internetowa zawiera 50 linków, często służących do zabezpieczenia stron HTTP w celu uzyskania większej ilości informacji.

Spośród czterech szczebli władz miejskich najprawdopodobniej doszło do zerwania linków – w 29 procentach zbadanych ich witryn co najmniej jedno zostało uszkodzone.

W przypadku branży informacyjnej odkryli mniej więcej taką samą liczbę stron z uszkodzonymi linkami w witrynach o dużym i małym ruchu i, podobnie jak witryny rządowe, najczęściej połączonych z bezpiecznymi zewnętrznymi witrynami internetowymi HTTP.

Zanik następuje także w mediach społecznościowych, gdzie nieco mniej niż jeden na pięć postów w serwisie X (dawniej Twitter) zebranych w losowej próbie 4,8 miliona postów w czasie rzeczywistym nie był dostępny w serwisie przez dłużej niż kilka miesięcy, albo dlatego, że użytkownik konto zostało usunięte lub pojedynczy post został usunięty.

Prawdopodobieństwo zniknięcia wpisu na X było większe, jeśli został napisany po turecku lub arabsku lub pochodził z konta, które miało „ustawienia domyślne”, takie jak ogólne zdjęcie profilowe lub biografia.