Wayback Machine – udaj się w internetową podróż do przeszłości

W przyrodzie nic nie ginie, tym bardziej, jeśli już raz zostało umieszczone w Internecie. Jak jednak wykorzystać dostępnie dzięki Archiwe.org cyfrowe archiwum i w czym może nam pomóc ta ogromna wyszukiwarka? Przyjrzyjmy się temu wspólnie.
 
Czym jest Wayback Machine? To podróż w czasie, zupełnie darmowa i niezwykle fascynująca. Jak ją odbyć? Wystarczy wejść na stronę https://archive.org/web/ i wyszukać interesujące nas witryny internetowe. Dostęp do nich to swego rodzaju prezent od Internet Archive, powstałej w 1996 roku organizacji non profit, która za cel obrała sobie gromadzenie zasobów multimedialnych. Pełne zbiory fundacji to ponad 400 miliardów stron internetowych, 23 miliony książek i publikacji, prawie 15 milionów nagrań audio i materiałów video (w tym całe odcinki programów telewizyjnych), ponad 3 miliony grafik oraz powyżej pół miliona wersji wszelkiej maści oprogramowania. W ramach edukacji i szerzenia wiedzy o początkach Internetu Internet Archive udostępnia spory wyimek swych zbiorów każdemu z nas. To właśnie Wayback Machine.
 
Jak działa the Wayback Machine?
 
Działanie archiwum jest możliwe dzięki pracy robotów indeksujących Google. Wayback Machine gromadzi kopie (snapshots) adresów przeskanowanych przez oprogramowanie Google z różnych dni i godzin. Zasoby są skanowane i indeksowane, a wyniki zapisywane w postaci obszernej biblioteki danych. W efekcie, gdy wpiszemy w Wayback Archive interesującą nas witrynę, ta wyświetli nam oś czasu, zawierającą podział na konkretne lata, miesiące, dni oraz godziny (jeżeli tylko roboty odwiedzały daną stronę kilka razy dziennie). Liczba takich skanów może być różna w zależności od witryny, a całkowita analiza w Wayback Machine trwać do kilkunastu dni. Dla przykładu, gdy wpiszemy w Waybackmachine adres devagroup.pl, uzyskamy następujące dane.
 
Źródło: Wayback Machine
 
W kalendarium u góry znajdziemy wszystkie kopie strony (snapshoty), „ściągnięte” przez roboty Google od momentu jej powstania, zaś poniżej konkretne wyniki (tutaj dla 2016 roku). Niebieskim kolorem zaznaczone zostały wykonane skany, zaś zielonym wszelkie przekierowania (301) do naszej witryny. Niekiedy pojawiają się też dni „czerwone”. To dla nas informacja, że mieliśmy do czynienia z błędami po stronie serwera. Oznaczenia pomarańczowe wskazują natomiast na próby archiwizacji podstron nieistniejących. Co ważne, dane z kalendarza nie odnoszą się do tego, ile razy witryny sieci web ulegały aktualizacji danego dnia, czy miesiąca. Wskazują jedynie na liczbę odwiedzin przez roboty Google w danym przedziale czasu.
 
Internet archive – archiwum bez granic?
Przeszukując Way Back Machine, można stracić rachubę czasu. W pewnym momencie tej podróży ku źródłom Internetu musi się jednak pojawić pytanie o jej kres. Jakie więc są możliwości i ograniczenia web Archive org i czy rzeczywiście każdy nasz ślad zamieszczony w sieci można zarchiwizować? Nie do końca. Choć bowiem sami twórcy Internet Archive dumnie podkreślają znaczenie Wayback Machine dla naszego dziedzictwa kulturowego, a zgromadzone przez nich zbiory często przyrównuje się do Biblioteki Aleksandryjskiej, to wyszukiwarka Wayback też ma pewne blokady nie do przeskoczenia i nie znajdziemy w niej wszystkiego. W Wayback Archive próżno zatem szukać adresów URL niedostępnych publicznie, które wymagają od nas zalogowania oraz wszelkich treści, zablokowanych przez blokady załączone w pliku robots.txt
 
Internetowy wehikuł czasu
Podsumowując to, co już wiemy, Wayback Machine dla przeciętnego użytkownika sieci, to wspaniała, sentymentalna podróż do przeszłości. Biblioteka Wayback stanowi źródło wszelkich możliwych treści, które od 1996 roku udało się sukcesywnie archiwizować i w efekcie zapisać dla potomnych. To archiwum darmowe i dostępne online. Czy jednak możemy je wykorzystać do czegoś więcej niż spojrzenia w przeszłość? Marketerzy wykorzystują the Internet Archive, by lepiej poznać swoich klientów. Zasoby biblioteki Wayback dają im dostęp do wiedzy o tym, jak dana firma się rozwijała i które usługi z biegiem czasu zyskały dla niej największe znaczenie. Dla ekspertów SEO z kolei jest to źródło wiedzy na temat linkowań i przekierowań, ale też praktyczne narzędzie do wykorzystania podczas pozycjonowania.
 
Żródło: Wayback Machine
 
Biblioteka online dla pozycjonerów
Web Archiwe Org zawiera grubo ponad 10 miliardów wyników website. Nic więc dziwnego, że jest niezwykle cenne dla pozycjonerów. SEO-wcy mogą wykorzystać narzędzie Web Archiwe Org co najmniej na kilka sposobów.
 
Historia w zasięgu ręki
Budowanie struktury linkowania dla nowego serwisu internetowego to zajęcie żmudne i czasochłonne. Klienci często nie zdają sobie sprawy, jak wielkim ułatwieniem dla pozycjonera może być wgląd w linkowania stosowane w przeszłości. Profil linkowy możemy co prawda podejrzeć np. w Majestic lub Ahrefs. Narzędzia te nie dają nam jednak wglądu we wcześniejsze rozwiązania stosowania na platformie, portalu czy sklepie. Tej cennej wiedzy dostarcza Wayback Machine.
 
Wgląd w linkowanie
Dzięki naszemu cyfrowemu archiwum sprawdzimy stare linkowania. To znakomite ułatwienie w budowaniu mapy przekierowań nowych. Niedziałające linki, pojawiające się błędy w serwisie, to wszystko mogło mieć wpływ na stan naszej platformy. Możemy wykluczyć te błędy na przyszłość w myśl zasady lepiej zapobiegać, niż leczyć.
 

Zleć audyt SEO, wyłap błędy na swej stronie

 
Łatwa identyfikacja błędów
Wayback pozwala SEO-wcom wychwycić błędy, które doprowadzają do spadków ruchu na naszej stronie. Jeśli takie spadki pojawiają się np. w Google Analytics, możemy prześledzić historię snapshotów stworzonych przez roboty Google tuż przed nimi. W efekcie drogą indukcji wyłapiemy zmiany w serwisie, niedziałające elementy, a nawet zawirusowane podstrony.
 
Niepoprawne indeksowanie
Wgląd w historię danego serwisu daje nam dostęp do wygodnej do prześledzenia mapy indeksowania. Tutaj nic nie jest „of the record”, również plik robots.txt. Dzięki niemu sprawdzimy, kiedy zaczęły się trudności z indeksowaniem i co mogło do nich doprowadzić.
 
Właściwe wdrożenie kodu Google Analytics
Cyfrowa biblioteka Wayback archwizuje również kod źródłowy, stąd mamy łatwy dostęp do struktury serwisu. Wejście w kod pozwala sprawdzić, czy wdrożenie Google Analytics (GA) przebiegło poprawnie. Z tego miejsca przeanalizujemy, czy Analytics jest sparowany z każdą z naszych podstron i czy nic nie utrudnia mu zbierania interesujących nas danych. Taka wiedza przydaje się, zwłaszcza kiedy natrafiamy na nieścisłości w statystykach GA.
 

Poznaj z nami Google Analytics!

 
Content w koronie
Nie od dziś wiemy, że content is a king. Jakościowe treści są nie tylko gwarancją merytoryki, wpływają również na wysokie pozycje organiczne platform. Niekiedy jednak np. przy przenoszeniu, czy przebudowie serwisu możemy je przypadkowo usunąć. Ratunkiem w takich sytuacjach są właśnie kopie z Wayback. Możemy je stamtąd wyłuskać i ponownie umieścić w serwisie.
 
Słowem podsumowania
To oczywiście nie wszystkie możliwości, które daje nam kolos taki, jak Archiwe.org, za to najważniejsze i najwartościowsze z nich. Zachęcamy was z tego miejsca do samodzielnego prześledzenia bibliotek Wayback i odbycia podróży w czasie, którą oferują. Jeżeli dodatkowo prowadzicie własny biznes, będzie to dla was okazja do uporządkowania zmian, które wdrożyliście w waszych sklepach, czy serwisach.

 

Source link

Wayback Machine – udaj się w internetową podróż do przeszłości
Scroll to top
error: Content is protected !!