Błąd 404 na stronie internetowej, czyli Page Not Found

Błąd 404 – czym jest, jak go naprawić i jak znaleźć strony, które go zwracają?

Przeglądając różne strony internetowe możemy natknąć się na takie, które zwracają błąd 404 – strony nie znaleziono. Co się kryje pod tym pojęciem, jak naprawić taki błąd i jak sobie z nim radzić? Podpowiemy w tym artykule.

Czym jest błąd 404 – Page Not Found i co on oznacza?

Błąd 404 jest jednym z kodów odpowiedzi HTTP. Oznacza on, że serwer nie mógł odnaleźć żądanego zasobu, przez co nie mógł on być wyświetlony w przeglądarce.

Co to jest kod odpowiedzi HTTP?

Według Wikipedii kod odpowiedzi HTTP to:

numeryczna dana wysyłana przez serwer HTTP do aplikacji klienta. Informuje o sposobie realizacji (bądź jej braku) zapytania klienckiego. Znajduje się na początku odpowiedzi, tuż za wersją protokołu HTTP i przed słownym opisem kodu odpowiedzi, np. HTTP/1.1 400 Bad Request

Źródło: https://pl.wikipedia.org/wiki/Kod_odpowiedzi_HTTP

Mówiąc prostym językiem – jest to informacja wysłana do klienta (zazwyczaj przeglądarki internetowej), która informuje o tym, jak realizować zapytanie lub czy udało się je zrealizować. Taki kod może informować na przykład o tym, że strona została na stałe przeniesiona pod inny adres czy też że strona, którą chcemy wyświetlić, nie istnieje.

Kod odpowiedzi jest zwracany dla każdej strony wyświetlanej w przeglądarce. Kodów odpowiedzi jest wiele i zostały one podzielone na 5 kategorii:

  • 1XX – kody informacyjne,
  • 2XX – kody powodzenia,
  • 3XX – kody dot. przekierowań
  • 4XX – kody dot. błędów po stronie klienta
  • 5XX – kody dot. błędów po stronie serwera

Do najczęściej spotykanych kodów odpowiedzi HTTP można zaliczyć:

  • 200 – OK – standardowa odpowiedź na udane żądanie HTTP.
  • 301 – Moved permanently (Trwale przeniesiony)  – oznacza, że zasób został trwale przeniesiony i należy go szukać pod nowym adresem.
  • 404 – Not Found (Nie znaleziono) – serwer nie mógł odnaleźć zasobu.
  • 500 – Internal Server Error (Wewnętrzny błąd serwera) – serwer nie był w stanie zrealizować żądania. 

Jak powstają błędy 404?

Błędy 404 często są następstwem działań prowadzonych na stronie lub wpisaniem nieprawidłowego adresu URL. Błąd 404 może powstać między innymi:

  • Po zmianie adresu URL strony lub zmianie struktury adresów URL, gdy próbuje się wyświetlić stronę, która została przeniesiona w inne miejsce, a nie zostało ustawione dla niej odpowiednie przekierowanie.
  • Po usunięciu danej podstrony.
  • Po wpisaniu w pasku przeglądarki nieprawidłowego adresu URL lub jeśli link do strony kieruje na nieprawidłowy adres.
  • Po opublikowaniu nowej wersji strony, która ma zmienioną strukturę adresów. Jeśli stare adresy nie zostaną przekierowane na nowe, użytkownicy będą trafiać na strony 404. 

Jak wykryć błędy 404 na stronie?

Analizowanie błędów 404 jest jednym z ważniejszych działań kontrolnych prowadzonych na stronach. Błędy 404 nie zawsze oznaczają, że dzieje się coś złego, jednak mimo to powinny być stale monitorowane i powinniśmy ustalić, skąd się one biorą.

Do wykrycia błędów 404 mogą nam posłużyć takie narzędzia jak:

  • Google Search Console – jeśli robot napotka na zasób, który zwraca błąd 404, wyświetli błąd z informacją “Nie udało się odnaleźć przesłanego URL-a (404)”.
    Wykrywanie błędów 404 w Google Search Console
  • Sitebulb – dzięki temu narzędziu możemy wygenerować raport, w którym można wyświetlić listę podstron w danym serwisie oraz ich kody odpowiedzi HTTP. Dzięki temu łatwo wyszukać te, które zwracają kod inny niż 200. Jest to płatne narzędzie.
    Wykrywanie błędów 404 w Sitebulb
  • Screaming Frog – kolejne narzędzie, które pozwala przeskanować stronę i wyświetlić adresy wraz z ich kodami odpowiedzi. W darmowej wersji pozwala wyświetlić do 500 adresów dla danej domeny.
    Wykrywanie błędów 404 - Sreaming Frog

Jak sobie radzić z błędami 404?

Jeśli na stronie wykryjemy błąd 404, należy w pierwszej kolejności przeanalizować, co jest jego przyczyną i w zależności od tego podjąć odpowiednie kroki:

  • Jeśli strona 404 wyświetla się po wpisaniu nieprawidłowego adresu URL, to nie trzeba nic robić. Strona w takim wypadku powinna zwracać błąd 404 i jest to poprawne. Warto pamiętać, by na stronie błędu 404 dać jasny i czytelny komunikat dla użytkownika, że strona, którą chce wyświetlić, nie istnieje. Warto również na takiej stronie umieścić przycisk prowadzący do strony głównej serwisu, dzięki czemu jest szansa, że użytkownik na nią przejdzie.
  • Jeśli zmienił się adres strony lub struktura adresów, to należy ustawić odpowiednie przekierowanie 301 ze starego adresu na nowy.
  • Jeśli ze sklepu zniknęła jedna strona produktowa i zastąpiła ją inna strona produktowa, to również warto ustawić przekierowanie 301 na tę nową stronę. Jeśli nie ustawimy przekierowania, to użytkownicy, którzy trafią na taką stronę, prawdopodobnie ją opuszczą. Natomiast jeśli zostaną skierowani na nową stronę z produktem, to pozostaną na niej i jest szansa, że dokonają zakupu.
  • Jeśli produkt został wyprzedany, ale w przyszłości wróci do oferty – w takiej sytuacji lepiej nie usuwać go i nie wyświetlać strony 404, a także nie ustawiać przekierowania. Najlepiej dalej wyświetlać stronę produktu, ale z informacją, że nie jest on w tym momencie dostępny. Warto również wyświetlić podobne produkty, które mogą zainteresować użytkownika oraz dać możliwość ustawienia przypomnienia z informacją, gdy produkt będzie już dostępny. Dzięki temu użytkownik będzie wiedział, że może wrócić w przyszłości do zakupu, a robot nie wyindeksuje w tym czasie strony.
  • Jeśli strona została na trwałe usunięta, to warto ustawić przekierowanie 301. Warto tutaj wspomnieć, że w takim wypadku najlepiej zrobić przekierowanie na stronę powiązaną tematycznie ze stroną, która została usunięta. W przypadku sklepów – jeśli usunięty został produkt i nie ma on zamiennika, można skierować użytkownika do kategorii, w której znajdował się usunięty produkt. Jeśli nie możemy znaleźć dla usuniętej podstrony odpowiednika, to można przekierować ją na stronę główną.

Jeśli chcesz dowiedzieć się więcej o przekierowaniach 301, to zajrzyj do tego artykułu:

Do każdej strony błędu 404 powinno podejść się indywidualnie i – w zależności od danej sytuacji oraz potrzeb – podjąć odpowiednie kroki. Nie ma tutaj jednego złotego środka.

Pozorne błędy 404

Zdarza się tak, że strona wygląda jak strona błędu 404, ale zwraca kod odpowiedzi 200 (success). Jest to tak zwany pozorny błąd 404. 

Zwracanie kodu powodzenia zamiast kodu 404 (not found), 410 (gone) lub 301 (redirected) nie jest zalecane. Kod 200 informuje przeglądarki, że pod danym adresem istnieje strona, w związku z czym może ona być wyświetlana w wynikach wyszukiwania. Ponadto roboty będą próbowały indeksować taką stronę, mimo że tak naprawdę ona nie istnieje.

Często popełniane błędy związane ze stronami 404

Analizująć strony 404, można spotkać się z częstymi błędami, takimi jak:

  • Brak jasnej i zrozumiałej informacji dla użytkownika. Zdarza się, że użytkownik trafi na stronę błędu 404, jednak na stronie nie ma o tym jasnej informacji, np. wyświetla się strona bez treści z samym nagłówkiem i stopką.
  • Pozorne komunikaty błędu 404, czyli wyświetlanie strony 404, ale z kodem odpowiedzi 200.
  • Ustawienie przekierowania na inną podstronę zamiast wyświetlenia strony błędu 404. Jeśli użytkownik trafił na stronę błędu, ponieważ podał nieprawidłowy adres URL, wtedy nie powinien być przekierowany na inną podstronę. Warto wspomnieć, że istnieją różne automatyczne rozwiązania, np. wtyczki do WordPressa, które obsługują błędy 404 w ten właśnie sposób. Dlatego zawsze warto sprawdzić, jak dokładnie działa taka wtyczka. 
  • Zdarzają się również przypadki, gdy użytkownik zostaje przekierowany na stronę, która wygląda jak strona 404 i znajduje się np. pod adresem /404.html. Takie rozwiązanie nie jest prawidłowe. Strona błędu powinna wyświetlać się pod tym samym adresem, który chciał odwiedzić użytkownik i zwracać kod odpowiedzi 404. 
  • Może się zdarzyć, że strona istnieje, ale mimo tego zwróci komunikat o błędzie i/lub kod odpowiedzi 404. Takie sytuacje zazwyczaj są wynikiem nieprawidłowego działania strony i zdarzają się rzadko.

Błędy 404 mogą mieć wiele przyczyn, dlatego należy monitorować stronę i wykrywać adresy, które zwracają kod odpowiedzi 404. Jeśli wykryjemy taką stronę, to trzeba odpowiednio zareagować, np. ustawiając właściwe przekierowanie.