Zamislite situaciju: izrađujete web stranicu. Unajmite webmastera ili to učinite sami, trošeći mnogo novca i osobnog vremena na to. Ugošćujete svoju zamisao i punite je s ljubavlju informacijama, bez razmišljanja o potrebi spremanja kopije stranice kako ne biste izgubili podatke.
Jednog dana, ne baš sjajno za vas, odete na svoju stranicu, ali ne radi. Počnete otkrivati što je bilo, i, užas, podatkovni centar je izgorio ili je hosting skočio. Ili je možda virus ušao i uništio vaše podatke. Gubitak informacija na web stranici usporediv je s gubitkom informacija na računalu. Kako onda zadržati kopiju stranice?
Pozabavimo se prvo definicijom. Proces arhiviranja web stranice je čuvanje trenutne verzije stranice ili stranice u arhivi za kasniji rad s njom. U te se svrhe koristi specijalizirani softver. Najveća tvrtka na svijetu je Internet Archive, o čemu ćemo raspravljati u nastavku.
Za privatnu arhivu možete koristiti izvanmrežne preglednike koji su posebno dizajnirani za izvanmrežni rad. Oni će pomoći u stvaranjulokalne kopije pojedinačnih web stranica ili cijelih stranica. To uključuje, na primjer:
- HTTrack preglednik na više platformi koji podržava 29 svjetskih jezika i može nastaviti prekinuta preuzimanja, ažurirajte zrcalo stranice.
- Dijelite besplatni Offline Explorer, koji vam omogućuje preuzimanje ne samo datoteka ili stranica, već i cijelih web-mjesta s Interneta putem FTP-a, HTTP-a, HTTPS-a, RTSP-a, MMS-a, BitTorrent-a.
- Upravitelj preuzimanja Upravitelj besplatnih preuzimanja. Integrira se sa svim preglednicima, ima ugrađen FTP, podržava BitTorrent protokol, može kreirati torrent datoteke, presresti linkove iz međuspremnika.
- Teleport Pro zatvoreni izvor za Windows. Program vam omogućuje preuzimanje cijelih stranica.
- Besplatan neinteraktivan program baziran na konzoli za preuzimanje datoteka i web-mjesta s internetskog Wget-a. Program podržava HTTPS, HTTP, FTP protokole, a može raditi i preko HTTP proxy poslužitelja. Prikladno za Linux.
Izrada sigurnosne kopije na hostingu
Možete postaviti sigurnosnu kopiju web-mjesta na svom davatelju usluga hostinga. Da biste to učinili, morate otići na administrativnu ploču, u odjeljak za izradu sigurnosnih kopija. Svaki hosting ima svoju administratorsku ploču i teško je reći gdje točno vaš hostira ovaj odjeljak. Ako ne možete shvatiti, pišite tehničkoj podršci.
Izrada sigurnosne kopije s dodacima
Ako je vaša stranica hostirana na CMS platformi kao što je npr. WordPress, možete spremiti kopiju svoje stranice instaliranjem dodatka wp-db-backup (www.wordpress.org/plugins/wp-db-backup/) ili sličnog. Pravilnim konfiguriranjem dodatka dobit ćete sigurnosnu kopiju stranice svaki dan ili svaki tjedan, kako želite.
Kako spremiti kopiju stranice na svoje računalo
Možete spremiti stranicu na svoje računalo koristeći FTP klijent. Ako koristite program FileZilla, onda stvorite mapu "Backup" na svom računalu (naziv mape može biti bilo koji). Povežite se s poslužiteljem putem FTP klijenta i jednostavno povucite i ispustite kako biste napravili potpunu sigurnosnu kopiju stranice u mapu "Backup".
Osim toga, možete koristiti uslugu Site2ZIP (arhivirati stranicu), program za preuzimanje WinHTTrack WebSite Copier. Kako pogledati spremljenu kopiju stranice? Da biste to učinili, otvorite mapu u koju je stranica spremljena i kliknite na datoteku index.html.
Internet arhiv
U San Farnciscu je 1996. Brewster Cale osnovao neprofitnu internetsku arhivu. Prikuplja kopije svih web stranica, audio i video zapisa, grafičkih datoteka i programa. Arhiva prikupljene građe ovdje je pohranjena jako dugo i postoji slobodan pristup njenim bazama podataka za svakoga.
Ako se pitate kako otvoriti spremljenu kopiju web-mjesta, idite na archive.org/web/ i unesite adresu stranice ili stranice u odgovarajuće polje. Krajem 2012. Internet arhiv je bio 10 petabajta-to je 10.000 terabajta! A do sredine 2016. skupio je 502 milijarde primjeraka.web stranice.
Keširanje stranice od strane tražilica
Spremljena kopija Google stranice nije ništa drugo nego predmemorija stranica stranice koju je napravila tražilica. Svaki korisnik može u bilo kojem trenutku koristiti kopiju stranice za svoje potrebe. Njihovo pohranjivanje na poslužitelje tražilica zahtijeva mnogo resursa, a za to se izdvaja mnogo novca, ali takva se pomoć sama po sebi isplati, budući da još uvijek idemo na tražilice. Istina, ova je metoda prikladna samo za postojeće stranice ili za one koje su nedavno uklonjene. Ako se to dogodilo davno, tražilica će izbrisati podatke.
Specijalizirana tražilica
Osim činjenice da možete ručno pretraživati predmemorirane stranice na Googleu ili Yandexu, možete koristiti specijaliziranu tražilicu cachedview.com. Ima analogni: cachedpages.com.
Ako želite spremiti kopiju stranice ili njene pojedinačne stranice, možete to učiniti sami i besplatno na archive.is. Osim toga, postoji i globalna pretraga verzija koje je korisnik ikada spremio.
Izrada web arhive u nacionalnim knjižnicama
Nacionalne knjižnice danas su suočene sa zadatkom stvaranja arhiva internetskih dokumenata koji su dio znanstvenog, kulturnog i povijesnog naslijeđa čovječanstva. Ali ovo je vrlo problematično.
Studije su pokazale da broj web dokumenata na webu raste eksponencijalno, a u prosjeku dokument živiod jednog do četiri mjeseca. Najprikladnije je koristiti web stranicu kao obračunsku jedinicu za arhivu web dokumenata. Proces stvaranja fonda je stvaranje kopije ili "zrcala" stranice. Budući da se informacije na njemu mijenjaju tijekom vremena, knjižnica mora u redovitim intervalima stvarati zrcala iste web stranice.
Dakle, u Švedskoj postoji 60.000 web stranica, što je 20 puta više od broja tradicionalnih tiskanih publikacija. Primjerci tiskanih dokumenata u knjižnici Švedske zauzimaju 1,7 km polica godišnje. Web arhiva napunila bi 25 km polica! Sada njihova arhiva sadrži 138 milijuna datoteka ukupne težine 4,5 gigabajta.
Internet svakim danom raste. Postoje mnoge tvrtke i web-mjesta koja vode računa o čuvanju kopija web stranica u svojim arhivama. Ali nemojte se oslanjati samo na njih. Pravite pravovremene sigurnosne kopije i nikada nećete izgubiti svoju stranicu.