Definiranje načina kodiranja znakova

     

Vjerojatno ste barem jedanput u svojoj surferskoj karijeri naišli na stranicu na kojoj se hrvatski znakovi nisu prikazivali ispravno. Do toga dolazi kad način kodiranja znakova nije (ispravno) definiran, pa se za prikaz teksta koristi pogrešna tablica znakova.

Pišete li tekst na svojim stranicama na hrvatskom jeziku, bit će vam potrebni znakovi poput č, ć, đ, š i ž, kojih u engleskoj abecedi nema. Ako ne definirate ispravno način kodiranja znakova, umjesto njih će se web preglednici posjetiteljima prikazivati neke druge znakove i vaš će tekst učiniti teško čitljivim.

primjer 40

Izbor načina kodiranja i
obavijest web preglednicima posjetitelja

Način kodiranja znakova zapisuje se u meta oznaci unutar zaglavlja dokumenta. Općenito, meta oznakama opisujemo našu stranicu ili dajemo određene upute preglednicima i pretraživačima. U ovom ćemo slučaju reći korisnikovu pregledniku da za dekodiranje stranice upotrebljava tablicu znakova Unicode koja uključuje znakove iz mnogih svjetskih jezika i to, konkretno, način kodiranja utf-8.

Upotrebom kodiranja Unicode moći ćete na svojim stranicama spominjati ljude iz raznih krajeva svijeta pišući njihova imena izvorno, tj. upotrebljavajući sve znakove koje upotrebljavaju i oni sami kad se potpisuju: Dvořák, Ångström i drugi.

Više o meta oznakama bit će riječi na naprednim CARNetovim tečajevima. Zasad je dovoljno da znate da meta oznake nemaju završni dio i da ih opisuju dva atributa – http-equiv i content. Meta oznaka kojom ćemo definirati način kodiranja izgledat će ovako:

<meta http-equiv="Content-Type"
      content="text/html; charset=utf-8">

U upotrebi su (bili) i drugi načini kodiranja koji omogućavaju pisanje i prikaz naših znakova, no u njima možete pisati samo znakove koji su u upotrebi u zemljama geografski bliskim našoj.

To su kodiranje iso-8859-2, koje predstavlja međunarodni standard, te windows-1250, koje je stvoreno u tvrtki Microsoft.

Pohranjivanje stranice
izabranim načinom kodiranja

Da bi web stranica bila ispravno prikazana, treba još istim načinom kodiranja stranicu i pohraniti. Naime, da bi se tekst zapisao u računalu, on se pretvara u brojeve, kodira. Način kodiranja pri pohranjivanju stranice mora biti isti kao način kodiranja koji smo naveli u meta oznaci, tj. onaj kojim će se stranica pretvoriti u svima čitljive znakove.

Dakle, editor koji upotrebljavate za pisanje kôda mora podržavati izabrani način kodiranja znakova, te ga u editoru trebate postaviti kao način pohranjivanja podataka.

Ako upotrebljavate editor Notepad++, prije početka pisanja web stranice izaberite Format > Kodirati u UTF-8. Još je bolje od toga izabrati to kodiranje za sve dokumente koji će biti stvarani: Postavke > Postavke... > kartica Novi dokument/Otvaranje/Pohranjivanje, pa izabrati UTF-8 iz skupine Kodiranje.

Ako upotrebljavate editor SharePoint Designer, pretpostavljamo da prema preporukama radite s web sjedištem, a ne s pojedinačnim stranicama. U tom slučaju iz izbornika Site otvorite Site Settings, te tamo na kartici Language pod Default page encoding namjestite UTF-8. Inače je ista kartica, ali koja se odnosi samo na jednu stranicu, dostupna i desnim klikom na stranicu u pogledu Design > Page properties ili promjenom podataka u meta oznaci.

Otvorite u editoru datoteku  osnovni_kod.htm te uz osnovni HTML kôd definirajte i način kodiranja znakova. Pripazite da se meta oznaka nalazi u zaglavlju dokumenta.

Budući da editori ne moraju uvažavati sadržaj vašeg HTML dokumenta, prije spremanja dokumenta ne zaboravite zadati editoru da ćete raditi s UTF-8 kodiranjem.

Konačno, promijenite tekst u tijelu dokumenta tako da sadrži naša slova. Spremite datoteku, te je otvorite u web pregledniku dvoklikom na njezino ime. Provjerite prikazuju li se ispravno naša slova.

UPUTA:

Ako na vašoj stranici nisu ispravno prikazana naša slova, prvo provjerite nalaze li vam se sve oznake na pravim mjestima. To se prije svega odnosi na meta oznaku koja se treba nalaziti u zaglavlju dokumenta, tj. između oznaka <head> i </head>.

Nakon toga u editoru provjerite jeste li spremili dokument s pravim kodiranjem. U programu Notepad++ to se radi tako da potražite točkicu u izborniku Format. Ako je na pogrešnom mjestu, pretvorite dokument u odgovarajuće kodiranje funkcijom Format > Pretvoriti u UTF-8.

Ako ste dokument spremili kodiranjem Unicode (UTF-8), noviji web preglednici će ga prepoznati bez obzira na meta oznaku.

CARNet - puni naziv i logo
Accessibility

Background Colour

Font Face

Font Size

1

Text Colour