Mis on HTML?

Ülemaailmne võrk WWW (World Wide Web) on kootud Webilehtedest, mis on loodud nn. hüperteksti märkimise keele HTML (HyperText Markup Language) abil. Kuigi paljud räägivad programmeerimisest selles keeles ei ole HTML siiski programmeerimiskeel selle traditsioonilises tähenduses. HTML - on dokumendi paigutuse keel. HTML dokumendi koostamisel teostatakse tekstidokumendi märkimine sarnaselt nagu seda teeb kirjastaja punase pliiatsi abil. Need märked on dokumendis sisalduva info esitusviisile osutamiseks.

Eriotstarbelised HTML-dokumentide vaatamiseks mõeldud programmid, mida sageli nimetatakse lehitsejateks on ette nähtud HTML reeglite kohaselt märgitud failide interpreteerimiseks, nende vormindamiseks Weebilehtedeks ja nende sisu näitamiseks kasutaja arvuti ekraanil. On olemas palju programme lehitsejaid, mis on loodud mitmesuguste kompaniide poolt kuid tänapäeval on kõigest sellest mitmekesisest programmide valikust ilmselgelt silmapaistvamad kaks programmi liidrit - Netscape Communicator ja Microsoft Internet Explorer.

Programm Netscape Communicator on loodud kompaniis Netscape Communications Corporation. Nagu ka teiste programmide puhul on olemas ka sellest programmist rida versioone. Viimane versioon programmist Netscape Communicator on 4.7. Programm Internet Explorer on loodud kompaniis Microsoft. Selle programmi viimane versioon on - 6.0.

Teised lehitsejad jäävad oma populaarsuselt tugevalt maha. Mõned aastad tagasi oli kompanii Netscape lehitseja juhtival kohal lehitsejate seas, kaks kolmandikku kasutajatest kasutas just seda lehitsemisprogrammi. Tootes oma lehitseja rakendas kompanii Microsoft suuri jõupingutusi selle turuosa vallutamiseks. Massimeedias võis tihti kohata kommentaare lehitsejate sõja kohta kasutajate pärast. Nüüdseks on need kaks lehitsejat võrreldavad oma populaarsuse poolest. Microsoft lehitseja populaarsusele aitas tugevasti kaasa selle liitmine operatsioonisüsteemi Windows 98 koosseisu. Kuid lõppkokkuvõttes jääb lehitseja valik kasutajale.

Tänapäeva lehitsejatel on laialdased võimalused kuid põhiliseks jääb nendes HTML reeglite kohaselt märgitud dokumentide interpretatsioon. Nende reeglite kirjeldamisele ongi pühendatud antud kursus.

Teek (TAG).

Selleks, et mõista, mida endast kujutab HTML tuletame meelde vanad head ajad, kui paljud töötasid WordStar tüüpi tekstiredaktoritega. Nendes oli mingi lause esiletõstmiseks näiteks poolrasvase ðriftiga vaja selle ette ja taha panna eriotstarbelised märked (/B ja /b):

/B See tekst tuuakse esile poolrasvases ðriftis /b

Sellise teksti printimisel (kuvarist siin juttu ei ole, nendel kaugetel aegadel neid kas ei olnud üldse või olid ainult alfabeetilis-numbrilised kuvarid, mis ei võimaldanud kuvada vormindatud ðrifte) sundis sümbol /B kasutama printerit poolrasvast ðrifti senikaua kuni tuli ette sümbol /b.

HTML töötab täpselt sama moodi. Kui on vaja välja tuua tekst ekraanil poolrasvase ðriftiga, siis võib seda teha analoogselt:

<B> See tekst tuuakse esile poolrasvases ðriftis </B>

Sümbolid <B> lülitavad sisse poolrasvase laadi ja sümbolid </B> lülitavad selle välja.

Selliseid sümboleid, mis juhivad teksti kuvamist ja samas ise ei ilmu ekraanile nimetatakse HTML keeles teekideks
(ingl. Keeles sõna TAG - tunnus).

Kõik HTML keele teegid on välja toodud piirnevate sümbolitega (< ja >), mille vahele kirjutatakse teegi identifikaator (nimi) ja võimalik, et ka teegi parameetrid. Meie näites oli teegi nimeks B.

Ainsaks erandiks sellest reeglist on kommentaaride teegid (<!-- ja -->).

Teekide nimetusi võib kirja panna suvalises registris. Kuid ühtlustamise nimel lepime kokku, et teeke paneme kirja ainult trükitähtedega.

Suuremat osa HTML teekidest kasutatakse paarikaupa, st et mingi teegi, nimetame selle avavaks teegiks on dokumendis olemas vastav sulgev teek. HTML reeglite kohaselt kirjutatakse sulgev teek samamoodi nagu avavgi teek, kuid sümboliga (/) enne teegi nimetust. Ainsaks oluliseks erinevuseks teekida vahel seisneb selles, et sulgevad teegid ei kasuta parameetreid.

Teeke, mis vajavad vastavat sulgevat teeki nimetatakse konteiner-teekideks. Kõik, mis on kirja pandud vastavate avava ja sulgeva teegi vahele nimetatakse konteiner-teegi sisuks.

On olemas üldised reeglid teekide interpreteerimiseks lehitsejate poolt. Erinevalt programmeerimiskeeltest, milledes vigased operaatorid kutsuvad esile vastavad kompilaatori veateated ja nõuavad nende parandamist, ei ole HTML tavaks reageerida teekide vigasele kirjapildile. Vigaselt kirjutatud teeki või selle parameetrit peab lehitseja lihtsalt ignoreerima.

Teeke võib kirja panna ka parameetritega või atribuutidega (ingl. ATTRIBUTE). Selles kursuses kasutame reeglina terminit parameeter. Lubatud parameetrite loend on individuaalne iga teegi jaoks.

Parameetrite kirjutamise üldised reeglid seisnevad järgnevas:

  1. Teegi nime järele kirjutatud parameetrid eraldatakse tühikuga.
  2. Parameetrite järjekord on vaba.
  3. Paljud parameetrid nõuavad nende väärtuse kirjutamist, kuid mõned parameetrid või kirja panna ka ilma väärtuseta ja saavad siis väärtuseks vaikimisi vastuvõetud väärtuse.
  4. Kui parameeter nõuab väärtust, siis pannakse see kirja võrdusmärgi abil.
  5. Parameetri väärtuse võib kirja panna nii sulgudes kui ka ilma sulgudeta. Ainsaks erandiks on parameetrite väärtused, mis sisaldavad tühikuid, siis tuleb kindlasti kasutada sulgusid.
  6. Parameetrite väärtustes on mõnikord tähtsal kohal (parameetrite ja teekide nimetustes ei oma register tähtsust) ka väärtuse register. Näiteks teek parameetriga:

<TABLE BORDER ALIGN="left">

Siin on teegile <TABLE> antud ette kaks parameetrit. Esimene parameeter BORDER on toodud ilma väärtuseta. Teine parameeter ALIGN on väärtusega left.

Üldiselt võivad teegid sisaldada erinevaid parameetreid ent on olemas rida parameetreid, mis on omased praktiliselt kõikidele teekidele.

Kõik teegid, mida saab kasutada HTML dokumendi jaotises <BODY> võivad omada parameetreid: CLASS, ID, LANG, LANGUAGE, STYLE ja TITLE. Nende parameetrite kasutamine on otstarbekas eelkõige dokumendi laadidega vormindamisel.

Parameetreid CLASS, ID ja STYLE toetab Internet Explorer, alates versioonist 3.0. ja Netscape alates versioonist 4.0. neid parameetreid on vaja laadide kasutamisel.

Parameetreid LANG, LANGUAGE ja TITLE toetab ainult Internet Explorer. Need parameetrid näitavad vastavalt: kasutatav keel (LANG=ru), skiptide kirjutamise keelt (LANGUAGE=JavaScript) ja spikreid, mida näeb kasutaja kui ta osutab hiirega mingile elemendile ekraanil (TITLE).

Tänapäeva HTML-is kirjutatakse peale teekide ja nende sisu HTML-algkoodi ka stsenaariumide koodid (JavaScript või VBScript).

Selle esimese peatüki kokkuvõtteks võib mainida, et lihtsamad HTML-dokumendid kujutavad endast harilikke terkstifaile, mille vaatamiseks ja redigeerimiseks võib kasutada suvalist tekstiredaktorit. Need failid on reeglina laiendiga HTM või HTML. Meie kursuse põhiprogrammiks on siiski professionaalne rakend: Macromedia DreamVeiwer 4.0.

 

HTML spetsifikatsioonid.

Keel HTML sai populaarseks keeleks 90. aastate keskpaiku, tänu interneti eksponentsiaalsele kasvule. Selleks ajaks sai vajalikuks keele standardiseerimine kuna mitmesugused kompaniid arendades välja tarkvara internetile juurdepääsuks pakkusid oma HTML variante, nende variantide arv kasvas üha. Tuli aeg jõuda kokkuleppele mingi ühese HTML teekide kasutamise süsteemile.

Töö HTML spetsifikatsiooni väljatöötamiseks võttis enda kanda organisatsioon nimetusega World Wide Web Consortium (lühidalt W3C). tema ülesandeks oli spetsifikatsiooni koostamine, mis rahuldaks kaasaegseid keele võimalusi ja arvestaks lehitsejaid tootvate kompaniide mitmesuguseid ettepanekuid. Nii, novembris 1995 ilmus HTML 2.0. spetsifikatsioon, mis oli 1994 a. lõpuks kujunenud HTML kasutamise praktika formalisatsiooniks.

Mais 1996 ilmus HTML 3.2 ja juulis 1997 ilmus juba HTML 4.0. tänapäeval on HTML 4.0 viimane vastuvõetutest üldkasutatavatest spetsifikatsioonidest.

Spetsifikatsioonis HTML 4.0 sai võtmeideeks dokumendi struktuuri kirjelduse lahutamine tema ekraanile kujutamise kirjeldusest. Kogemus näitab, et dokumendi struktuuri ja esitusviisi vähendab kulutusi laialdase platvormide, keskkondade spektri toetamisele ja samas kergendab oluliselt paranduste sisestamist dokumentidesse. Vastavuses selle ideega tuleb laiemalt kasutada dokumendi esitusviisi laaditabelite abil kirjeldamise meetodit selle asemel, et anda konkreetseid andmeid esitusviiside kohta vaheldumisi dokumendi sisuga.

Ametlikud andmed HTML keele spetsifikatsioonide kohta võib alati saada Konsortsiumi W3C ametlikult interneti-leheküljelt: http://www.w3.org/TR/. HTML 4.0 spetsifikatsioon asub: http://www.w3.org/TR/REC-html40-971218.

Tuleb märkida, et loogilise asjade käigu järgi peaks spetsifikatsioon mängima juhendava ja suunava jõu rolli tagades informatsiooni esitamise vormide samasuse erinevate lehitsejate poolt. See on ideaalne variant mille poole tuleks püüelda. Tegelikult ei ole kõik nii korras. Pidevalt ilmuvad uued ideed, mida realiseerivad lehitsejate tootjad oma lehitsejates ja mida nad ka propageerivad. Head ideed juurduvad ja võetakse peagi kasutusele ka teiste tootjate poolt. Osa uutest võimalustest jääbki üksikute lehitsejate käsutusse. Väga head ideed satuvad lõpuks spetsifikatsioonidesse ja saavad üldkasutatavateks. Sellisel moel toimub lehitsejate võimaluste täiustumine ja spetsifikatsioonide täpsustamine pidevalt.