H T M L - Hyper Text Markup Language
2. HTML-seite
2.5 zeichensätze
Es ist zweckmäßig, im header jeder seite einen zeichensatz zu vereinbaren (vgl. 2.2.1), weil oft nicht klar ist, welchen zeichensatz der browser ohne diese vereinbarung verwendet. Der browser erwartet, dass die seite und ggf. eingabe-dateien in dem vereinbarten zeichensatz codiert sind. Der vereibarte zeichensatz wird auch verwendet, um dateiausgaben zu codieren. Wie die daten bei formulareingaben weitergegeben werden, ist einigermaßen unklar (siehe 9.1). Besondere bedeutung haben folgende zeichensätze:
Ansicode - ISO-8851-1
Alle zeichen werden mit einem byte codiert, dadurch ist der zeichensatz
auf 256 zeichen beschränkt. In der praxis sind es aber weniger, weil die
codierungen 0 – 31 für steuerzeichen reserviert sind, der code umfaßt aber
alle mit einer üblichen "deutschen" tastatur eingebbaren zeichen.
Unicode - UTF-8
Die zeichen werden mit einem oder zwei bytes codiert, dadurch ist der
verfügbare zeichenvorrat erheblich größer. Unicode gilt zu recht als
moderner und sollte bevorzugt verwendet werden.
2.5.1 gruppe umlaute
Bezüglich der codierung des alphabets und der gängigen sonderzeichen
gleichen sich die zeichensätze Ansicode und Unicode bis auf
eine gravierende ausnahme: die hier als gruppe umlaute bezeichneten
zeichen (geschlossenen umlaute und die sonderzeichen ß, €, ³, °, ², ³ µ)
werden im Unicode mit zwei bytes codiert. Das führt zu problemen,
wenn der zeichensatz, mit dem die HTML-datei erstellt wurde nicht mit dem
zeichensatz übereinstimmt, der im header der seite mit charset
vereinbart ist. Einige besonderheiten bei der verarbeitung von
formularen werden unter ziffer 9.9 behandelt, probleme bei der verarbeitung
von dateien werden in der PHP-beschreibung behandelt und in der
MySQL-beschreibung finden sich hinweise zu den dort auftretenden
schwierigkeiten.
2.5.2 zeichen maskieren
Probleme gibt es auch mit den sog. kritischen zeichen, das sind zeichen,
die im HTML-code eine besondere bedeutung haben (", ', &, <, >). Diese
zeichen müssen maskiert werden (siehe 2.5.3). Auch das leerzeichen wird oft
maskiert, weil mehrere aufeinanderfolgende leerzeichen unbarmherzig auf
eines gekürzt werden (das ist eine der gemeinheiten von HTML). Maskiert
bleiben aber alle leerzeichen erhalten, man bezeichnet sie daher als
geschützte leerzeichen.
2.5.3 Codes, Maskierung
Nach dem muster nnnn kann man jedes zeichen mit seiner positionsnummer aus der code-tabelle des ASCII-codes maskieren.
hinweis
Bei der neuerstellung einer anwendung oder homepage sollte
man sich für einen zeichensatz entscheiden, alle seiten mit diesem
zeichensatz erstellen und diesen für den browser vereinbaren und dann dabei
bleiben. Ein späterer wechsel des zeichensatzes kann sehr aufwendig werden.
2.5.4 beispiele
Es sind inhaltlich völlig gleichartige seiten definiert,
die drei drei zeilen ausgeben:
- eine zeile mit den geschlossenen umlauten und dem zeichen ß
- eine zeile mit den gleichen zeichen, aber maskiert
- eine zeile mit den maskierten kritischen zeichen " € § & ' < >
test1 | Die seite ist mit dem zeichensatz Ansicode erstellt und mit charset ist dieser zeichensatz vereinbart. |
test2 | Die seite ist mit dem zeichensatz Unicode erstellt mit charset ist dieser zeichensatz vereinbart |
Bei test1 und test2 gibt es keine probleme, das ergebnis ist in beiden fällen identisch | |
test3 | Die seite ist mit dem zeichensatz Ansicode erstellt, mit charset ist aber Unicode vereinbart und es gibt probleme bei der darsellung der zeichen. |
test4 | Die seite ist mit dem zeichensatz Unicode erstellt, mit charset ist aber Ansicode vereinbart. Erstaunlicherweise gibt es keine probleme bei der darstellung der zeichen, das ergebnis gleicht dem von test1 und test2. |
Fazit
Erstens man darf nicht unterschiedliche zeichensätze verwenden und zweitens
mit maskierten zeichen hat man keine probleme, allerding ist das
umständlich.
h t m l |
C S S |
P H P |
My S Q L |
JAVASCRIPT |
impressum
Für den inhalt der homepage hartard-bernhard.de
ist im sinne des pressegesetzes verantwortlich:
Bernhard Hartard
Gerhart-Hauptmann-Ring 18
81737 München
089 / 670 39 90
familie.hartard@t-online.de
salvatorische erklärung
Die seiten meiner homepage enthalten links
zu anderen seiten im Internet, auf deren gestaltung und inhalt ich
keinen einfluss habe. Ich übernehme keine gewähr für den inhalt der
verlinkten seiten, rechtsverstöße waren für mich zum zeitpunkt der
verlinkung auf diesen seiten nicht erkennbar, eine ständige inhaltliche
kontrolle der verlinkten seiten ist mir weder möglich noch zumutbar.
Aus rechtlichen gründen distanziere ich mich ausdrücklich vom inhalt
der verlinkten seiten und mache mir deren inhalt nicht zu eigen.
Diese erklärung gilt für alle auf meinen seiten angezeigten links.
CLOSE anzeige schließen
start
Damit startet die homepage neu, d.h. der Steinbeisser treibt wieder sein unwesen.
anfang
Hier beginnen die informationen dieser homepage
zur person
Hier findet man informationen zur person des verfassers dieser homepage, wer er ist, woher er kommt, was er gelernt hat und was er im verlauf seines lebens so getrieben hat.
spiele
Hier finden man einige spiele, aber keine wüsten ballerspiele, sondern einige echte knobeleien (hirn-jogging), zwei gesellschaftsspiele (Mensch ärgere Dich nicht, Kniffel) und das spiel aller frechen schüler: schiffe versenken.
galerien
Ein wenig heimatliebe muss erlaubt sein und deshalb findet man hier einige bildergalerien von Speyer und von seinem Dom.
backbuch
Das ist eine sammlung von backrezepten, aus verschiedenen quellen zusammengetragen und fast alle mit mehr oder weniger erfolg ausprobiert. Da findet man in den endlosen weiten des Internet natürlich mehr und besseres.
stammbaum
Das gehört eigentlich in den privaten bereich dieser homepage, denn hier wird der stammbaum des verfassers der homepage gezeigt. Weil aber beim testen der anwendung auch der stammbaum der Wittelsbacher entstanden ist, wurde beides hier veröffentlicht. Vielleicht interessiert es jemand.
exit
Hier kann man Google oder eine beliebige seite im Internet aufrufen oder diese homepage verlassen.
kontakt
Hier kann man dem verfasser und eigentümer der homepage eine email schreiben.
privat
Hier kommt man in den privaten bereich der homepage, besser gesagt, man kommt da nicht hinein, denn dieser bereich ist geschützt und nur dem eigentümer der homepage zugänglich.
doku
Hier sind die programmiertechniken dokumentiert, mit deren hilfe die homepage gebastelt wurde. Genauer gesagt man findet hier kurz gefasste bechreibungen von HTML, CSS, MySQL und Javascript. Das findet man im Internet natürlich viel ausführlicher aber für einen ersten einstieg in die seltsame welt der programmierung sind diese beschreibungen durchaus brauchbar.