R-pd.15.7
Geef in de markup taalvariaties in de inhoud van pagina's aan.
Taalvariaties binnen een pagina
Het duiden van de basistaal van een pagina is de eerste stap voor het aangeven van taal in de markup. Er kunnen echter in de inhoud van de pagina Engelse woorden, een Franstalig citaat of de titel van een Duitstalig boek in de inhoud van de pagina voorkomen. De volgende stap is het aangeven van de taal van deze woorden en zinnen in de markup.
Uitleg van deze richtlijn
Webontwikkelaars en contentbeheerders moeten streven naar het adequaat markeren van afwijkingen van de basistaal in de inhoud van pagina’s. Het specificeren van deze taalafwijkingen in de markup heeft dezelfde voordelen als het specificeren van de basistaal van een pagina.
Het markeren van taalwisselingen gebeurt door middel van het lang attribuut dat toe te passen is op vrijwel elk HTML-element.
Zoals bij de basistaal van een pagina is beschreven, gebruikt men in XHTML 1.0 het lang attribuut én de xml:lang variant: <blockquote lang="fr" xml:lang="fr">.
Het toepassen van het lang attribuut heeft tot gevolg dat alle tekst en elementen binnen het element met dit attribuut tot die taal worden verklaard.
Beoordeel bij het aanbrengen van taal-markup eerst of er niet al een geschikt HTML-element toepasbaar is op de tekst. Zoals hierboven het p (paragraph) element en het blockquote element (voor blok citaten). Hier kan vervolgens het lang attribuut aan worden toegevoegd. Als er geen geschikt element te vinden is, kan het invoegen van een neutraal element als het SPAN element uitkomst bieden.
Wat zijn taalvariaties?
In principe zijn woorden (of delen van samengestelde woorden) die niet voorkomen in het algemene woordenboek van de gekozen basistaal afwijkingen van deze taal. Voor een Nederlandstalige pagina is de Woordenlijst Nederlandse Taal – Officiële Spelling 2005 (het Groene Boekje) de richtlijn.
Afkortingen
Afkortingen waarvan de voluit geschreven betekenis een anderstalig begrip is, kunnen als anderstalig worden gemarkeerd.
Anderstalige afkortingen gemarkeerd met het lang attribuut (HTML)
<abbr lang="en" title="Frequently Asked Questions">FAQ</abbr><abbr lang="la" title="Curriculum Vitae">CV</abbr>
Persoons-, merk- en plaatsnamen
Namen van personen en merken worden beschouwd als taal-neutrale begrippen. Zo is de naam Jan nog steeds Jan, ongeacht in welke taal over Jan wordt gesproken. In een Franse context kan de naam met een Frans accent worden uitgesproken, maar dat maakt het nog steeds geen Frans woord.
Dat het misschien verleidelijk is om persoons- en merknamen wel te markeren als taalvariaties komt naar voren bij namen als John en Coca-Cola binnen een Nederlandstalige tekst.
Plaatsnamen en geografische locaties zijn een apart geval. Zo heet de hoofdstad van Oostenrijk in het Nederlands Wenen en in het Engels Vienna. Sommige geografische locaties zijn niet te vertalen, zoals The Rocky Mountains, terwijl anderen weer in hun oorspronkelijke vorm vrijwel onbekend zijn voor buitenstaanders, zoals Nihon (Japan).
De W3C HTML specificatie zegt over het lang attribuut het volgende.
“The intent of the lang attribute is to allow user agents to render content more meaningfully based on accepted cultural practice for a given language.”
Het gebruik van het lang attribuut is dus praktisch bedoeld. Er is voor te pleiten dat sommige namen, die onmiskenbaar een anderstalige achtergrond hebben, als anderstalig worden gemarkeerd. Schermleesprogramma’s kunnen een poging doen de naam fonetisch uit te spreken, in een accent dat het begrip door de gebruiker ten goede komt. Ook vertaalsoftware zou kunnen besluiten om bijvoorbeeld deze gemarkeerde begrippen met rust te laten.
Webontwikkelaars die met deze praktische toepassingen rekening willen houden, kunnen persoons-, merk- en plaatsnamen als taalvariaties markeren.
Symbolen
Mathematische symbolen en andersoortige tekens worden niet als taalvariaties beschouwd. Zo is het alpha, gamma of pi symbool geen Griekse taal. Het uitspellen van woorden is een ander geval.
Het spellen van een woord (HTML)
...schrijft men met een ä.
Het zou duidelijker zijn voor een bezoeker als deze tekst als volgt werd herschreven.
Het spellen van een woord, geherformuleerd (HTML)
...schrijft men met een <strong>a-umlaut</strong> (ä).
Omdat de term umlaut wel Duits is, is de tekst als volgt op te maken.
Het spellen van een woord, met markup (HTML)
...schrijft men met een <strong><i lang="de"></strong>a-umlaut<strong></i></strong> (ä).
Voor het gebruik van het i (italics) element, zie Beschrijvende markup.
Taalvariaties en HTML attributen
Verschil in taal tussen elementinhoud en attribuutinhoud
Soms wordt een webontwikkelaar of contentbeheerder geconfronteerd met een situatie waarin een element twee talen bevat: in een markup-attribuut komt een andere taal voor dan in de door het element gemarkeerde tekst.
Twee talen binnen een element (HTML)
<a title="Jan Simons over de immigratiewetgeving" lang="en" ...>Rules for immigration</a>
In dit voorbeeld is de tekst binnen de <a></a> tags een Engelstalige tekst. Deze is terecht als zodanig gemarkeerd. Het title attribuut bevat echter Nederlandstalige waarde. Wanneer een lang attribuut op een element voorkomt, geldt deze niet alleen voor alle tekst (en andere elementen) binnen het element, maar ook voor de waardes van de attributen.
Webontwikkelaars hoeven zich geen grote zorgen te maken om moeilijkheden die browsers, schermleesprogramma’s en andere software zouden kunnen hebben in deze situatie. Ondersteuning voor markup voor taalvariaties staat nog in de kinderschoenen. Dat geldt ook voor ondersteuning van de combinaties die mogelijk zijn tussen taal-markup en andere markup als title-attributen.
Wie naar perfectie streeft, kan echter het voorbeeld als volgt herschrijven.
Twee talen binnen een element, en oplossing (HTML)
<a title="Jan Simons over de immigratiewetgeving" ...><span lang="en">Rules for immigration</span></a>
Taalvariaties binnen de waarde van een attribuut
Soms zullen er taalvariaties binnen de waarde van een attribuut voorkomen, zoals in het volgende voorbeeld.
Twee talen in een attribuut (HTML)
<a <strong>title="Lees verder: Rules for immigration"</strong> ...>
De waarde van een attribuut mag slechts tekst en geen elementen bevatten. Daarom bestaat er voor deze situatie geen oplossing. De webontwikkelaar kan deze situatie hooguit vermijden door de gelinkte tekst kundig te formuleren. Zoals echter al vermeld werd, zijn er op dit moment in de praktijk geen problemen bekend met situaties als deze.
Voorbeelden
Voorbeeld van gebruik van het lang attribuut (HTML)
U kunt uw reactie als <span <strong>lang="en"</strong>>attachement</span> meesturen.
Het lang attribuut op een citaat (HTML)
<blockquote lang="fr"><p>Raconter tout serait impossible.</p>
</blockquote>
Gerelateerde richtlijnen
- R-pd.2.9: Bouw een website volgens de Web Content Accessibility Guidelines (WCAG 1.0) van het W3C.
- R-pd.15.1: Het maken van een taalkeuze dient voor de bezoeker mogelijk te zijn op iedere pagina in de site.
- R-pd.15.2: Links voor taalkeuze dienen op een duidelijke en consistente plaats in de navigatie van de site te staan.
- R-pd.15.3: Gebruik voluit geschreven (tekstuele) links naar de taalvarianten.
- R-pd.15.4: Schrijf links naar taalvarianten in hun corresponderende taal.
- R-pd.15.5: Gebruik geen associaties met nationaliteiten voor taalkeuze.
- R-pd.15.6: Specificeer de basistaal van een pagina in de markup.
Bijbehorende ijkpunten normdocument
- IJkpunt 4.1: Geef duidelijk veranderingen aan in de natuurlijke taal van de documenttekst en van alle tekstequivalenten (bijvoorbeeld onderschriften).
