6 types de données de base HTML

Cette section décrit les principales caractéristiques des types de données qui peuvent être des éléments de contenu ou de la valeur d'attribut.

Pour plus d' informations d' introduction sur la lecture de la DTD HTML, voir. Section sur le guide SGML .

6.1 Informations sur le registre

Chaque définition d'attribut comprend des informations sur les livres de ses valeurs. Informations sur le registre représenté par les touches suivantes:

CS
La valeur est sensible à la casse (ie, les agents utilisateurs pour les différentes interprétations de "a" et "A").
CI
La valeur est sensible à la casse (ie, les agents utilisateurs interprètent le même "a" et "A").
CN
La valeur est sensible à la casse, par exemple, parce qu'il est un numéro ou un caractère du jeu de caractères du document.
Californie
La définition même d'un élément ou d'un attribut donne des informations sur regitsre.
CT
Pour plus d'informations à propos de la sensibilité, voir. Dans la définition de type.

Si la valeur d'attribut est une liste de clés appliqués à chaque valeur dans la liste, sauf indication contraire.

6.2 Les principaux types de SGML

Dans la détermination du type d'un document définit la syntaxe de HTML contenu d'élément et d' attribut valeurs en utilisant des étiquettes SGML (par exemple, PCDATA, CDATA, NAME, ID, etc.). Les définitions complètes, voir. Dans [ISO8879] . Voici une synthèse des touches:

  • A CDATA - une séquence de caractères du jeu de caractères du document, il peut inclure des entités de caractères. Les agents utilisateurs devraient interpréter les valeurs d'attribut comme suit:
    • Remplacer les entités de caractères pour les caractères,
    • Ignorer newline
    • Remplacer chaque retour chariot ou un onglet avec un seul espace.

    Les agents utilisateurs peuvent ignorer les espaces au début et aux valeurs d'attribut CDATA d'extrémité (par exemple, "MyVal" interprété comme "myval"). Les auteurs ne doivent pas déclarer les valeurs d'attribut avec des espaces au début ou à la fin.

    Dans certains HTML 4.0 attributs avec CDATA les valeurs d'attribut de la spécification impose des contraintes supplémentaires sur l'ensemble des valeurs admissibles des attributs qui ne sont pas exprimés dans la DTD.

    Bien que les éléments STYLE et SCRIPT utilisent CDATA pour leur modèle de données, pour ces éléments, les agents utilisateurs devraient gérer CDATA différemment . Markup et les entités doivent être considérées comme du texte et transmis à l'application comme il est. La première occurrence de la séquence de caractères "</" (balise de fin ouvre le séparateur) est considéré comme la fin du contenu d'un élément. Les documents valides, ce serait la balise de fin de l'élément.

  • Mots - ID et NAME doivent commencer par une lettre ([A-Za-z] ), pour qui peut être suivi par un certain nombre de lettres, chiffres ([0-9]), des tirets ( "-"), soulignement ( "_") , deux points ( ":") et les points ( ".").
  • IDREF et IDREFS - est une référence à l'ID d'étiquette, certains autres attributs. IDREF - une seule étiquette, et IDREFS -Séparé liste séparés par des espaces d'étiquettes.
  • Mots - clefs NUMÉRO doit contenir au moins un chiffre ([0-9]).

6.3 Les chaînes de texte

Un certain nombre d'attributs ( % du texte; dans le DTD) prendre le texte qui est destiné à être lu par les humains. Pour plus d' informations sur les attributs d' introduction, vous pouvez voir dans la discussion des attributs .

6.4 l'URI

Dans cette spécification URI terme est utilisé tel que défini dans [URI] (voir. Aussi [RFC1630] ).

Rappelez - vous que l'URI comprend URL (tel que défini dans [RFC1738] et [RFC1808] ).

URI relative résolu à l'URI complète en utilisant la principale URI. [RFC1808] , section 3, qui définit l'algorithme normatif pour ce processus. En savoir plus sur la base URI cm. Sous la principale URI dans le chapitre sur les liens .

URI représenté dans la combinaison de caractères DTD % URI; .

URI du tout sensible. Il peut y avoir l'URI, ou une partie de l'URI, dans ce cas, n'a pas d'importance (par exemple, les noms de machines), mais leur identification peut être difficile. Les utilisateurs doivent toujours supposer que l'URI-sensible (à ne pas confondre).

Pour plus d' informations sur les caractères, les caractères non-ASCII dans les URI des valeurs d' attribut , voir. Dans l'annexe.

6.5 Couleurs

La valeur du type d'attribut "couleur" ( % de la couleur; ) fait référence aux définitions de couleurs comme spécifié dans [sRGB] . La valeur de couleur peut être un nombre hexadécimal (précédé par un signe dièse) ou l'un des noms de couleurs seize suivants. Les noms de couleur sont insensibles à la casse.

Les noms de couleurs et les valeurs RVB
Noir = "# 000000" Vert = "# 008000"
Argent = "# C0C0C0" Chaux = # 00FF00 "
Gris = "# 808080" Olive = "# 808000"
Blanc = "#FFFFFF" Jaune = "# FFFF00"
Maroon = "# 800000" Marine = # 000080 "
Rouge = "# FF0000" Bleu = "# 0000FF"
Violet = "# 800080" Teal = "# 008080"
Fuchsia = "# FF00FF" Aqua = "# 00FFFF"

Autrement dit, la valeur de "# 800080" et "Purple" signifient tous deux magenta.

6.5.1 Remarques sur l' utilisation des couleurs

Bien que les couleurs peuvent ajouter des informations importantes dans le document et d'améliorer la lisibilité en utilisant des couleurs, garder à l'esprit les lignes directrices suivantes:

  • L'utilisation d'éléments et attributs HTML pour spécifier la couleur est indésirable . Au lieu de cela, utilisez une feuille de style .
  • Ne pas utiliser de combinaisons de couleurs qui causent des problèmes pour les utilisateurs.
  • Si vous utilisez une image comme arrière-plan ou de définir la couleur de fond, ne pas oublier de devenir et de couleurs de texte.
  • Les couleurs spécifiées dans les éléments de BODY et POLICES et bgcolor dans les tableaux repassés différemment sur différentes plates - formes (postes de travail, Mac, Windows, et sur l'écran LCD et CRT), alors ne comptez pas sur un certain effet. À l'avenir, le soutien pour les modèles de couleur [sRGB] , ainsi que des profils de couleur ICC devrait éliminer ces problèmes.
  • Si possible, prenez un commun accord.

6.6 Longueur

HTML définit trois types d'attributs pour les longueurs:

  1. Pixels : La valeur ( % des pixels; dans le DTD) - est un nombre entier, ce qui représente le nombre de pixels (à l' écran, sur le papier). Ainsi, la valeur "50" indique cinquante pixels. Pour plus d' informations à propos de la définition normative du pixel cm. Dans [CSS1] .
  2. Longueur : Valeur ( % Longueur, en DTD) peut% Pixel; ou la proportion de pourcentage vertical ou des distances horizontales. Ainsi, la valeur «50%» signifie que la moitié de l'espace disponible.
  3. MultiDlina : Valeur ( % MultiLength; en DTD) peut% Longueur; ou une longueur relative . La longueur relative est sous la forme "i *", où "i" - entier. La répartition de l'espace entre les éléments en compétition pour l'espace, les agents utilisateurs, d'abord attribuer une place pour la longueur spécifiée en pixels et pourcentages, puis diviser l'espace restant entre les longueurs relatives. Chaque partie obtient la longueur relative de l'espace disponible entier proportionnelle précédente '*'. La valeur de «*» est équivalent à «1 *». Ainsi, s'il y a 60 pixels espace après l'agent utilisateur va allouer de l'espace pour les longueurs déterminées en pixels et pourcentages et longueurs relatives concurrentes sont 1 *, 2 * et 3 *, 1 * reçoit 10 pixels, 2 * - 20 pixels et 3 * - 30 pixels.

longueurs de valeur ne sont pas sensibles à la casse.

6.7 Types de contenu (types MIME)

Remarque. "Type de support" (tel que défini dans [RFC2045] et [RFC2046] ) précise la nature de la ressource liée. Cette spécification utilise le terme "type de contenu" au lieu de "type de média" conformément à son utilisation. En outre, dans la présente spécification, «type de support» peut se référer à la presse, sur lequel l'agent d'utilisateur génère un document.

Ce type est représenté dans une DTD utilisant le % ContentType;.

Les types de contenu sont insensibles à la casse.

Des exemples de types de contenu comprennent "text / html", "image / png", "image / gif", "video / mpeg", "audio / basic", "text / tcl", "text / javascript" et "text / vbscript ». La liste actuelle des types MIME enregistrés, voir. Dans [MIMETYPES].

Remarque. Type de contenu "text / css", même si elle n'a pas été enregistré auprès de l'IANA, doit être utilisé lors de la connexion des éléments est une feuille de style [de CSS1] .

6.8 Codes de langue

Les valeurs d' attribut, dont le type est le code de langue ( % LanguageCode dans la DTD), fait référence à un code de langue comme spécifié dans [RFC1766] , section 2. Pour plus d' informations sur la spécification des codes de langue en HTML, voir. Dans la section des codes linguistiques . Les lacunes linguistiques de code sont inacceptables.

Les codes de langue sont sensibles à la casse.

6.9 Codage des caractères

Attributs "charset" ( % Charset dans le DTD) se réfèrent à un codage de caractères tel que décrit dans le codage de caractères . Les valeurs doivent être des chaînes (par exemple, "EUC-jp") à partir du registre de l' IANA (voir la liste complète. Dans [Charsets] ).

Les noms des codages de caractères sont insensibles à la casse.

Les agents utilisateurs pour déterminer le codage de caractères de la ressource externe doit effectuer les étapes décrites dans la section indication de codages de caractères .

6.10 symboles individuels

Certains attributs appellent un caractère unique de l'ensemble de caractères du document . Ces attributs sont de type % Caractère dans la DTD.

Les caractères individuels peuvent être spécifiés avec des références de caractères (par exemple, "& amp;").

6.11 Date et heure

[ISO8601] permet date et l' heure de nombreuses options soumission. La spécification actuelle utilise l' un des formats décrits dans le profil [DATETIME] pour déterminer la chaînes admissibles date / heure ( % Datetime dans la DTD).

Ceci est le format:

  AAAA-MM-JJThh: mm: ssUChP
où:
  AAAA = année de quatre chiffres
  MM = mois à deux chiffres (01 = Janvier, etc.)
  DD = jour du numéro à deux chiffres (01-31)
  hh = deux chiffres de l'heure (00 - 23) (haut / h PAS autorisé)
  mm = deux chiffres de minute (00-59)
  ss = deux chiffres de seconde (00-59)
  MVA = pointeur vers le fuseau horaire

Pointeurs fuseau horaire:

Z
Il indique UTC (Coordinated Common Time). "Z" doit être en majuscules.
+ Hh: mm
Il indique que l'heure locale est séparée dans les hh heures et mm minutes en avance sur UTC.
-CHCH: mm
Il indique que l'heure locale est en retard de hh heures et mm minutes UTC.

Ces composants doivent être présents exactement, avec la même ponctuation exacte. Rappelez - vous que la lettre "T" apparaît littéralement dans la chaîne (il doit être en majuscules), pour indiquer le début du temps, comme décrit dans [ISO8601]

Si une application connaît le temps de génération à l'intérieur d'une seconde, secondes peuvent être utilisées pour la valeur "00" (également pour les minutes et les heures, si nécessaire).

Remarque. [DATETIME] ne concerne pas les secondes supplémentaires.

6.12 Types de liens

Les auteurs peuvent utiliser les reconnus suivants types de liens, énumérés ici avec les interprétations classiques. Dans les DTD % LinkTypes est une liste des types de liens, séparés par des espaces. Symboles lacunes dans les types de liens ne sont pas autorisés.

Ces types de liens ne sont pas sensibles à la casse, à savoir, «Alternate» signifie la même chose que "alternate".

Les agents utilisateurs, les moteurs de recherche, etc. peut interpréter ces types de liens de plusieurs façons. Par exemple, les agents utilisateurs peuvent donner accès à des documents liés via la barre de navigation.

alterné
Désigne versions alternatives d'un document dans lequel le lien réside. Ensemble avec l'attribut lang signifie la traduction d'un document. Ensemble avec les attributs des médias indique la version créée pour les autres médias.
stylesheet
Identifie une feuille de style externe. Voir. Section sur des feuilles de style externes . Utilisé conjointement avec le type "alternatif" pour les feuilles de style sélectionnables par l'utilisateur lien.
début
Il indique le premier document dans l'ensemble. Ce type de lien indique aux moteurs de recherche sur ce que l'auteur considère comme le début du jeu de documents.
suivant
Indique le document suivant dans une séquence linéaire de documents. Les agents utilisateurs peuvent pré-charger le document "suivant" pour réduire le temps de charge.
Précédent
Indique le document précédent dans une série ordonnée de documents. Certains agents utilisateurs reconnaissent également le synonyme "Précédent".
contenu
Il se réfère à un document servant contenu. Certains agents utilisateurs reconnaissent également le synonyme ToC (de «Table des matières»).
index
Il fait référence à un document qui est un pointeur sur le document en cours.
glossaire
Il se réfère à un document - un glossaire des termes liés au document en cours.
droit d' auteur
Indique un avis de droit d'auteur pour le document actuel.
chapitre
Il fait référence à un document qui est un chapitre dans une collection de documents.
section
Elle fait référence à un document qui est une section dans une collection de documents.
Le paragraphe
Il fait référence à un document qui est une sous-section dans une collection de documents.
appendice
Fait référence à un document est une annexe dans une collection de documents.
aider
Il fait référence à un document qui contient le certificat (pour plus d'informations, des liens vers d'autres ressources documentaires, etc.)
Bookmark
Indique un signet. Bookmark - une référence à un point clé dans le document élargi. L'attribut title peut être utilisé, par exemple, pour marquer le signet. Rappelez-vous que dans chaque document, vous pouvez définir plusieurs signets.

Les auteurs peuvent définir des types de liens supplémentaires ne sont pas décrits dans cette spécification. Dans le même temps ils ont besoin pour utiliser le profil pour spécifier les conventions utilisées pour déterminer les types de liens. Voir. Attribut profil élément HEAD .

Pour plus de détails, voir les types de lien. Voir les références dans les documents HTML .

6.13 Poignées médias

Voici une liste de descripteurs de médias reconnus ( % de MediaDesc dans la DTD).

écran
Conçu pour les écrans d'ordinateur, pas divisé en pages.
tty
Conçu pour supporter une grille fixe pour les personnages, tels que télétypes, les terminaux ou les appareils portables avec des capacités d'affichage limitées.
TV
Destiné aux appareils de type télévision (basse résolution, couleur, limitée scrollable).
projection
Destiné aux projecteurs.
ordinateur de poche
Destiné aux appareils portatifs (petit écran, monochrome, graphiques bitmap, gamme limitée).
imprimer
Destiné à paginée, matériau opaque et documents consultés à l'écran en mode d'aperçu avant impression.
braille
Conçu pour les appareils tactiles avec alphabet Broglie.
auriculaire
Destiné aux synthétiseurs vocaux.
tous
Pour tous les appareils.

de nouvelles valeurs et les valeurs paramétrées autorisés peuvent être incorporées dans les futures versions de HTML. Pour simplifier l'administration de ces extensions agents utilisateurs de spécifications correspondantes devraient être en mesure d' analyser la valeur de l'attribut media comme suit:

  1. Valeur - une liste d'éléments séparés par des virgules. Par exemple,
     media = "screen, lunettes 3D, l'impression et la résolution> 90dpi"
    

    Il apparaît dans:

     "Screen"
     "3d lunettes"
     "Imprimer et résolution> 90dpi"
    
  2. Chaque élément est tronqué avant le premier non-lettres US codage ASCII [a-zA-Z] (décimal Unicode 65-90 codes 97-122), le chiffre [0-9] (codes hexadécimaux Unicode 30-39), ou tiret (45). Dans cet exemple, il apparaît:
     "Screen"
     "3d lunettes"
     "Imprimer"
    
  3. Puis sensible réalisé la réconciliation avec un ensemble de descripteurs spécifiques ci - dessus types. Les agents utilisateurs peuvent ignorer les éléments divergents. Dans cet exemple, il n'y aura que des éléments de l' écran et l' impression.

Remarque. Les feuilles de style peuvent inclure des variations en fonction du support (par exemple, CSS @media construire). Il est logique d'utiliser le "Dans de tels cas, les médias = all".

6.14 Ces scénarios

les données de script ( de% Script; dans le DTD ) peut être le contenu de l'élément SCRIPT et la valeur de l' événement intrinsèque attributs . Les agents utilisateurs ne doivent pas évaluer les données de script dans le balisage HTML, mais doivent transmettre les données aux scénarios de base.

registre de comptabilité dans les données de script dépend du langage de script.

Rappelez - vous que les données de script qui est contenu de l' élément ne peut pas contenir des références de caractères , mais les données de script est une valeur d'attribut peut être. L'annexe fournit des informations sur la spécification des données autres que les données HTML .

6.15 Ces feuilles de style

Ces feuilles de style ( de% du StyleSheet; dans le DTD ) peut être le contenu de l'élément STYLE attribut et la valeur de style . Les agents utilisateurs ne doivent pas évaluer les données de style dans la mise en page HTML.

registre comptable des données de style dépend du langage de feuille de style.

Rappelez - vous que ces feuilles de style qui est contenu de l' élément ne peut pas contenir des références de caractères , mais les données de feuille de style, est la valeur d'un attribut peut les contenir. L'annexe fournit plus d' informations sur la spécification des données autres que les données HTML .

6.16 noms des cadres cibles

Sauf pour les noms réservés énumérés ci - dessous, les noms de cibles de trame ( % de FrameTarget; dans le DTD) doivent commencer par un caractère alphabétique (a-zA-Z). Les agents utilisateurs doivent ignorer tous les autres noms.

Les suivants noms de cible sont réservés et ont une signification particulière.

_blank
Les agents utilisateurs doivent télécharger le document dans une nouvelle fenêtre sans nom.
_self
Les agents utilisateurs doivent télécharger le document dans le même cadre dans lequel le document se réfère à elle.
_parent
Les agents utilisateurs doivent télécharger le document dans le cadre parent immédiat du cadre dans un FRAMESET . Cette valeur est équivalente à _self, si le cadre actuel n'est pas le cadre parent.
_top
Les agents utilisateurs doivent télécharger le document en plein écran (couvrant tous les autres cadres). Cette valeur est équivalente à _self, si le cadre courant n'a pas de cadre de parent.