(PHP 4, PHP 5, PHP 7, PHP 8)
get_html_translation_table — Liefert die Umwandlungstabelle, die von htmlspecialchars() und htmlentities() verwendet wird
$table
= HTML_SPECIALCHARS
, int $flags
= ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401, string $encoding
= "UTF-8"): arrayget_html_translation_table() gibt die Umwandlungs-Tabelle zurück, die intern in den Funktionen htmlspecialchars() und htmlentities() verwendet wird.
Hinweis:
Sonderzeichen können auf unterschiedliche Weise kodiert werden.
"
kann kodiert werden als"
,"
oder"
. get_html_translation_table() gibt nur die von htmlspecialchars() und htmlentities() genutzte Form zurück.
table
Die Tabelle, die zurückgegeben werden soll. Entweder
HTML_ENTITIES
oder
HTML_SPECIALCHARS
.
flags
Eine Bitmaske von einem oder mehreren der folgenden Flags, die
festlegen, welche Anführungszeichen die Tabelle enthalten wird, sowie
für welchen Dokumenttyp sie ist. Der Standardwert ist
ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401
.
Name der Konstante | Beschreibung |
---|---|
ENT_COMPAT |
Die Tabelle soll Entities für doppelte Anführungszeichen enthalten, aber nicht für einfache. |
ENT_QUOTES |
Die Tabelle soll Entities sowohl für einfache als auch doppelte Anführungszeichen enthalten. |
ENT_NOQUOTES |
Die Tabelle soll weder Entities für einfache noch für doppelte Anführungszeichen enthalten. |
ENT_SUBSTITUTE |
Ersetzt ungültige Code-Unit-Sequenzen mit dem Unicode-Ersatzzeichen U+FFFD (UTF-8) oder � (andernfalls), anstatt eine leere Zeichenkette zurückzugeben. |
ENT_HTML401 |
Die Tabelle für HTML 4.01. |
ENT_XML1 |
Die Tabelle für XML 1. |
ENT_XHTML |
Die Tabelle für XHTML. |
ENT_HTML5 |
Die Tabelle für HTML 5. |
encoding
Definiert die zu verwendende Zeichenkodierung. Wenn nicht angegeben, ist der Standardwert für dieses Argument UTF-8.
Die folgenden Zeichensätze werden unterstützt:
Zeichensatz | Alias | Beschreibung |
---|---|---|
ISO-8859-1 | ISO8859-1 | Westeuropäisch, Latin-1. |
ISO-8859-5 | ISO8859-5 | Wenig verwendeter kyrillischer Zeichensatz (Latin/Cyrillic). |
ISO-8859-15 | ISO8859-15 | Westeuropäisch, Latin-9. Enthält das Euro-Zeichen sowie französische und finnische Buchstaben, die in Latin-1(ISO-8859-1) fehlen. |
UTF-8 | ASCII-kompatibles Multi-Byte 8-Bit Unicode. | |
cp866 | ibm866, 866 | DOS-spezifischer kyrillischer Zeichensatz. |
cp1251 | Windows-1251, win-1251, 1251 | Windows-spezifischer kyrillischer Zeichensatz. |
cp1252 | Windows-1252, 1252 | Windows spezifischer Zeichensatz für westeuropäische Sprachen. |
KOI8-R | koi8-ru, koi8r | Russisch. |
BIG5 | 950 | Traditionelles Chinesisch, hauptsächlich in Taiwan verwendet. |
GB2312 | 936 | Vereinfachtes Chinesisch, nationaler Standard-Zeichensatz. |
BIG5-HKSCS | Big5 mit Hongkong-spezifischen Erweiterungen; traditionelles Chinesisch. | |
Shift_JIS | SJIS, SJIS-win, cp932, 932 | Japanisch |
EUC-JP | EUCJP, eucJP-win | Japanisch |
MacRoman | Zeichensatz, der von Mac OS verwendet wurde. | |
'' |
Eine leere Zeichenkette aktiviert die Erkennung durch die Kodierung des Skripts (Zend multibyte), default_charset und die aktuelle Sprachumgebung (siehe nl_langinfo() und setlocale()), in dieser Reihenfolge. Nicht empfehlenswert. |
Hinweis: Weitere Zeichensätze sind nicht implementiert. Statt dessen wird die Standard-Kodierung verwendet und eine Warnung ausgegeben.
Gibt die Umwandlungstabelle als Array zurück, wobei die ursprünglichen Zeichen die Schlüssel sind und die Entities die Werte.
Version | Beschreibung |
---|---|
8.1.0 |
flags geändert von
ENT_COMPAT zu ENT_QUOTES |
ENT_SUBSTITUTE | ENT_HTML401 .
|
Beispiel #1 Beispiel für eine Umwandlungstabelle
<?php
var_dump(get_html_translation_table(HTML_ENTITIES, ENT_QUOTES | ENT_HTML5));
?>
Das oben gezeigte Beispiel erzeugt eine ähnliche Ausgabe wie:
array(1510) { [" "]=> string(9) "
" ["!"]=> string(6) "!" ["""]=> string(6) """ ["#"]=> string(5) "#" ["$"]=> string(8) "$" ["%"]=> string(8) "%" ["&"]=> string(5) "&" ["'"]=> string(6) "'" // ... }