PHP-Einfach.de
  • PHP Tutorial
  • MySQL Tutorial
  • Für Fortgeschrittene
  • Webhosting
  • Forum

Codeschnipsel

Verwendung von UTF-8

Zurück zur Übersicht
Da hier im Forum bereits öfters die Frage nach UTF-8 kommt, werde ich versuchen euch einige Grundlagen, was den Umgang mit UTF-8 angeht, bei zu bringen.
1. Das Script
Das Script könnt ihr einfach weiter so benutzen wie bisher. Hier ist aber nun Entscheident, das ihr eine Funktion braucht, die euch klar Anzeigt, ob ein String UTF-8 kodiert ist, oder nicht. Folgende Funktion tut dies:
<?php
function is_utf8($string) {
        
/*return preg_match('/^(
                [\x09\x0A\x0D\x20-\x7E]*        # ASCII
            |    [\xC2-\xDF][\x80-\xBF]            # non-overlong 2-byte
            |    \xE0[\xA0-\xBF][\x80-\xBF]        # excluding overlongs
            |    [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}    # straight 3-byte
            |    \xED[\x80-\x9F][\x80-\xBF]        # excluding surrogates
            |    \xF0[\x90-\xBF][\x80-\xBF]{2}        # planes 1-3
            |    [\xF1-\xF3][\x80-\xBF]{3}        # planes 4-15
            |    \xF4[\x80-\x8F][\x80-\xBF]{2}        # plane 16
            )*$/x', $string);
        */    
        
return preg_match('/(
                [\xC2-\xDF][\x80-\xBF]            # non-overlong 2-byte
            |    \xE0[\xA0-\xBF][\x80-\xBF]        # excluding overlongs
            |    [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}    # straight 3-byte
            |    \xED[\x80-\x9F][\x80-\xBF]        # excluding surrogates
            |    \xF0[\x90-\xBF][\x80-\xBF]{2}        # planes 1-3
            |    [\xF1-\xF3][\x80-\xBF]{3}        # planes 4-15
            |    \xF4[\x80-\x8F][\x80-\xBF]{2}        # plane 16
            )/x'
, $string);
    }
?>

Desweiteren ist der Umgang mit HTMLENTITES und HTMLSPECIALCHARS nicht mehr so einfach wie vorher. Hier zu könnt ihr die Funktion in folgenden Formen aufrufen:
<?php
htmlspecialchars
($string, ENT_COMPAT, 'UTF-8');
htmlentities($string, ENT_COMPAT, 'UTF-8');
?>

Auch greifen die Stringfunktionen von PHP nicht mehr fehlerfrei, da UTF-8 auf Unicode basiert, und somit ein Zeichen nicht nur ein Byte haben kann. Hierfür gibt es nun die MultiBytefunktionen aus der MB-Bibliothek. Desweiteren kommen Funktionen für UTF-8 kodierung und decodeierung hinzu. (utf8_decode & utf8_encode)
<?php
$newstring 
= utf8_decode($string)
$newstring = utf8_encode($string)
?>

Diese Greifen aber nur bei ISO-8859-1 und UTF-8 . Für andere kodierungen zu UTF-8 sollte man die Funktion mb_convert_encoding benutzen.
<?php
$string 
= mb_convert_encoding($string, $to, $from);
?>

Somit wäre das Script abgedeckt.
2. Die Homepage
Fehler entstehen meistens hier, wenn Daten übergeben werden. Diesen könnt ihr einfach vorbeugen wenn ihr:
 Code 
<meta http-equiv="content-type" content="text/html; charset=UTF-8" />
Sowie bei der erste getätigten Ausgabe:
<?php
header
('Content-Type: text/html; charset=UTF-8');?>

sendet. Damit wären hier Fehler bereits ausgeschlossen.
3. Die Datenbank
Hier liegt auch oft ein Fehler. UTF-8 wird erst von einer mySQL-Version erst ab 4.1+ fehlerfrei unterstützt. Hier solltet ihr für Verbindung, und Tabellen meist folgende Kodierung fehlen:
utf8_unicode_ci oder utf8_bin. Zudem, wie gesagt, sollte die Verbindung von PHP zu mySQL und zurück auf UTF-8 zurückgreifen. Solltet ihr euch da nicht sicher sein, wirkt ein einfaches SQL-Query
 Code 
SET NAMES 'utf-8'

So, das ist somit das wichtigste zu UTF-8 und dürfte euch weiter helfen.
Bei Fragen stehe ich soweit ich kann gerne zu verfügnung, möchte aber auch bitten, das ich nicht zu jeden Problem die Lösung weiß. Wenn hier die Tipps hier beachtet, dürfte es aber keine bis kaum Probleme geben.

Kommentare

Autor Teralios

Zurück zur Übersicht
Autor: Nils Reimers
Zurück: URLs im Text identifizieren

Für Fortgeschrittene

  • Objektorientierte Programmierung
  • PHP Sicherheit
  • Script-Beispiele
  • Codeschnipsel
  • Stellenmarkt
Mit freundlicher Unterstützung von:
  • Punkt191 Werbeagentur
  • CasinoAndy Finland
  • Casinoohnelizenz.info
  • Cryptocasinomaster.com
  • CasinoHEX.at
  • inkedin.com

Hoster – Geringste Ausfallzeit

  1. webgo Ø 1 Min.
  2. Linevast Ø 2 Min.
  3. netcup Ø 3 Min.
  4. All-Inkl.com Ø 6 Min.
  5. checkdomain Ø 8 Min.
  6. dogado Ø 17 Min.
  7. bplaced Ø 17 Min.
  8. Contabo Ø 25 Min.
  9. Hetzner Ø 49 Min.
  10. ONE.com Ø 62 Min.
» Mehr erfahren

Impressum | Datenschutz | Auf PHP-Einfach.de werben

© PHP-Einfach.de 2003 - 2023

Cookie-Zustimmung verwalten
Um dir ein optimales Erlebnis zu bieten, verwenden wir Technologien wie Cookies, um Geräteinformationen zu speichern und/oder darauf zuzugreifen. Wenn du diesen Technologien zustimmst, können wir Daten wie das Surfverhalten oder eindeutige IDs auf dieser Website verarbeiten. Wenn du deine Zustimmung nicht erteilst oder zurückziehst, können bestimmte Merkmale und Funktionen beeinträchtigt werden.
Funktional Immer aktiv
Die technische Speicherung oder der Zugang ist unbedingt erforderlich für den rechtmäßigen Zweck, die Nutzung eines bestimmten Dienstes zu ermöglichen, der vom Teilnehmer oder Nutzer ausdrücklich gewünscht wird, oder für den alleinigen Zweck, die Übertragung einer Nachricht über ein elektronisches Kommunikationsnetz durchzuführen.
Vorlieben
Die technische Speicherung oder der Zugriff ist für den rechtmäßigen Zweck der Speicherung von Präferenzen erforderlich, die nicht vom Abonnenten oder Benutzer angefordert wurden.
Statistiken
Die technische Speicherung oder der Zugriff, der ausschließlich zu statistischen Zwecken erfolgt. Die technische Speicherung oder der Zugriff, der ausschließlich zu anonymen statistischen Zwecken verwendet wird. Ohne eine Vorladung, die freiwillige Zustimmung deines Internetdienstanbieters oder zusätzliche Aufzeichnungen von Dritten können die zu diesem Zweck gespeicherten oder abgerufenen Informationen allein in der Regel nicht dazu verwendet werden, dich zu identifizieren.
Marketing
Die technische Speicherung oder der Zugriff ist erforderlich, um Nutzerprofile zu erstellen, um Werbung zu versenden oder um den Nutzer auf einer Website oder über mehrere Websites hinweg zu ähnlichen Marketingzwecken zu verfolgen.
Optionen verwalten Dienste verwalten Anbieter verwalten Lese mehr über diese Zwecke
Einstellungen ansehen
{title} {title} {title}