Convention de codage des chaînes de caractères en langage C
En langage C, une chaîne de caractères correspond à un tableau de caractères et à l'utilisation d'une convention pour marquer la fin de la chaîne de caractères. C'est-à-dire la fin de la partie du tableau qui contient effectivement les caractères qui constituent la chaîne.
Pour cela, le langage C utilise un caractère particulier de la table des codes ASCII, c'est le '\0' (back slash zéro). Il sert de marqueur pour indiquer la fin d'une chaîne de caractères.
Un des caractères du tableau doit être le marqueur de fin de chaîne '\0'. Dans ce cas tous les caractères qui précèdent font partie de la chaîne de caractères et on ne se préoccupe pas de ceux qui suivent le marqueur.
Nous rappelons que la syntaxe 'a' désigne un unique caractère tandis que la syntaxe "a" désigne une chaîne de caractères constante.
Dans le premier cas nous avons un unique octet, dans le second la chaîne de caractère occupe deux octets dans une zone mémoire qui est un tableau de caractères. En effet, le premier octet contient le codage du caractère 'a', le second le codage du '\0' qui marque la fin du littéral constant de type chaîne de caractères "a".