Savez-vous que la longueur d’un SMS peut varier en fonction des caractères utilisés ? Et savez-vous ce qu’il se passe exactement lorsque vous dépasser les 160 signes dans un message ou lorsque vous utilisez des caractères spéciaux ? Si ce n’est pas le cas, cet article est fait pour vous !
Qu’entend-on nous par « caractères spéciaux » ?
Selon Wiktionnaire, un caractère spécial est un « caractère qui n’est pas alphanumérique, ni caractère de contrôle ». Autrement dit, les caractères spéciaux désignent tous les symboles et signes qui ne font pas partie des 26 lettres de l’alphabet de A à Z et des chiffres de 0 à 9. Ils incluent des accents (é, è, à, ç), des symboles monétaires (€, $, ¥), des émojis (😊, 👍, ❤️) et d’autres signes non latins (@, #, &, %).
Nombre de caractères : tout est une histoire de bits
En informatique, les bits sont la plus petite unité de données. Ils représentent une valeur binaire de 0 à 1. Lorsqu’un SMS est transmis, chaque caractère qu’il contient est codé en bits. La plupart des téléphones et smartphones sont en mesure de transmettre des messages de ce type d’une longueur maximale de 1120 bits (140 octets). Un SMS standard utilise l’encodage GSM où chaque caractère équivaut donc à 7 bits. En d’autres termes, il est possible d’envoyer jusqu’à 160 signes dans un seul et unique texto.
Toutefois, l’utilisation de caractères spéciaux ou de l’Unicode peut réduire cette longueur. En effet, le GSM inclut les lettres latines, les chiffres et certains signes spéciaux. Mais pas tous ! Si vous utilisez des caractères spéciaux ne faisant pas partie de l’alphabet GSM ou de son extension, l’encodage devra passer en Unicode afin de pouvoir les gérer. Cependant, une fois sous ce format, chaque signe équivaut à 16 bits ; ce qui réduit la longueur maximale d’un SMS à 70 caractères. Un point important à garder en tête lorsque vous réalisez vos campagnes SMS ! Sachez également que certains caractères spéciaux disponibles en GSM peuvent compter doubles et que les espaces sont comptabilisés comme des caractères !
Et que se passe-t-il si votre SMS fait plus de 160 signes en GSM ? Eh bien, les messages sont automatiquement fractionnés en segments de 153 signes chacun. C’est ce qu’on appelle le chaînage des SMS : chaque segment contient des informations supplémentaires pour assurer le réassemblage correct du message complet par le téléphone récepteur de sorte qu’il ne reçoive qu’un seul et unique texto. En cas d’Unicode, cette limite passe à 67 caractères par segment.
L’alphabet GSM et son extension
Le GSM (Global System for Mobile Communications) est un standard de télécommunications largement utilisé pour les réseaux mobiles. Elle spécifie comment les données vocales et textuelles, y compris les SMS, sont transmises. En somme, le GSM facilite la compatibilité mondiale des services de télécommunication.
Comme nous vous l’expliquions précédemment, le GSM utilise un encodage 7-bit qui permet de représenter 128 signes différents. On retrouve donc parmi ceux-ci les lettres latines, les chiffres et certains caractères spéciaux :
- Lettres majuscules et minuscules : A-Z, a-z
- Chiffres : 0-9
- Caractères spéciaux : @, £, $, ¥, è, é, ù, ì, ò, Ç, Ø, ø, Å, å, Δ, _, Φ, Γ, Λ, Ω, Π, Ψ, Σ, Θ, Ξ, Æ, æ, ß, É, !, « , #, ¤, %, &, ‘, (, ), *, +, ,, -, ., /, :, ;, <, =, >, ?, ¡, Ä, Ö, Ñ, Ü, §, ¿, ä, ö, ñ, ü, à
- Autres caractères spéciaux via l’extension : ^, {, }, \, [, ], ~, |, €
Certains caractères de l’extension GSM nécessitent une séquence d’échappement de deux unités de codage, ce qui signifie qu’ils prennent plus de place dans un SMS. Par exemple, le signe euro (€) vaut pour deux signes dans un message.
Vous aurez sans doute remarqué que cet alphabet ne permet pas la rédaction de messages dans certaines langues comme le chinois, par exemple. De même que certains caractères spéciaux ne sont pas présents dans le listing précédemment donné. C’est pourquoi entre en scène le système d’Unicode.
Qu’est-ce que l’Unicode ?
L’Unicode (UCS-2) est un standard universel d’encodage de caractères qui permet de représenter pratiquement tous les caractères de tous les systèmes d’écriture existants. Contrairement à l’alphabet GSM, l’Unicode inclut une vaste gamme de symboles, émojis et caractères d’alphabets non latins.
Vous l’aurez donc compris, l’Unicode est utilisé lorsque les SMS contiennent des caractères spéciaux non pris en charge par le GSM 7-bit, comme les émojis, les lettres accentuées complexes, ou des alphabets non latins comme l’arabe, le chinois ou le cyrillique.
Cependant, nous vous l’avions mentionné plus haut, les SMS qui utilisent ce système sont limités à 70 signes par message. En effet, chaque signe Unicode utilise 16 bits au lieu des 7 bits utilisés par les caractères GSM. En somme, une plus grande quantité de données est nécessaire pour représenter chaque signe. Malgré cette limitation, cet encodage permet de représenter 65 536 caractères différents !
Rien ne vaut quelques exemples
Comprendre les limitations de signes et l’impact des caractères spéciaux est important pour optimiser vos SMS.
Pour vous aider, nous mettons à disposition un outil de comptage de caractères qui vous permet de savoir précisément combien de caractères et de SMS seront nécessaires pour vos envois. Utilisez-le dès maintenant pour optimiser vos messages.
Pour plus d’informations ou une assistance personnalisée, n’hésitez pas à nous contacter.