Chapitre 2.7 - Codage des entiers⚓︎
Attention
La manière dont les nombres (entiers, non-entiers, positifs, négatifs...) sont traités par un langage de programmation est spécifique à ce langage.
Dans toute la suite de ce cours, pour simplifier, nous considérerons que les nombres sont codés sur 1 octet seulement. Ce qui ne correspond pas à la réalité, mais permet de comprendre les notions essentielles.
1. Les nombres entiers en binaire non signé⚓︎
L'expression "non signé" signifie que la contrainte du signe n'existe pas : tous les nombres sont considérés comme étant positifs.
Nous avons déjà vu comment ces nombres se codaient en binaire.
Sur un octet, le nombre minimal qu'on puisse coder est 00000000
. C'est l'entier naturel 0.
Le nombre maximal qu'on puisse coder est 11111111
. C'est l'entier naturel 255.
Exercice 1
- Quel est le plus grand entier non signé codable sur 16 bits ?
- ... sur 32 bits ?
- ... \(n\) bits ?
Correction
- \(N=1+2+2^2+2^3+\dots+2^{15}= 65535\)
- \(N=1+2+2^2+2^3+\dots+2^{31}= 4294967295\)
- Pour tout \(n \in \mathbb{N}\), \(1+2+2^2+2^3+\dots+2^{n-1}=2^{n}-1\) (formule de la somme des termes d'une suite géométrique de raison 2).
Python et les entiers
Depuis la version 3 du langage Python, il n'y a plus de taille maximale pour les entiers en Python.
Ceci implique que la taille nécessaire au codage de l'entier est allouée dynamiquement par Python (avec pour seule limite celle de la mémoire disponible).
Exercice 2
- Effectuer la somme des deux nombres binaires
00001101
et00001011
. - Vérifier que le résultat est cohérent en base 10.
Correction
- Cette addition correspond à \(13+11=24\)
2. Les nombres entiers en binaire signé⚓︎
ou Comment représenter des nombres négatifs ???
2.1 La (partiellement) fausse bonne idée⚓︎
Comment différencier les nombres positifs des nombres négatifs ?
L'idée naturelle est de réserver 1 bit pour le signe, et de coder le reste du nombre «naturellement».
Par exemple, on peut décréter que le premier bit (appelé bit de poids fort) sera le bit de signe :
- 0 pour un nombre positif
- 1 pour un nombre négatif
Dans ce cas, 00000011
serait le nombre \(+3\) et 10000011
serait le nombre \(-3\).
Problèmes :
- le zéro serait représenté à la fois par
00000000
et10000000
, ce qui n'est pas très économe. - plus grave :
Exercice 3
Avec cette convention, effectuer l'addition \((+3)+(-3)\) en binaire.
Correction
L'addition \((+3)+(-3)\) serait égale à \(-6\) !
Moralité :
Ce système d'écriture ne marche pas bien.
2.2 À la recherche de l'opposé d'un nombre⚓︎
Idée :
Plutôt que de chercher à écrire directement le nombre \(-3\), nous allons chercher à déterminer ce qu'il faut ajouter à \((+3)\) pour obtenir 0.
Que faut-il ajouter au nombre \((+3)\) pour obtenir 0 ?
L'idée naturelle est de commencer par la droite, en essayant de «fabriquer du zéro» en choisissant le bon bit à ajouter :
On arrive bien à fabriquer des 0 sur tout notre octet, mais que devient la retenue (en anglais carry) de 1 qui déborde de notre octet ?
Réponse : rien ! Elle sera perdue et c'est une très bonne nouvelle. Ce nombre sera donc considéré comme un 0 : nous avons trouvé comment coder \(-3\).
Le nombre \(-3\) s'écrit donc 11111101
.
Comment, à partir du nombre 00000011
, aurait-on pu le trouver directement (sans raisonner de proche en proche) ?
On peut remarquer qu'en inversant chaque bit du nombre de départ 00000011
, on obtient 11111100
, qui appelé le complément à 2 du nombre 00000011
.
Il ne reste donc plus qu'à ajouter 1
à ce nombre 11111100
pour obtenir le nombre cherché, 11111101
ce nombre 11111101
représente 253 en codage non signé. Il est donc nécessaire, lorsqu'on représente un nombre, de savoir si les nombres manipulés seront des entiers naturels (non signés) ou bien relatifs (signés).
2.3 Tableau des entiers en binaire signé⚓︎
Tableau
binaire | base 10 |
---|---|
10000000 | -128 |
10000001 | -127 |
10000010 | -126 |
10000011 | -125 |
10000100 | -124 |
10001001 | -123 |
... | ... |
11111100 | -4 |
11111101 | -3 |
11111110 | -2 |
11111111 | -1 |
00000000 | 0 |
00000001 | 1 |
00000010 | 2 |
00000011 | 3 |
00000100 | 4 |
... | ... |
01111100 | 124 |
01111101 | 125 |
01111110 | 126 |
01111111 | 127 |
2.4 Conclusion : écriture l'opposé d'un nombre positif⚓︎
Considérons que ce nombre positif s'écrit sur 7 bits, donc qu'il est de la forme 0XXXXXXX
.
Écriture de l'opposé d'un nombre positif
- On prend le complément à 2 de chacun des 8 bits du nombre de départ
- On ajoute 1 au nombre obtenu.
Exercice 4
Donner l'écriture binaire sur un octet du nombre \(-13\).
Correction
Commençons par écrire le nombre 13 en binaire. Il s'écrit 00001101
.
- en prenant le complément à 2 de chaque bit, on obtient
11110010
. - en ajoutant 1 à ce dernier nombre, on obtient
11110011
.
Le nombre \(-13\) s'écrit donc 11110011
.
Remarque
Les nombres négatifs commenceront donc toujours par le bit 1, et les nombres positifs par le bit 0. Cela revient à suivre partiellement notre fausse bonne idée du 2.1.
Et cela donne surtout une méthode très pratique pour savoir qui est positif et qui est négatif !
3. Travail inverse : passage du binaire signé au nombre relatif⚓︎
Considérons le nombre 11101101
, codé en binaire signé. À quel nombre relatif correspond-il ?
- On observe son bit de poids fort : ici 1, donc ce nombre est négatif. Si ce bit est égal à 0, le nombre codé est positif, il suffit d'opérer une conversion binaire classique.
- Comme ce nombre est négatif, il va falloir inverser le protocole précédent. On commence donc par enlever 1 au nombre proposé. On trouve
11101100
. - On prend ensuite le complément à 2 de chaque bit. On trouve
00010011
. - On convertit en base 10 le nombre obtenu, qui était donc 19.
- Le nombre initial était donc \(-19\).
Exercice 5
Q1. En binaire signé, à quel nombre correspond 11110001
?
Correction
11110001
- 1
= 11110000
. En prenant le complément à 2, on trouve 00001111
, qui vaut 15. Le nombre 11110001
représente donc \(-15\).
Q2. En binaire signé, quel est le plus grand nombre que l'on puisse écrire sur un octet ?
Correction
Le plus grand nombre est 01111111
, soit \(+127\).
Q3. Quel est le plus petit nombre ?
Correction
Le plus petit nombre est 10000000
. 10000000
- 1
= 01111111
. Le complément est 10000000
, qui est égal à 128. Donc le nombre minimal est \(-128\).
Q4. Au total, combien de nombres différents peuvent être écrits en binaire signé ?
Correction
Il y a 128 nombres négatifs (de \(-128\) à \(-1\)), le nombre 0, puis 127 nombres positifs (de 1 à 127). Il y a donc 256 nombres au total, comme en binaire non signé.
4. Le codage des entiers, une source intarissable d'erreurs...⚓︎
4.1 Le vol 501 d'Ariane 5⚓︎
Le 04 juin 1996, le vol inaugural d'Ariane 5 a malheureusement fini dans une gerbe d'étincelles.
En cause : un code prévu pour Ariane 4 avait été gardé pour le nouveau modèle Ariane 5. Dans ce «vieux» code, une donnée issue d'un capteur (le capteur de vitesse horizontale) était codé sur 8 bits. La valeur maximale acceptable de cette donnée était donc 255.
Or, Ariane 5 étant beaucoup plus puissante, le capteur de vitesse horizontale a renvoyé, au bout de 30 secondes, la valeur 300 : cette valeur a provoqué un dépassement des 8 bits prévus et a donné un résultat absurde. L'ordinateur de bord a cru que la fusée était en train de se coucher et a violemment orienté les tuyères de propulsion pour redresser Ariane 5, alors que celle-ci s'élevait pourtant bien verticalement... Ariane 5 a alors brusquement pivoté avant d'exploser.
Cette catastrophe (150 millions d'euros et des années de travail perdus) a fait prendre conscience à la communauté scientifique de l'importance de faire des tests logiciels toujours plus poussés : ce n'est pas parce qu'un code marche dans un environnement donné qu'il marchera de la même manière dans d'autres conditions...
4.2 Le bug de l'année 2038⚓︎
Expliquons ce (superbe) gif issu de la page Wikipedia Bug de l'an 2038.
Lorsqu'on demande à Python l'heure qu'il est, par la fonction time()
du module time
, voici ce qu'il répond :
Il nous renvoie le nombre de secondes écoulées depuis le 1er janvier 1970 à 00h00. On appelle cela l'heure POSIX ou l'heure UNIX l'heure UNIX. Au 29 mai 2022, il s'en donc écoulé environ 1,6 milliards.
Dans beaucoup de systèmes informatiques, ce nombre de secondes est codé par un entier signé sur 32 bits.
Le nombre maximum de secondes qui peut être représenté est donc 01111111 11111111 11111111 11111111
Ce nombre représente un peu plus de 2 milliards de secondes... En les comptant depuis le 01/01/1970 00h00m00s, on arrive au 19/01/2038 à 03h14m07s.
À la seconde d'après, la represéntation binaire du temps sera 10000000 00000000 00000000 00000000
, qui sera interprété comme le nombre négatif −2147483648, et qui ramènera donc les horloges au 13 décembre 1901...
Vous pourrez lire sur la page Wikipedia citée plus haut plus d'informations sur ce problème.