La compression de données est un processus dans lequel la taille d’un fichier est réduite en ré-encodant les données du fichier pour utiliser moins de bits de stockage que le fichier original. Une composante fondamentale de la compression de données est que le fichier original peut être transféré ou stocké, recréé, puis utilisé ultérieurement (avec un processus appelé décompression).
Une brève histoire de la compression de données
Lors de l’émergence d’Internet dans les années 1970, la relation entre la taille des fichiers et la vitesse de transfert est devenue beaucoup plus apparente. Les mathématiciens du monde entier se sont penchés sur le problème pendant des années, mais ce n’est que lorsque les algorithmes de compression sans perte universelle Lempel-Ziv-Welch (LZW) ont fait leur apparition au milieu des années 1980 que de réels avantages ont été réalisés. La compression LZW a été la première méthode de compression de données largement utilisée mise en œuvre sur les ordinateurs et elle est encore utilisée aujourd’hui (sous diverses itérations) : un gros fichier texte anglais peut généralement être compressé à environ la moitié de sa taille d’origine avec LZW.
Le code Morse, inventé en 1838, est le premier exemple de compression de données dans la mesure où les lettres les plus courantes de la langue anglaise, comme le « e » et le « t », reçoivent des codes Morse plus courts.
Les algorithmes courants de compression de données comprennent :
- Zip
- bzip2
- 7-zip
- jpeg
- mpeg
Types de compression de données
Aujourd’hui, il existe de nombreux types d’algorithmes et d’implémentations qui permettent à l’utilisateur quotidien de compresser des fichiers, mais certains sont plus adaptés à certaines applications. Pour mieux comprendre la compression des données en général, il est plus facile de diviser le processus en deux groupes principaux : la compression avec perte et la compression sans perte.
Compression avec perte
La compression avec perte réduit la taille des fichiers en supprimant les bits d’information inutiles. Ce type de compression est le plus souvent utilisé sur les fichiers image, vidéo et audio, où une représentation parfaite du média source n’est pas nécessaire.
Par exemple, un fichier audio MP3 ne contient pas toutes les informations audio de l’enregistrement original. Au lieu de cela, la compression avec perte MP3 supprime les sons que les humains ne peuvent pas entendre. Comme l’oreille humaine moyenne ne remarquerait pas cette différence, le résultat est un fichier plus petit avec un impact minimal sur l’utilisateur.
L’inconvénient ? Plus un fichier est compressé avec la compression avec perte, plus la réduction de la qualité devient perceptible. De plus, la compression avec perte ne fonctionne pas bien avec les fichiers dont toutes les données sont cruciales (par exemple, la compression d’une feuille de calcul donnerait des résultats inutilisables).
Lossless Compression
Lossless compression réduit la taille du fichier sans supprimer aucun bit d’information. Au lieu de cela, ce format fonctionne en supprimant les redondances au sein des données pour réduire la taille globale du fichier. Avec la compression sans perte, il est possible de reconstituer parfaitement le fichier d’origine.
Par exemple, le format de compression sans perte le plus courant (ZIP) est souvent utilisé pour les fichiers de programme dans Windows, car il préserve toutes les informations d’origine. La décompression du fichier (unzipping) produit un programme exécutable qui serait autrement inutile avec lossy.
Les formats lossless courants comprennent PNG pour les images, FLAC pour l’audio et ZIP. Les formats sans perte pour la vidéo sont rares, car les fichiers sources prendraient une quantité massive d’espace.
Limites de la compression des données
Il est important de noter que la compression n’est pas infinie. La compression d’un fichier dans un ZIP peut réduire sa taille, mais il est impossible de poursuivre la compression du fichier et de réduire sa taille à néant.
Il est également important de comprendre la relation entre les deux groupes de compression de données :
- Oui : convertir des fichiers sans perte en fichiers avec perte
- Oui : convertir un format sans perte en un autre format sans perte est bien
- Non : Convertir des fichiers avec perte en fichiers sans perte (les formats avec perte jettent des données ; il est impossible de récupérer ces données)
- Non : Convertir un format avec perte en un autre format avec perte
Un dernier mot sur la compression des données
Comment fonctionne la compression des données d’un point de vue technique ? Eh bien, les algorithmes réels qui décident quelles données sont jetées (dans les méthodes avec perte) et comment stocker au mieux les données redondantes (dans la compression sans perte) sont extrêmement compliqués. Cette vue d’ensemble de la compression des données est destinée à servir d’aperçu de haut niveau des principes de base et à fournir un contexte sur la façon d’appliquer ces pratiques dans des situations réelles.
Continuer la lecture
- SASE, pourquoi en avons-nous besoin ?
- Que se passe-t-il si la main-d’œuvre des services professionnels devient 100 % mobile ?
- Planification de SASE : un guide étape par étape pour y parvenir
- Voix de NetMotion : célébration de la Journée internationale de la femme
- Parvenir à SASE en quelques secondes grâce au partenariat entre NetMotion et Microsoft
.
0 commentaire