Principes de codage et de stockage de divers types d'informations. Information. Encodage des informations

Un code est un ensemble de conventions (ou de signaux) permettant d'enregistrer (ou de transmettre) certains concepts prédéfinis.

L'encodage de l'information est le processus de formation d'une certaine représentation de l'information. Dans un sens plus étroit, le terme « codage » est souvent compris comme le passage d'une forme de présentation de l'information à une autre, plus commode pour le stockage, la transmission ou le traitement.

Habituellement, chaque image lors de l'encodage (parfois ils disent - cryptage) est représentée par un caractère distinct.

Un signe est un élément d'un ensemble fini d'éléments distincts.

Dans un sens plus étroit, le terme « codage » est souvent compris comme le passage d'une forme de présentation de l'information à une autre, plus commode pour le stockage, la transmission ou le traitement.

Un ordinateur ne peut traiter que des informations présentées sous forme numérique. Toutes les autres informations (telles que les sons, les images, les lectures d'instruments, etc.) doivent être converties sous forme numérique pour être traitées sur ordinateur. Par exemple, afin de quantifier le son musical, on peut mesurer l'intensité du son à certaines fréquences à de courts intervalles, en présentant les résultats de chaque mesure sous forme numérique. À l'aide de programmes informatiques, vous pouvez effectuer des transformations des informations reçues, par exemple, "superposer" des sons de différentes sources les uns sur les autres.

De même, sur un ordinateur, vous pouvez traiter informations textuelles. Lorsqu'elle est entrée dans un ordinateur, chaque lettre est codée avec un certain nombre, et lors de la sortie vers des périphériques externes (écran ou impression), pour la perception humaine, des images de lettres sont construites à l'aide de ces chiffres. La correspondance entre un ensemble de lettres et de chiffres s'appelle un codage de caractères.

En règle générale, tous les nombres dans l'ordinateur sont représentés par des zéros et des uns (et non par dix chiffres, comme c'est la coutume pour les gens). En d'autres termes, les ordinateurs fonctionnent généralement dans le système binaire, car les dispositifs pour les traiter sont beaucoup plus simples. La saisie de nombres dans un ordinateur et leur sortie pour une lecture humaine peuvent être effectuées sous la forme décimale habituelle, et toutes les conversions nécessaires sont effectuées par des programmes exécutés sur un ordinateur.

Façons d'encoder l'information.

Une même information peut être présentée (encodée) sous plusieurs formes. Avec l'avènement des ordinateurs, il est devenu nécessaire d'encoder tous les types d'informations qu'un individu et l'humanité dans son ensemble traitent. Mais l'humanité a commencé à résoudre le problème du codage des informations bien avant l'avènement des ordinateurs. Les réalisations grandioses de l'humanité - l'écriture et l'arithmétique - ne sont rien de plus qu'un système de codage de la parole et des informations numériques. L'information n'apparaît jamais dans forme pure, il est toujours représenté d'une manière ou d'une autre, encodé d'une manière ou d'une autre.

Le codage binaire est l'un des moyens les plus courants de représenter l'information. Dans les ordinateurs, les robots et les machines-outils à commande numérique, en règle générale, toutes les informations traitées par l'appareil sont codées sous la forme de mots de l'alphabet binaire.

Codage des informations de caractère (texte).

L'opération principale effectuée sur des caractères individuels du texte est la comparaison de caractères.

Lors de la comparaison de caractères, les aspects les plus importants sont l'unicité du code pour chaque caractère et la longueur de ce code, et le choix du principe de codage lui-même est pratiquement sans importance.

Diverses tables de conversion sont utilisées pour encoder les textes. Il est important que la même table soit utilisée lors de l'encodage et du décodage du même texte.

Table de conversion - une table contenant une liste de caractères codés ordonnés d'une manière ou d'une autre, selon laquelle le caractère est converti en son code binaire et vice versa.

Les tables de conversion les plus populaires : DKOI-8, ASCII, CP1251, Unicode.

Historiquement, 8 bits ou 1 octet ont été choisis comme longueur de code pour le codage des caractères. Ainsi, le plus souvent un caractère de texte stocké dans un ordinateur correspond à un octet de mémoire.

Il peut y avoir 28 = 256 combinaisons différentes de 0 et 1 avec une longueur de code de 8 bits, par conséquent, en utilisant une table de recodage, pas plus de 256 caractères peuvent être encodés. Avec une longueur de code de 2 octets (16 bits), 65536 caractères peuvent être codés.

Encodage des informations numériques.

La similarité dans le codage des informations numériques et textuelles est la suivante : pour pouvoir comparer des données de ce type, des nombres différents (ainsi que des caractères différents) doivent avoir un code différent. La principale différence entre les données numériques et les données symboliques est qu'en plus de l'opération de comparaison, diverses opérations mathématiques sont effectuées sur les nombres : addition, multiplication, extraction de racine, calcul du logarithme, etc. Les règles pour effectuer ces opérations en mathématiques sont développé en détail pour les nombres représentés dans le système de numérotation positionnel.

Le système de numération de base pour représenter les nombres dans un ordinateur est le système de numération positionnelle binaire.

Encodage des informations textuelles

Actuellement, la plupart de les utilisateurs, à l'aide d'un ordinateur, traitent des informations textuelles composées de caractères: lettres, chiffres, signes de ponctuation, etc. Calculons de combien de caractères et de combien de bits nous avons besoin.

10 chiffres, 12 signes de ponctuation, 15 symboles arithmétiques, lettres de l'alphabet russe et latin, TOTAL : 155 caractères, ce qui correspond à 8 bits d'information.

Unités de mesure de l'information.

1 octet = 8 bits

1 Ko = 1024 octets

1 Mo = 1024 Ko

1 Go = 1024 Mo

1 To = 1024 Go

L'essence du codage est que chaque caractère se voit attribuer un code binaire de 00000000 à 11111111 ou le code décimal correspondant de 0 à 255.

Il faut se rappeler qu'à l'heure actuelle, cinq tables de codes différentes sont utilisées pour coder les lettres russes (KOI - 8, СР1251, СР866, Mac, ISO), et les textes encodés à l'aide d'une table ne s'afficheront pas correctement dans une autre

L'affichage principal du codage des caractères est le code ASCII - American Standard Code for Information Interchange - le code standard américain pour l'échange d'informations, qui est un tableau 16 par 16, où les caractères sont codés en hexadécimal.

Codage des informations graphiques.

Une étape importante dans le codage d'une image graphique est sa division en éléments discrets (échantillonnage).

Les principaux moyens de représentation graphique pour son stockage et son traitement à l'aide d'un ordinateur sont les images raster et vectorielles.

Une image vectorielle est un objet graphique constitué de formes géométriques élémentaires (le plus souvent des segments et des arcs). La position de ces segments élémentaires est déterminée par les coordonnées des points et la valeur du rayon. Pour chaque ligne, des codes binaires pour le type de ligne (plein, pointillé, pointillé), l'épaisseur et la couleur sont indiqués.

Une image raster est un ensemble de points (pixels) obtenu à la suite d'une discrétisation de l'image selon le principe matriciel.

Le principe matriciel d'encodage des images graphiques est que l'image est divisée en un nombre donné de lignes et de colonnes. Ensuite, chaque élément de la grille résultante est encodé selon la règle sélectionnée.

Pixel (élément d'image - élément d'image) - l'unité minimale de l'image, dont la couleur et la luminosité peuvent être définies indépendamment du reste de l'image.

Conformément au principe matriciel, des images sont construites qui sont sorties vers l'imprimante, affichées sur l'écran d'affichage, obtenues à l'aide d'un scanner.

La qualité de l'image sera meilleure, plus les pixels sont "dense", c'est-à-dire plus la résolution de l'appareil est élevée et plus la couleur de chacun d'eux est codée avec précision.

Pour une image en noir et blanc, le code couleur de chaque pixel est donné par un bit.

Si l'image est colorée, le code binaire de sa couleur est défini pour chaque point.

Comme les couleurs sont également encodées en code binaire, si par exemple vous voulez utiliser un dessin en 16 couleurs, alors il vous faudra 4 bits (16=24) pour encoder chaque pixel, et s'il est possible d'utiliser du 16 bits ( 2 octets) pour encoder une couleur d'un pixel, alors vous pouvez alors transmettre 216 = 65536 couleurs différentes. L'utilisation de trois octets (24 bits) pour coder la couleur d'un point permet de refléter 16777216 (soit environ 17 millions) différentes nuances de couleur - le mode dit "true color" (True Color). Notez que ceux-ci sont actuellement utilisés, mais loin des capacités limitantes des ordinateurs modernes.

Encodage audio.

Du cours de physique, vous savez que le son est des vibrations de l'air. De par sa nature, le son est un signal continu. Si nous convertissons le son en un signal électrique (par exemple, à l'aide d'un microphone), nous verrons une tension qui change progressivement avec le temps.

Pour le traitement informatique, un signal analogique doit en quelque sorte être converti en une séquence de nombres binaires, et pour cela il doit être échantillonné et numérisé.

Vous pouvez effectuer les opérations suivantes : mesurer l'amplitude du signal à intervalles réguliers et écrire les valeurs numériques obtenues dans la mémoire de l'ordinateur.

Nous tournons à nouveau Attention particulière pour la gérabilité. Les éléments d'objets d'information sont représentés par des éléments de données selon une certaine loi. Le codage n'est pas un processus aléatoire. Elle se déroule selon la méthode informationnelle choisie, qui joue le rôle

méthode d'encodage.

Le procédé de codage d'informations établit une correspondance entre les éléments de l'objet d'information enregistré et les éléments de données obtenus à la suite de l'enregistrement.

Le choix de la méthode de codage de l'information est un enjeu important dans le volet technologique de l'informatique. Elle doit être cohérente avec le choix de l'instrument et du matériel d'enregistrement. Ohm doit également répondre aux critères mentionnés ci-dessus.

Pour la commodité d'étudier les méthodes d'encodage des informations, il est d'usage de considérer des catégories. Le rôle de ces catégories est joué par les soi-disant schémas de codage.

Il existe trois schémas de codage principaux. Ceux-ci sont analogiques, tabulaires et codage numérique.

Les schémas de codage analogiques sont courants dans la faune. Au fur et à mesure du développement des progrès scientifiques et technologiques, la société les a progressivement adaptés à ses besoins. C'est le codage analogique qui a trouvé la première application dans l'enregistrement d'images, de sons et de vidéos.

Les schémas de codage tabulaires n'ont pas et ne peuvent pas avoir d'implémentations dans la faune - c'est une invention de la société. Les gens utilisent le codage tabulaire depuis qu'ils ont appris à désigner des objets, des animaux, des personnes sur leurs doigts. Tous les types d'écriture sont basés sur le codage tabulaire. Le codage tabulaire répond à la plupart des besoins d'échange manuel d'informations publiques.

Parmi les schémas de codage tabulaire, deux catégories indépendantes se distinguent particulièrement :

schémas de codage de caractères de table ;

schémas de codage numérique de table.

Le codage des caractères de table est largement utilisé dans l'échange direct d'informations, et des schémas de codage tabulaires et numériques sont utilisés lorsque l'échange d'informations entre les personnes est effectué à l'aide de la technologie informatique. Par exemple, pour l'échange de messages écrits, des schémas de codage de caractères suffisent. Mais si un message doit être envoyé par télégraphe ou e-mail, alors le codage numérique est indispensable.

Le codage numérique n'a pas de mise en œuvre ni dans la faune ni dans l'échange direct d'informations entre les personnes. C'est l'accomplissement de la société moderne. Il est utilisé dans les systèmes d'échange automatique d'informations et fonctionne lorsque des informations sont stockées ou transmises entre des dispositifs techniques.

Principes de codage des informations

Les questions liées à l'encodage de l'information appartiennent aux sections technologiques de l'informatique. Chaque technologie de conversion d'informations en données a ses propres principes. Ils sont associés au schéma de codage choisi.

codage analogique

Le codage analogique est basé sur le concept de similarité. Le but du codage analogique est de modifier la nature physique d'une séquence de données. Ceci est utile pour augmenter la densité d'enregistrement, la fiabilité du stockage, la vitesse de transfert, la commodité de lecture et d'autres propriétés des données.

codage analogique- il s'agit d'un procédé de codage basé sur le principe de l'enregistrement d'une séquence continue de signaux d'une certaine nature physique sous la forme d'une séquence de données similaire à celle-ci de nature physique différente.

Les systèmes techniques typiques qui implémentent le codage analogique sont :

appareils photographiques (autres que numériques);

magnétophones et caméras vidéo (non numériques);

dispositifs de réception et de transmission de signaux radio.

Selon la définition, le principe du codage analogique présente deux caractéristiques -

à la fois la séquence de signal d'origine et la séquence de données résultante sont continues ;

les données résultantes sont similaires aux signaux originaux selon le critère de similarité choisi.

Avec les principes de continuité et de similitude sont associés à l'utilisation généralisée du codage analogique des informations sur la faune. Par exemple, lors de la réception d'informations visuelles, deux facteurs sont importants pour une personne : la luminosité et la couleur de l'objet d'observation. La luminosité est déterminée par l'amplitude de l'onde lumineuse et la couleur - par sa longueur (fréquence).

Codage tabulaire

Le codage tabulaire est une technologie de l'information basée sur la comparaison périodique d'éléments de signal avec des échantillons de modèles disponibles. Puisque la comparaison n'est pas continue, mais périodique, ses résultats forment une séquence non continue et discrète de données. Cette séquence est appelée échantillon de données. L'échantillon de données est constitué soit des échantillons du modèle eux-mêmes, extraits de la table de correspondance, soit de codes numériques indiquant la position de ces échantillons dans la table de correspondance.

Dans le premier cas, l'encodage est appelé symbole de table. Le résultat de l'encodage des caractères de table est une chaîne de caractères - une séquence de caractères.

Dans le second cas, le codage est dit table-numérique. Le résultat de cet encodage est également un échantillon de données, mais non constitué de symboles, mais de pointeurs numériques indiquant l'emplacement des échantillons dans la table de correspondance (dans la table d'encodage).

Codage tabulaire- il s'agit d'un procédé de codage basé sur le principe de formation d'un échantillon de données discret à partir des résultats d'une comparaison périodique du signal enregistré avec des éléments d'échantillon d'un ensemble prédéterminé.

Les technologies de codage de caractères de table incluent l'écriture qui nous est bien connue. Il est basé, comme vous le savez, sur l'enregistrement des sons de la parole (signaux analogiques continus) à l'aide de symboles discrets - des lettres. Cela inclut également l'enregistrement de musique à l'aide de notes. Un exemple de codage numérique par table est par exemple le remplacement de lettres par des groupes de nombres exprimant la position de ces lettres dans l'alphabet ou dans une autre table de codage.

Comme vous pouvez le constater, le codage tabulaire ne repose pas sur le principe de continuité caractéristique du codage analogique, mais sur le principe d'expressivité discrète. Deux sons "a ..." de longueur, d'intensité et de tonalité différentes sont exprimés discrètement par la même lettre - "A".

Dans le codage tabulaire, le principe de similarité n'est pas non plus respecté. Ainsi, par exemple, du fait que la lettre "B" dans l'alphabet a un nombre deux fois plus grand que le nombre de la lettre "A", il ne s'ensuit en aucun cas que lorsqu'elle est lue, elle devrait sonner deux fois plus fort ou deux fois plus longtemps.

Le codage tabulaire est très répandu dans les échanges d'informations au service des relations publiques. Autant dire que les alphabets de toutes les langues européennes sont des tableaux de motifs qui établissent une correspondance entre les sons et les symboles utilisés pour les écrire. Bien sûr, vous savez que cette correspondance, hélas, n'est pas toujours univoque et occasionne souvent des fautes d'orthographe gênantes. Par conséquent, lors de la rédaction de textes, il convient d'être guidé non seulement par l'alphabet, mais également par les règles d'orthographe, ainsi que par les dictionnaires approuvés. Les dictionnaires et les règles peuvent également être considérés comme des variétés de tables de recherche.

Le codage de caractères de table et le codage numérique de table sont toujours basés sur une sorte d'accord social, car la table de codage doit être connue du public. Si ce n'est pas le cas, il y a alors une restriction artificielle de l'échange d'informations, connue sous le nom de cryptage. Et la base de toute méthode de cryptage est toujours une sorte de méthode de codage.

Les accords concernant la table de codage à utiliser sont souvent basés sur des conventions généralement acceptées ou des normes approuvées.

Codage numérique

Le codage analogique présente un avantage remarquable: lors de son utilisation, le principe de similitude entre le signal enregistré et les données obtenues à la suite de l'enregistrement est respecté. Dans certains cas, cela permet de rendre l'enregistrement visuel, et dans d'autres, cela simplifie grandement sa reproduction et sa perception. En conséquence, les enregistrements analogiques de haute qualité sont subjectivement perçus par les gens comme les plus « naturels ».

Un avantage important du codage tabulaire est la concision et l'absence d'ambiguïté, et un inconvénient important est le manque de similitude entre le signal enregistré et le résultat de l'enregistrement. En raison du manque de similitude, il n'est pas possible de se limiter au niveau du signal d'échange d'informations lors de la lecture de l'enregistrement. Nous devons utiliser les deuxième et même troisième niveaux (le niveau de reconnaissance des formes et le niveau d'interprétation du contenu). Par conséquent, la reproduction des enregistrements réalisés par codage tabulaire doit être spécialement étudiée. La durée de la formation est toute une vie. Tant qu'une personne reste dans la société, jusque-là, elle trouve de nouveaux signes formels, des symboles, des conventions et d'autres moyens d'expression discrets, auparavant inconnus.

Combiner le principe de similarité, inhérent au codage analogique, avec le principe d'expressivité discrète, inhérent au codage tabulaire, permet le codage dit numérique.

Codage numérique- il s'agit d'une méthode de codage basée sur le principe de l'échantillonnage des données en mesurant périodiquement l'amplitude du signal enregistré et en enregistrant des valeurs numériques proportionnelles aux résultats de mesure.

Le principal avantage du codage numérique est son efficacité. Il est associé à l'utilisation généralisée de la technologie informatique pour les opérations avec des échantillons de données. Le fait que les valeurs stockées dans les échantillons soient proportionnelles aux signaux physiques réels permet d'utiliser des opérations arithmétiques pour travailler avec des données. Et le fait que les valeurs soient discrètes vous permet de leur appliquer des opérations de logique mathématique. Grâce au développement de la technologie informatique, le codage numérique est chaque jour de plus en plus utilisé dans l'enregistrement et la transmission d'enregistrements sonores, d'images et de vidéos.

Conversion analogique-numérique

Le codage numérique, par rapport à l'analogique, offre une efficacité particulière de stockage de l'information. Après avoir converti un enregistrement analogique en numérique, il est généralement possible de réduire d'environ dix fois la quantité de données stockées. En règle générale, dix albums de musique peuvent être placés sur un CD d'enregistrement sonore numérique, et dix canaux de télévision numérique peuvent facilement être placés sur un canal de fréquence de télévision terrestre conventionnelle.

Dans le même temps, il existe des raisons objectives pour lesquelles il est actuellement impossible d'abandonner complètement les schémas analogiques d'enregistrement et de reproduction des informations. Voici quelques-uns d'entre eux:

il est impossible de remplacer du jour au lendemain le vaste parc d'appareils techniques analogiques partout dans le monde ;

le monde a accumulé d'énormes archives de films, de photos, de vidéos et de documents sonores enregistrés dans des formats analogiques - l'équipement analogique reste nécessaire pour leur reproduction ;

les schémas de codage numérique introduisent des erreurs supplémentaires dans l'enregistrement liées au principe même d'obtention d'une séquence de données numériques. Avec le niveau actuel de développement de la technologie (et des normes techniques), ces erreurs restent encore assez perceptibles. À cause d'eux, de nombreux consommateurs ne sont pas encore prêts à abandonner les appareils analogiques.

La nécessité de travailler simultanément avec des informations enregistrées par différentes technologies nécessite une classe spéciale d'appareils qui effectuent la conversion des données. La conversion de données analogiques en numériques s'appelle analogique-numérique transformation(ADC) - il est utilisé avant enregistrement numérique ou transfert de données. Un convertisseur analogique-numérique est disponible dans tous les modèles de téléphones cellulaires GSM, dans les appareils photo numériques et les caméras vidéo, dans les appareils de numérisation, ainsi que dans les adaptateurs audio pour ordinateurs personnels.

La conversion inverse de données numériques en un signal analogique est appelée conversion numérique-analogique(DAC) - il est généralement utilisé avant la lecture des données. Un exemple typique est un adaptateur vidéo d'ordinateur.