Erinevat tüüpi teabe kodeerimise ja säilitamise põhimõtted. Teave. Teabe kodeerimine

Kood on kokkulepete (või signaalide) kogum teatud eelmääratletud mõistete salvestamiseks (või edastamiseks).

Teabe kodeerimine on teabe teatud esituse moodustamise protsess. Kitsamas tähenduses mõistetakse terminit "kodeerimine" sageli kui üleminekut ühelt teabe esitusviisilt teisele, mis on talletamiseks, edastamiseks või töötlemiseks mugavam.

Tavaliselt tähistatakse iga kodeerimisel olevat pilti (mõnikord öeldakse - krüpteerimist) eraldi märgiga.

Märk on eraldiseisvate elementide piiratud hulga element.

Kitsamas tähenduses mõistetakse terminit "kodeerimine" sageli kui üleminekut ühelt teabe esitusviisilt teisele, mis on talletamiseks, edastamiseks või töötlemiseks mugavam.

Arvuti suudab töödelda ainult numbrilisel kujul esitatud teavet. Kogu muu teave (nagu helid, pildid, instrumentide näidud jne) tuleb arvutis töötlemiseks teisendada numbrikujule. Näiteks muusikalise heli kvantifitseerimiseks saab mõõta heli intensiivsust teatud sagedustel lühikeste intervallidega, esitades iga mõõtmise tulemused numbrilisel kujul. Arvutiprogrammide abil saab sooritada vastuvõetud info teisendusi, näiteks "üle kanda" erinevatest allikatest pärit helisid üksteise peale.

Samamoodi saate töödelda arvutis tekstiteave. Arvutisse sisestamisel kodeeritakse iga täht kindla numbriga ning välisseadmetele (ekraanile või printimisele) väljastamisel koostatakse inimtaju jaoks nende numbrite abil tähtede kujutised. Tähtede ja numbrite komplekti vahelist vastavust nimetatakse märgikodeeringuks.

Reeglina esitatakse arvutis kõik numbrid nullide ja ühtedega (ja mitte kümne numbriga, nagu inimestele kombeks). Teisisõnu töötavad arvutid tavaliselt kahendsüsteemis, kuna nende töötlemise seadmed on palju lihtsamad. Arvude arvutisse sisestamine ja inimese lugemiseks väljastamine saab toimuda tavalisel kümnendkujul ning kõik vajalikud teisendused teostavad arvutis töötavad programmid.

Teabe kodeerimise viisid.

Sama teavet saab esitada (kodeerida) mitmel kujul. Arvutite tulekuga tekkis vajadus kodeerida igat tüüpi teavet, millega nii üksikisik kui ka inimkond tervikuna tegelevad. Kuid inimkond hakkas teabe kodeerimise probleemi lahendama juba ammu enne arvutite tulekut. Inimkonna grandioossed saavutused - kirjutamine ja arvutamine - pole midagi muud kui kõne ja numbrilise teabe kodeerimise süsteem. Teavet ei kuvata kunagi puhtal kujul, see on alati kuidagi esindatud, kuidagi kodeeritud.

Binaarne kodeerimine on üks levinumaid viise teabe esitamiseks. Arvjuhtimisega arvutites, robotites ja tööpinkides on reeglina kogu teave, millega seade tegeleb, kodeeritud kahendtähestiku sõnade kujul.

Märgi (teksti) teabe kodeerimine.

Peamine teksti üksikute tähemärkidega tehtav toiming on märkide võrdlemine.

Märkide võrdlemisel on kõige olulisemad aspektid iga märgi koodi unikaalsus ja selle koodi pikkus ning kodeerimisprintsiibi valik ise on praktiliselt ebaoluline.

Tekstide kodeerimiseks kasutatakse erinevaid teisendustabeleid. Oluline on, et sama teksti kodeerimisel ja dekodeerimisel kasutataks sama tabelit.

Konversioonitabel - tabel, mis sisaldab mingil viisil järjestatud kodeeritud märkide loendit, mille järgi märk teisendatakse selle kahendkoodiks ja vastupidi.

Kõige populaarsemad teisendustabelid: DKOI-8, ASCII, CP1251, Unicode.

Ajalooliselt on märgikodeeringu koodi pikkuseks valitud 8 bitti või 1 baiti. Seetõttu vastab enamasti üks arvutisse salvestatud teksti märk ühele mälubaidile.

8-bitise koodi pikkusega võib olla 28 = 256 erinevat 0 ja 1 kombinatsiooni, seetõttu ei saa ühte ümberkodeerimistabelit kasutades kodeerida rohkem kui 256 tähemärki. Koodi pikkusega 2 baiti (16 bitti) saab kodeerida 65536 tähemärki.

Numbrilise teabe kodeerimine.

Sarnasus numbrilise ja tekstilise teabe kodeerimisel on järgmine: seda tüüpi andmete võrdlemiseks peab erinevatel numbritel (nagu ka erinevatel tähemärkidel) olema erinev kood. Peamine erinevus arvandmete ja sümboolsete andmete vahel seisneb selles, et lisaks võrdlustehtele tehakse arvudega erinevaid matemaatilisi tehteid: liitmine, korrutamine, juure eraldamine, logaritmi arvutamine jne. Nende tehtete sooritamise reeglid matemaatikas on järgmised: üksikasjalikult välja töötatud positsioonilises numbrisüsteemis esitatud arvude jaoks.

Põhiline arvusüsteem arvude esitamiseks arvutis on kahendpositsiooniline arvusüsteem.

Tekstiinfo kodeerimine

Praegu enamik kasutajad töötlevad arvuti abil tekstilist infot, mis koosneb tähemärkidest: tähed, numbrid, kirjavahemärgid jne. Arvutame välja, mitu tähemärki ja kui palju bitte vajame.

10 numbrit, 12 kirjavahemärki, 15 aritmeetilist sümbolit, vene ja ladina tähestiku tähed, KOKKU: 155 tähemärki, mis vastab 8 bitile informatsiooni.

Teabe mõõtühikud.

1 bait = 8 bitti

1 KB = 1024 baiti

1 MB = 1024 KB

1 GB = 1024 MB

1 TB = 1024 GB

Kodeerimise olemus seisneb selles, et igale märgile määratakse kahendkood vahemikus 00000000 kuni 11111111 või vastav kümnendkood vahemikus 0 kuni 255.

Tuleb meeles pidada, et praegu kasutatakse vene tähtede kodeerimiseks viit erinevat kooditabelit (KOI - 8, СР1251, СР866, Mac, ISO) ja ühe tabeli abil kodeeritud tekste ei kuvata teises õigesti.

Põhimärkide kodeeringu kuva on ASCII kood – American Standard Code for Information Interchange – Ameerika standardkood teabevahetuseks, mis on 16 x 16 tabel, kus märgid on kodeeritud kuueteistkümnendsüsteemis.

Graafilise teabe kodeerimine.

Graafilise pildi kodeerimisel on oluline samm selle jagamine diskreetseteks elementideks (sampling).

Peamised graafika esitamise viisid selle salvestamiseks ja arvuti abil töötlemiseks on raster- ja vektorkujutised.

Vektorkujutis on graafiline objekt, mis koosneb elementaarsetest geomeetrilistest kujunditest (enamasti segmentidest ja kaartest). Nende elementaarsete lõikude asukoha määravad punktide koordinaadid ja raadiuse väärtus. Iga rea ​​jaoks on näidatud joone tüübi (tahke, punktiir, kriips-punktiga), paksuse ja värvi binaarkoodid.

Rasterkujutis on punktide (pikslite) kogum, mis saadakse pildi diskretiseerimise tulemusena maatriksi põhimõttel.

Graafiliste piltide kodeerimise maatrikspõhimõte seisneb selles, et pilt jagatakse etteantud arvuks ridadeks ja veergudeks. Seejärel kodeeritakse saadud ruudustiku iga element vastavalt valitud reeglile.

Piksel (pildielement - pildielement) - pildi minimaalne ühik, mille värvi ja heledust saab määrata ülejäänud pildist sõltumatult.

Maatrikspõhimõtte kohaselt koostatakse pildid, mis väljastatakse printerisse, kuvatakse kuvaril ja saadakse skanneri abil.

Pildikvaliteet on kõrgem, mida "tihedad" on pikslid, st seda suurem on seadme eraldusvõime ja seda täpsemalt on nende iga värv kodeeritud.

Mustvalge pildi puhul antakse iga piksli värvikood ühe bitiga.

Kui pilt on värviline, määratakse iga punkti jaoks selle värvi kahendkood.

Kuna värve kodeeritakse ka kahendkoodis, siis kui soovid näiteks kasutada 16-värvilist joonist, siis iga piksli kodeerimiseks läheb vaja 4 bitti (16=24) ja kui on võimalik kasutada 16 bitti ( 2 baiti) värvi kodeerimiseks ühe piksliga, siis saate seejärel edastada 216 = 65536 erinevat värvi. Kolme baiti (24 bitti) kasutamine ühe punkti värvi kodeerimiseks võimaldab peegeldada 16777216 (ehk umbes 17 miljonit) erinevat värvitooni – nn "tõelise värvi" režiimi (True Color). Pange tähele, et neid kasutatakse praegu, kuid need ei ole kaugeltki kaasaegsete arvutite piiravad võimalused.

Heli kodeering.

Füüsika kursusest teate, et heli on õhu vibratsioon. Oma olemuselt on heli pidev signaal. Kui muudame heli elektrisignaaliks (näiteks mikrofoni kasutades), siis näeme pinget, mis ajas sujuvalt muutub.

Arvutitöötluseks tuleb analoogsignaal kuidagi teisendada kahendarvude jadaks ning selleks tuleb see diskreetida ja digitaliseerida.

Saate teha järgmist: mõõta signaali amplituudi korrapäraste ajavahemike järel ja kirjutada saadud arvväärtused arvuti mällu.

Me pöördume uuesti Erilist tähelepanu juhitavuse jaoks. Teabeobjektide elemente esindavad andmeelemendid vastavalt teatud seadusele. Kodeerimine ei ole juhuslik protsess. See toimub vastavalt valitud teabemeetodile, mis mängib rolli

kodeerimismeetod.

Info kodeerimise meetod loob vastavuse salvestatud teabeobjekti elementide ja salvestamise tulemusena saadud andmeelementide vahel.

Info kodeerimise meetodi valik on arvutiteaduse tehnoloogilises osas oluline küsimus. See peab olema kooskõlas instrumendi ja salvestusmaterjali valikuga. Ohm peab vastama ka ülalmainitud kriteeriumidele.

Teabe kodeerimise meetodite uurimise mugavuse huvides on tavaks kaaluda kategooriaid. Nende kategooriate rolli täidavad nn kodeerimisskeemid.

Seal on kolm peamist kodeerimisskeemi. Need on analoog-, tabeli- ja digitaalne kodeerimine.

Analoogkodeerimisskeemid on eluslooduses tavalised. Teaduse ja tehnoloogia arengu käigus on ühiskond neid järk-järgult oma vajadustele kohandanud. See oli analoogkodeerimine, mis leidis kõige varasema kasutuse piltide, heli ja video salvestamisel.

Tabelikujulistel kodeerimisskeemidel ei ole ega saa olla eluslooduse rakendusi – see on ühiskonna väljamõeldis. Inimesed on tabelkodeerimist kasutanud sellest ajast, kui nad õppisid sõrmedel objekte, loomi ja inimesi tähistama. Kõik kirjutamisviisid põhinevad tabelkodeerimisel. Tabelina kodeerimine tagab enamiku käsitsi avaliku teabevahetuse vajadustest.

Tabelite kodeerimisskeemide hulgas eristatakse eriti kahte sõltumatut kategooriat:

tabel-märkide kodeerimisskeemid;

tabel-numbrilised kodeerimisskeemid.

Tabelimärkide kodeerimist kasutatakse laialdaselt otseses teabevahetuses ning tabeli- ja digitaalseid kodeerimisskeeme, kui inimestevaheline infovahetus toimub arvutitehnoloogia abil. Näiteks kirjalike sõnumite vahetamiseks piisab märgikodeeringu skeemidest. Aga kui teade tuleb saata telegraafi või e-mail, siis on digitaalne kodeerimine hädavajalik.

Digitaalsel kodeerimisel pole rakendust ei eluslooduses ega otseses infovahetuses inimeste vahel. See on kaasaegse ühiskonna saavutus. Seda kasutatakse automaatsetes teabevahetussüsteemides ja see toimib teabe salvestamisel või edastamisel tehniliste seadmete vahel.

Teabe kodeerimise põhimõtted

Info kodeerimisega seotud küsimused kuuluvad arvutiteaduse tehnoloogilistesse osadesse. Igal tehnoloogial teabe andmeteks teisendamiseks on oma põhimõtted. Need on seotud valitud kodeerimisskeemiga.

Analoogkodeerimine

Analoogkodeerimine põhineb sarnasuse kontseptsioonil. Analoogkodeerimise eesmärk on muuta andmejada füüsilist olemust. See on kasulik salvestustiheduse, salvestuskindluse, edastuskiiruse, taasesituse mugavuse ja muude andmeomaduste suurendamiseks.

Analoogkodeerimine- see on kodeerimismeetod, mis põhineb kindla füüsilise olemusega signaalide pideva jada registreerimisel erineva füüsilise olemusega andmejada kujul.

Tüüpilised analoogkodeerimist rakendavad tehnilised süsteemid on:

fotoseadmed (va digitaalsed);

magnetofonid ja videokaamerad (va digitaalsed);

seadmed raadiosignaalide vastuvõtmiseks ja edastamiseks.

Definitsiooni kohaselt on analoogkodeerimise põhimõttel kaks iseloomulikku tunnust -

nii algne signaalijada kui ka sellest tulenev andmejada on pidevad;

saadud andmed on valitud sarnasuse kriteeriumi järgi sarnased algsete signaalidega.

Koos järjepidevuse ja sarnasuse põhimõtteid seostatakse info analoogkodeerimise laialdase levikuga eluslooduses. Näiteks visuaalse info saamisel on inimese jaoks olulised kaks tegurit: vaatlusobjekti heledus ja värvus. Heleduse määrab valguslaine amplituud ja värvi - selle pikkus (sagedus).

Tabeli kodeerimine

Tabelikodeerimine on infotehnoloogia, mis põhineb signaalielementide perioodilisel võrdlemisel saadaolevate mudelinäidistega. Kuna võrdlus ei ole pidev, vaid perioodiline, moodustavad selle tulemused mittepideva, adiskreetse andmejada. Seda jada nimetatakse andmenäidiseks. Andmeproov koosneb kas mudelinäidistest endist, mis on võetud otsingutabelist, või numbrikoodidest, mis näitavad nende näidiste asukohta otsingutabelis.

Esimesel juhul kutsutakse välja kodeering tabel-sümbol. Tabelimärkide kodeerimise tulemuseks on märgistring – tähemärkide jada.

Teisel juhul nimetatakse kodeerimist tabel-numbriliseks. Selle kodeeringu tulemuseks on ka andmenäidis, kuid see ei koosne sümbolitest, vaid numbrilistest osutitest, mis näitavad näidiste asukohta otsingutabelis (kodeeringutabelis).

Tabeli kodeerimine- see on kodeerimismeetod, mis põhineb diskreetse andmevalimi moodustamise põhimõttel, mis põhineb salvestatud signaali perioodilise võrdluse tulemustel etteantud hulga valimielementidega.

Tabelimärkide kodeerimise tehnoloogiad hõlmavad meile hästi tuntud kirjutamist. Nagu teate, põhineb see kõnehelide (pidevate analoogsignaalide) salvestamisel diskreetsete sümbolite - tähtede abil. See hõlmab ka muusika salvestamist nootide abil. Tabelinumbrilise kodeerimise näide on näiteks tähtede asendamine numbrirühmadega, mis väljendavad nende tähtede asukohta tähestikus või mõnes muus kodeerimistabelis.

Nagu näete, ei põhine tabelkodeerimine mitte analoogkodeerimisele iseloomulikul järjepidevuse põhimõttel, vaid diskreetse ekspressiivsuse põhimõttel. Kaks erineva pikkuse, tugevuse ja tonaalsusega heli "a ..." väljendatakse diskreetselt sama tähega - "A".

Tabelikodeerimisel ei järgita ka sarnasuse põhimõtet. Nii et näiteks sellest, et tähestikus on tähe "B" arv kaks korda suurem kui tähe "A" arv, ei järeldu sugugi, et taasesitades peaks see kõlama kaks korda valjemalt või kaks korda pikem.

Tabelkodeerimine on suhtekorraldust teenindavas teabevahetuses väga levinud. Piisab, kui öelda, et kõigi Euroopa keelte tähestikud on mustrite tabelid, mis loovad vastavuse helide ja nende kirjutamiseks kasutatud sümbolite vahel. Muidugi teate, et see kirjavahetus ei ole paraku alati üheselt mõistetav ja põhjustab sageli piinlikke õigekirjavigu. Seetõttu tuleks tekstide kirjutamisel juhinduda mitte ainult tähestikust, vaid ka õigekirjareeglitest, aga ka heakskiidetud sõnaraamatutest. Sõnaraamatuid ja reegleid võib pidada ka otsingutabelite sortideks.

Nii tabel-märkide kui ka tabelinumbrite kodeerimine põhineb alati mingisugusel ühiskondlikul kokkuleppel, sest kodeerimistabel peab olema avalikult teada. Kui see nii ei ole, on teabevahetusel kunstlik piirang, mida nimetatakse krüpteerimiseks. Ja mis tahes krüpteerimismeetodi aluseks on alati mingi kodeerimismeetod.

Kokkulepped kasutatava kodeerimistabeli kohta põhinevad sageli üldtunnustatud konventsioonidel või heakskiidetud standarditel.

Digitaalne kodeerimine

Analoogkodeerimisel on üks märkimisväärne eelis: selle kasutamisel järgitakse salvestatud signaali ja salvestamise tulemusena saadud andmete sarnasuse põhimõtet. Mõnel juhul võimaldab see muuta salvestise visuaalseks, mõnel juhul aga lihtsustab oluliselt selle taasesitamist ja tajumist. Selle tulemusena tajuvad inimesed kvaliteetseid analoogsalvestisi subjektiivselt kõige "loomulikumana".

Tabelkodeerimise oluliseks eeliseks on kokkuvõtlikkus ja ühemõttelisus ning oluliseks puuduseks salvestatud signaali ja salvestustulemuse sarnasuse puudumine. Sarnasuse puudumise tõttu ei saa salvestuse taasesitamisel piirduda infovahetuse signaalitasemega. Peame kasutama teist ja isegi kolmandat taset (mustrituvastuse tase ja sisu tõlgendamise tase). Seetõttu tuleb tabelkodeerimisel tehtud kirjete reprodutseerimist spetsiaalselt uurida. Koolituse kestus on kogu elu. Kuni inimene ühiskonda püsib, leiab ta seni uusi, seni võõraid vormimärke, sümboleid, konventsioone ja muid diskreetse väljendusvõime vahendeid.

Analoogkodeerimisele omase sarnasuse põhimõtte ja tabelikodeerimisele omase diskreetse väljendusvõime põhimõtte ühendamine võimaldab nn digitaalset kodeerimist.

Digitaalne kodeerimine- see on kodeerimismeetod, mis põhineb andmeproovi võtmise põhimõttel, mõõdetakse perioodiliselt salvestatud signaali suurust ja salvestatakse mõõtmistulemustega võrdelised arvväärtused.

Digitaalse kodeerimise peamine eelis on tõhusus. Seda seostatakse arvutitehnoloogia laialdase kasutamisega andmenäidistega toimingutes. Asjaolu, et proovidesse salvestatud väärtused on võrdelised tegelike füüsiliste signaalidega, võimaldab andmetega töötamiseks kasutada aritmeetilisi tehteid. Ja asjaolu, et väärtused on diskreetsed, võimaldab teil rakendada neile matemaatilise loogika toiminguid. Tänu arvutitehnoloogia arengule kasutatakse digitaalset kodeerimist iga päevaga üha laiemalt helisalvestiste, piltide ja videote salvestamisel ja edastamisel.

Analoog-digitaal muundamine

Võrreldes analoogiga pakub digitaalne kodeerimine teabe salvestamisel erilise tõhususe. Pärast analoogsalvestise digitaalseks konverteerimist on tavaliselt võimalik salvestatavate andmete mahtu umbes kümme korda vähendada. Reeglina saab ühele digitaalsele helisalvestus-CD-le paigutada kümme muusikaalbumit ja maapealse tavatelevisiooni ühele sageduskanalile saab hõlpsasti paigutada kümme digitelevisiooni kanalit.

Samas on objektiivsed põhjused, miks praegu ei saa täielikult loobuda info salvestamise ja taasesitamise analoogskeemidest. Siin on vaid mõned neist.

on võimatu üleöö asendada tohutut analoogtehniliste seadmete parki üle kogu maailma;

maailma on kogunenud tohutud arhiivid analoogformaadis salvestatud filmi-, foto-, video- ja helimaterjalidest – nende reprodutseerimiseks on vaja analoogseadmeid;

digitaalsed kodeerimisskeemid toovad salvestusel kaasa täiendavaid vigu, mis on seotud digitaalse andmejada saamise põhimõttega. Tehnoloogia (ja tehniliste standardite) praeguse arengutaseme juures on need vead endiselt üsna märgatavad. Nende tõttu pole paljud tarbijad veel valmis analoogseadmetest loobuma.

Vajadus töötada üheaegselt erinevate tehnoloogiate abil salvestatud teabega nõuab spetsiaalset andmekonversiooni teostavate seadmete klassi. Analoogandmete teisendamist digitaalseks nimetatakse analoog-digitaal muutumine(ADC) - seda kasutatakse varem digitaalne salvestus või andmeedastus. Analoog-digitaalmuundur on saadaval kõigis GSM-mobiiltelefonide mudelites, digikaamerates ja videokaamerates, skaneerimisseadmetes ning personaalarvutite heliadapterites.

Digitaalsete andmete vastupidist teisendamist analoogsignaaliks nimetatakse digitaalsest analoogiks teisendamine(DAC) – seda kasutatakse tavaliselt enne andmete esitamist. Tüüpiline näide on arvuti videoadapter.