Principi kodiranja i skladištenja različitih vrsta informacija. Informacije. Kodiranje informacija

Kod je skup konvencija (ili signala) za snimanje (ili prijenos) nekih unaprijed definiranih koncepata.

Kodiranje informacija je proces formiranja određene reprezentacije informacije. U užem smislu, termin "kodiranje" se često shvata kao prelazak sa jednog oblika prezentacije informacija na drugi, pogodniji za skladištenje, prenos ili obradu.

Obično je svaka slika prilikom kodiranja (ponekad kažu - šifriranje) predstavljena posebnim znakom.

Znak je element konačnog skupa različitih elemenata.

U užem smislu, termin "kodiranje" se često shvata kao prelazak sa jednog oblika prezentacije informacija na drugi, pogodniji za skladištenje, prenos ili obradu.

Računar može obraditi samo informacije predstavljene u numeričkom obliku. Sve ostale informacije (kao što su zvukovi, slike, očitanja instrumenta, itd.) moraju se pretvoriti u numerički oblik za obradu na računaru. Na primjer, da bi se kvantificirao muzički zvuk, može se mjeriti intenzitet zvuka na određenim frekvencijama u kratkim intervalima, prikazujući rezultate svakog mjerenja u numeričkom obliku. Uz pomoć kompjuterskih programa možete izvršiti transformacije primljenih informacija, na primjer, "preklapanje" zvukova iz različitih izvora jedan na drugi.

Slično, na računaru možete obraditi tekstualne informacije. Kada se unese u računar, svako slovo je kodirano određenim brojem, a kada se izađe na eksterne uređaje (ekran ili print), za ljudsku percepciju, slike slova se grade pomoću ovih brojeva. Korespondencija između skupa slova i brojeva naziva se kodiranjem znakova.

Po pravilu, svi brojevi u računaru su predstavljeni pomoću nula i jedinica (a ne deset cifara, kao što je uobičajeno za ljude). Drugim riječima, računari obično rade u binarnom sistemu, jer su uređaji za njihovu obradu mnogo jednostavniji. Unošenje brojeva u računar i njihovo ispisivanje za ljudsko čitanje može se obaviti u uobičajenom decimalnom obliku, a sve potrebne konverzije izvode programi koji rade na računaru.

Načini kodiranja informacija.

Ista informacija se može predstaviti (kodirati) u nekoliko oblika. Pojavom kompjutera postalo je neophodno kodirati sve vrste informacija s kojima se suočavaju i pojedinac i čovječanstvo u cjelini. Ali čovječanstvo je počelo rješavati problem kodiranja informacija mnogo prije pojave kompjutera. Grandiozna dostignuća čovječanstva - pisanje i aritmetika - nisu ništa više od sistema za kodiranje govora i numeričkih informacija. Informacije se nikada ne pojavljuju čista forma, uvijek je nekako predstavljen, nekako kodiran.

Binarno kodiranje je jedan od najčešćih načina predstavljanja informacija. U kompjuterima, robotima i alatnim mašinama sa numeričkom kontrolom, po pravilu, sve informacije sa kojima se uređaj obrađuje su kodirane u obliku reči binarnog alfabeta.

Kodiranje znakovnih (tekstualnih) informacija.

Glavna operacija koja se izvodi na pojedinačnim znakovima teksta je poređenje znakova.

Prilikom upoređivanja znakova najvažniji aspekti su jedinstvenost koda za svaki znak i dužina ovog koda, a sam izbor principa kodiranja je praktično irelevantan.

Za kodiranje tekstova koriste se različite tabele konverzije. Važno je da se ista tabela koristi prilikom kodiranja i dekodiranja istog teksta.

Tabela konverzije - tabela koja sadrži listu kodiranih znakova poredanih na neki način, prema kojoj se karakter pretvara u svoj binarni kod i obrnuto.

Najpopularnije tablice konverzije: DKOI-8, ASCII, CP1251, Unicode.

Istorijski gledano, 8 bitova ili 1 bajt je odabrano kao dužina koda za kodiranje znakova. Stoga, najčešće jedan znak teksta pohranjenog u računaru odgovara jednom bajtu memorije.

Može postojati 28 = 256 različitih kombinacija od 0 i 1 s dužinom koda od 8 bita, stoga, korištenjem jedne tablice kodiranja, ne može se kodirati više od 256 znakova. Sa dužinom koda od 2 bajta (16 bita), može se kodirati 65536 znakova.

Kodiranje numeričkih informacija.

Sličnost u kodiranju numeričkih i tekstualnih informacija je sljedeća: da bi se mogli porediti podaci ovog tipa, različiti brojevi (kao i različiti znakovi) moraju imati različit kod. Osnovna razlika između numeričkih i simboličkih podataka je u tome što se, pored operacije poređenja, nad brojevima izvode i razne matematičke operacije: sabiranje, množenje, vađenje korijena, računanje logaritma itd. Pravila za izvođenje ovih operacija u matematici su detaljno razvijen za brojeve predstavljene u pozicijskom brojevnom sistemu.

Osnovni sistem brojeva za predstavljanje brojeva u računaru je binarni pozicioni brojevni sistem.

Kodiranje tekstualnih informacija

trenutno, večina korisnici uz pomoć računara obrađuju tekstualne informacije, koje se sastoje od znakova: slova, brojeva, interpunkcijskih znakova itd. Izračunajmo koliko znakova i koliko bitova nam je potrebno.

10 cifara, 12 znakova interpunkcije, 15 aritmetičkih simbola, slova ruske i latinične abecede, UKUPNO: 155 znakova, što odgovara 8 bitova informacija.

Jedinice mjerenja informacija.

1 bajt = 8 bitova

1 KB = 1024 bajtova

1 MB = 1024 KB

1 GB = 1024 MB

1 TB = 1024 GB

Suština kodiranja je da se svakom znaku dodjeljuje binarni kod od 00000000 do 11111111 ili odgovarajući decimalni kod od 0 do 255.

Treba imati na umu da se trenutno koristi pet različitih kodnih tabela za kodiranje ruskih slova (KOI - 8, SR1251, SR866, Mac, ISO), a tekstovi kodirani pomoću jedne tabele neće biti ispravno prikazani u drugoj

Glavni prikaz kodiranja znakova je ASCII kod - Američki standardni kod za razmjenu informacija - američki standardni kod za razmjenu informacija, koji je tabela 16 puta 16, gdje su znakovi kodirani heksadecimalno.

Kodiranje grafičkih informacija.

Važan korak u kodiranju grafičke slike je njena podjela na diskretne elemente (uzorkovanje).

Glavni načini predstavljanja grafike za njeno skladištenje i obradu pomoću računara su rasterske i vektorske slike.

Vektorska slika je grafički objekat koji se sastoji od elementarnih geometrijskih oblika (najčešće segmenata i lukova). Položaj ovih elementarnih segmenata određen je koordinatama tačaka i vrijednosti radijusa. Za svaku liniju su naznačeni binarni kodovi za tip linije (puna, tačkasta, isprekidana), debljina i boja.

Rasterska slika je skup tačaka (piksela) dobijenih kao rezultat diskretizacije slike u skladu sa matričnim principom.

Matrični princip kodiranja grafičkih slika je da je slika podijeljena na određeni broj redova i kolona. Zatim se svaki element rezultirajuće mreže kodira prema odabranom pravilu.

Piksel (element slike - element slike) - minimalna jedinica slike, čija se boja i svjetlina mogu podesiti nezavisno od ostatka slike.

U skladu sa matričnim principom, grade se slike koje se izlaze na štampač, prikazuju na ekranu, dobijene pomoću skenera.

Kvalitet slike će biti veći, što su pikseli "gusti", odnosno veća je rezolucija uređaja, a boja svakog od njih je tačnije kodirana.

Za crno-bijelu sliku, kod boje svakog piksela je dat jednim bitom.

Ako je slika u boji, tada se za svaku tačku postavlja binarni kod njene boje.

Pošto su boje također kodirane u binarnom kodu, ako, na primjer, želite koristiti crtež od 16 boja, tada će vam trebati 4 bita (16=24) za kodiranje svakog piksela, a ako je moguće koristiti 16 bita ( 2 bajta) za kodiranje boje jedan piksel, tada možete prenijeti 216 = 65536 različitih boja. Korišćenje tri bajta (24 bita) za kodiranje boje jedne tačke omogućava vam da reflektujete 16777216 (ili oko 17 miliona) različitih nijansi boje - takozvani režim "prave boje" (True Color). Imajte na umu da se oni trenutno koriste, ali daleko od ograničavajućih mogućnosti modernih računara.

Audio kodiranje.

Iz predmeta fizike znate da su zvuk vibracije zraka. Po svojoj prirodi, zvuk je neprekidan signal. Ako zvuk pretvorimo u električni signal (na primjer, pomoću mikrofona), vidjet ćemo napon koji se glatko mijenja tokom vremena.

Za kompjutersku obradu, analogni signal se mora nekako pretvoriti u niz binarnih brojeva, a za to se mora uzorkovati i digitalizirati.

Možete učiniti sljedeće: mjeriti amplitudu signala u pravilnim intervalima i upisivati ​​dobijene numeričke vrijednosti u memoriju računara.

Opet se okrećemo Posebna pažnja za upravljivost. Elementi informacionih objekata predstavljeni su elementima podataka prema određenom zakonu. Kodiranje nije slučajan proces. Javlja se prema odabranoj informacijskoj metodi, koja igra ulogu

metoda kodiranja.

Metoda kodiranja informacija uspostavlja korespondenciju između elemenata snimljenog informacijskog objekta i elemenata podataka dobijenih kao rezultat snimanja.

Izbor metode kodiranja informacija je važno pitanje u tehnološkom dijelu računarstva. Mora biti u skladu sa izborom instrumenta i materijala za snimanje. Ohm također mora zadovoljiti gore navedene kriterije.

Za praktičnost proučavanja metoda kodiranja informacija, uobičajeno je uzeti u obzir kategorije. Ulogu ovih kategorija obavljaju tzv sheme kodiranja.

Postoje tri glavne sheme kodiranja. To su analogni, tabelarni i digitalno kodiranje.

Analogne sheme kodiranja uobičajene su u divljim životinjama. U toku razvoja naučnog i tehnološkog napretka, društvo ih je postepeno prilagođavalo svojim potrebama. Analogno kodiranje je našlo najraniju primjenu u snimanju slika, zvuka i videa.

Tabelarne šeme kodiranja nemaju i ne mogu imati implementacije u divljim životinjama - ovo je izum društva. Ljudi koriste tablično kodiranje otkako su naučili da označavaju predmete, životinje, ljude na svojim prstima. Sve vrste pisanja su zasnovane na tabelarnom kodiranju. Tabelarno kodiranje pruža većinu potreba ručne razmjene javnih informacija.

Među tabelarnim shemama kodiranja posebno se izdvajaju dvije nezavisne kategorije:

sheme kodiranja znakova tablice;

tablično-numeričke sheme kodiranja.

Kodiranje znakova u tablici se široko koristi u direktnoj razmjeni informacija, a tablične i digitalne šeme kodiranja se koriste kada se razmjena informacija između ljudi vrši korištenjem kompjuterske tehnologije. Na primjer, za razmjenu pisanih poruka dovoljne su šeme kodiranja znakova. Ali ako se poruka šalje telegrafom ili e-mail, tada je digitalno kodiranje neophodno.

Digitalno kodiranje nema implementaciju ni u divljim životinjama ni u direktnoj razmjeni informacija između ljudi. To je dostignuće modernog društva. Koristi se u sistemima za automatsku razmjenu informacija i radi kada se informacije pohranjuju ili prenose između tehničkih uređaja.

Principi kodiranja informacija

Pitanja vezana za kodiranje informacija spadaju u tehnološke dijelove informatike. Svaka tehnologija za pretvaranje informacija u podatke ima svoje principe. Oni su povezani sa odabranom šemom kodiranja.

analogno kodiranje

Analogno kodiranje se zasniva na konceptu sličnosti. Svrha analognog kodiranja je promijeniti fizičku prirodu niza podataka. Ovo je korisno za povećanje gustine snimanja, pouzdanosti skladištenja, brzine prenosa, pogodnosti reprodukcije i drugih svojstava podataka.

analogno kodiranje- ovo je metoda kodiranja zasnovana na principu registracije kontinuiranog niza signala određene fizičke prirode u obliku sličnog niza podataka različite fizičke prirode.

Tipični tehnički sistemi koji implementiraju analogno kodiranje su:

Fotografski uređaji (osim digitalnih);

kasetofoni i video kamere (ne digitalne);

uređaji za prijem i prenos radio signala.

Prema definiciji, princip analognog kodiranja ima dvije karakteristične karakteristike -

i originalni niz signala i rezultujući niz podataka su kontinuirani;

rezultirajući podaci su slični originalnim signalima prema odabranom kriteriju sličnosti.

With principi kontinuiteta i sličnosti povezani su sa široko rasprostranjenom upotrebom analognog kodiranja informacija u divljim životinjama. Na primjer, prilikom primanja vizualnih informacija, osobi su važna dva faktora: svjetlina i boja objekta promatranja. Svjetlina je određena amplitudom svjetlosnog vala, a boja - njegovom dužinom (frekvencijom).

Tablično kodiranje

Tablično kodiranje je informaciona tehnologija zasnovana na periodičnom poređenju elemenata signala sa dostupnim uzorcima modela. Budući da poređenje nije kontinuirano, već periodično, njegovi rezultati formiraju nekontinuirani, adiskretni niz podataka. Ovaj niz se naziva uzorak podataka. Uzorak podataka sastoji se ili od samih uzoraka modela, uzetih iz tabele za pretraživanje, ili od numeričkih kodova koji ukazuju na poziciju ovih uzoraka u tabeli za pretraživanje.

U prvom slučaju se poziva kodiranje tablica-simbol. Rezultat kodiranja znakova tablice je niz znakova - niz znakova.

U drugom slučaju, kodiranje se naziva tablično-numeričko. Rezultat ovog kodiranja je također uzorak podataka, ali se ne sastoji od simbola, već od numeričkih pokazivača koji ukazuju na lokaciju uzoraka u tabeli za pretraživanje (u tablici kodiranja).

Tablično kodiranje- ovo je metoda kodiranja zasnovana na principu formiranja diskretnog uzorka podataka na osnovu rezultata periodičnog poređenja snimljenog signala sa elementima uzorka unaprijed određenog skupa.

Tehnologije kodiranja tabličnih znakova uključuju pisanje koje nam je dobro poznato. Zasnovan je, kao što znate, na snimanju govornih zvukova (kontinuiranih analognih signala) pomoću diskretnih simbola - slova. Ovo uključuje i snimanje muzike uz pomoć nota. Primjer tablično-numeričkog kodiranja je, na primjer, zamjena slova grupama brojeva koji izražavaju položaj tih slova u abecedi ili u nekoj drugoj tablici kodiranja.

Kao što vidite, tabelarno kodiranje se ne zasniva na principu kontinuiteta karakterističnom za analogno kodiranje, već na principu diskretne ekspresivnosti. Dva glasa "a..." različite dužine, jačine i tonaliteta izražena su diskretno istim slovom - "A".

U tabelarnom kodiranju princip sličnosti se također ne poštuje. Tako, na primjer, iz činjenice da slovo "B" u abecedi ima dvostruko veći broj od broja slova "A", nikako ne proizlazi da bi pri reprodukciji trebalo da zvuči duplo glasnije ili duplo duže.

Tablično kodiranje je vrlo rašireno u razmjeni informacija koje služe odnosima s javnošću. Dovoljno je reći da su pisma svih evropskih jezika tabele obrazaca koji uspostavljaju korespondenciju između zvukova i simbola koji se koriste za njihovo pisanje. Naravno, znate da ova korespondencija, nažalost, nije uvijek nedvosmislena i često uzrokuje neugodne pravopisne greške. Stoga se prilikom pisanja tekstova treba voditi ne samo abecedom, već i pravilima pravopisa, kao i odobrenim rječnicima. Rječnici i pravila se također mogu smatrati varijantama tabela za pretraživanje.

I kodiranje tablica-znakova i tablica-numeričko kodiranje uvijek se zasnivaju na nekoj vrsti društvenog dogovora, jer tabela kodiranja mora biti javno poznata. Ako to nije slučaj, onda postoji vještačko ograničenje razmjene informacija, poznato kao šifriranje. A osnova bilo koje metode šifriranja je uvijek neka vrsta metode kodiranja.

Dogovori o tablici kodiranja koja će se koristiti često su zasnovani na opšteprihvaćenim konvencijama ili odobrenim standardima.

Digitalno kodiranje

Analogno kodiranje ima jednu izuzetnu prednost: kada se koristi, poštuje se princip sličnosti između snimljenog signala i podataka dobijenih kao rezultat snimanja. U nekim slučajevima to vam omogućava da snimak učinite vizualnim, au drugim uvelike pojednostavljuje njegovu reprodukciju i percepciju. Kao rezultat toga, visokokvalitetne analogne snimke ljudi subjektivno percipiraju kao najprirodnije.

Važna prednost tabelarnog kodiranja je sažetost i nedvosmislenost, a važan nedostatak je nedostatak sličnosti između snimljenog signala i rezultata snimanja. Zbog nedostatka sličnosti, nije moguće ograničiti se na nivo signala razmjene informacija tokom reprodukcije snimka. Moramo koristiti drugi, pa čak i treći nivo (nivo prepoznavanja obrazaca i nivo interpretacije sadržaja). Stoga se reprodukcija zapisa napravljenih tabelarnim kodiranjem mora posebno proučavati. Trajanje obuke je doživotno. Sve dok osoba ostaje u društvu, do tada pronalazi nove, do tada nepoznate formalne znakove, simbole, konvencije i druga sredstva diskretne ekspresivnosti.

Kombinovanje principa sličnosti, svojstvenog analognom kodiranju, sa principom diskretne ekspresivnosti, svojstvenim tabelarnom kodiranju, omogućava tzv. digitalno kodiranje.

Digitalno kodiranje- ovo je metoda kodiranja zasnovana na principu uzorkovanja podataka periodičnim mjerenjem veličine snimljenog signala i bilježenjem numeričkih vrijednosti proporcionalnih rezultatima mjerenja.

Glavna prednost digitalnog kodiranja je efikasnost. Povezan je sa širokom upotrebom kompjuterske tehnologije za operacije sa uzorcima podataka. Činjenica da su vrijednosti pohranjene u uzorcima proporcionalne stvarnim fizičkim signalima omogućava korištenje aritmetičkih operacija za rad s podacima. A činjenica da su vrijednosti diskretne omogućava vam da na njih primijenite operacije matematičke logike. Zahvaljujući razvoju kompjuterske tehnologije, digitalno kodiranje se svakim danom sve više koristi u snimanju i prijenosu zvučnih zapisa, slika i video zapisa.

Analogno digitalno pretvaranje

Digitalno kodiranje, u poređenju sa analognim, pruža posebnu efikasnost skladištenja informacija. Nakon pretvaranja analognog zapisa u digitalni, obično je moguće smanjiti količinu pohranjenih podataka za oko deset puta. U pravilu se deset muzičkih albuma može smjestiti na jedan CD sa digitalnim snimanjem zvuka, a deset kanala digitalne televizije lako se može smjestiti na jedan frekvencijski kanal konvencionalne zemaljske televizije.

Istovremeno, postoje objektivni razlozi zašto je trenutno nemoguće potpuno napustiti analogne sheme za snimanje i reprodukciju informacija. Evo samo neke od njih:

nemoguće je preko noći zamijeniti ogromnu flotu analognih tehničkih uređaja širom svijeta;

svijet je nakupio ogromne arhive filmskih, foto, video i zvučnih materijala snimljenih u analognim formatima - analogna oprema ostaje neophodna za njihovu reprodukciju;

šeme digitalnog kodiranja unose dodatne greške u snimku povezane sa samim principom dobijanja digitalnog niza podataka. Uz sadašnji nivo razvoja tehnologije (i tehničkih standarda), ove greške i dalje ostaju prilično uočljive. Zbog njih mnogi potrošači još nisu spremni napustiti analogne uređaje.

Potreba da se istovremeno radi sa informacijama snimljenim različitim tehnologijama zahtijeva posebnu klasu uređaja koji vrše konverziju podataka. Pretvaranje analognih podataka u digitalne se zove analogno-digitalni transformacija(ADC) - koristi se ranije digitalno snimanje ili prenos podataka. Analogno-digitalni pretvarač je dostupan u svim modelima GSM mobilnih telefona, u digitalnim kamerama i video kamerama, u uređajima za skeniranje, kao i u zvučnim adapterima za personalne računare.

Reverzna konverzija digitalnih podataka u analogni signal se naziva digitalno-analogna konverzija(DAC) - obično se koristi prije reprodukcije podataka. Tipičan primjer je kompjuterski video adapter.