Text Recoded program nudi sljedeće korisne operacije na danim tekstualnim podacima:
- Kodiranje, dekodiranje i ponovno kodiranje između običnog teksta, heksadecimalnog i Base64 kodiranja
- Šifriranje i dešifriranje pomoću Caesar šifre
- Izrada hashova neobrađenih i formatiranih tekstualnih podataka u svrhu provjere njihovog integriteta
Kodiranje tekstualnih podataka u heksadecimalno ili Base64 kodiranje može se koristiti kako bi se osiguralo da se izvorni tekstualni podaci neće promijeniti zbog medija za pohranjivanje ili prijenos koji s njima radi u nekompatibilnom skupu znakova.
Šifriranje pomoću Caesar šifre, koja je jednostavna zamjenska šifra, može se koristiti u mnogim slučajevima kada tekstualni podaci moraju ostati skriveni od običnih ljudi koji se obično ne trude dešifrirati ih. Međutim, nije prikladan za osiguranje osjetljivih podataka, budući da ih je današnjom tehnologijom moguće lako dešifrirati.
Postupak šifriranja i dešifriranja koji implementira program Text Recoded objašnjen je u sljedećem primjeru korištenjem "TEKSTA" kao unosa i "testiranja" kao ključa:
Unos: TEKST (T=84, E=69, X=88, T=84)
Ključ: test (t=116, e=101, s=115, t=116)
Postupak: unos + ključ
Izlaz u decimalnom obliku: (200,170,203, 200)
Izlaz u heksadecimalnom obliku: C8AACBC8
Dešifriranje je upravo suprotno od navedenog, odnosno šifrirani izlaz – ključ. U našem slučaju to će biti:
C8AACBC8 - test = TEKST
Program Text Recoded prima i isporučuje ulazne i izlazne tekstualne podatke, kao i ključ za šifriranje, u UTF-8 kodiranju koje podržava cijeli Unicode skup znakova, koji prihvaća znakove iz gotovo svih svjetskih sustava pisanja.
Ne postoji ograničenje za duljinu unosa osim dostupne memorije. Ključ također može biti bilo koje duljine, ali ako je dulji od ulaza, skraćuje se na ulaznu duljinu, dijeli na dijelove ulazne duljine, a zatim se vrijednosti dodatnih dijelova dodaju prvom komadu.
Izlaz šifriranja može biti u heksadecimalnom ili Base64 kodiranju. Rad s binarnim podacima nije podržan u ovoj verziji.
U svrhu osiguranja cjelovitosti danog izlaza, također je moguće uključiti njihove hashove u izlazni okvir, i za operacije kodiranja i šifriranja.
Imajte na umu da proizvedeni hashovi postoje tri vrste objašnjene u nastavku.
Hash za SAV tekstualni sadržaj proizvodi se za cijeli sadržaj navedenih tekstualnih podataka, uključujući prazne prostore poput razmaka, kartica i novih redaka, ako ih ima.
Hash za formatirani FMT tekstualni sadržaj proizvodi se za tekst i njegove unutarnje bjeline i nove retke, isključujući sve okolne prazne retke i bjeline.
Hash za RAW tekstualni sadržaj proizvodi se samo za sam tekst, isključujući sve vrste praznih mjesta: prazne retke, razmake, kartice i nove retke.
Za provjeru integriteta zadanih tekstualnih podataka u slučajevima kada je potrebna vrsta raspršivanja koja nije RAW, značajne su duljine redaka, broj redaka i vrsta znakova novog retka. To je zato što Windows koristi #13#10 znakovne kodove za pohranjivanje novih redaka, dok Linux operativni sustav koristi samo znakovni kod #10 za pohranjivanje novih redaka. Stoga, ako se raspršivanje za tekstualne podatke proizvodi u jednom OS-u, ali treba biti potvrđeno u drugom, mora se postaviti odgovarajuća opcija. U tu svrhu, postoji izborni okvir za odabir između Windows i Linux znakova novog retka pri stvaranju hashova.