Back

ⓘ Text formatat. Textul formatat, textul stilizat sau textul îmbogățit, spre deosebire de textul simplu, conține informații de stil care depășesc minimul elemente ..




                                     

ⓘ Text formatat

Textul formatat, textul stilizat sau textul îmbogățit, spre deosebire de textul simplu, conține informații de stil care depășesc minimul elementelor semantice: culori, stiluri, dimensiuni și caracteristici speciale în HTML.

                                     

1. Terminologie

Textul formatat nu poate fi identificat în mod corect cu fișiere binare sau distinct de textul ASCII. Acest lucru se datorează faptului că textul formatat nu este neapărat binar, poate fi doar text, cum ar fi HTML, RTF sau fișiere text îmbogățit, și poate fi doar ASCII. În schimb, un fișier text simplu poate fi non-ASCII fiind salvat într-o altă codificare, cum ar fi Unicode UTF-8. Textul formatat care conține doar text este arhivat prin marcare, cu toate că unele programe care editează text formatat precum Microsoft Word îl salvează într-un format binar.

                                     

2. Începuturile textului formatat

Textul formatat își are începuturile în utilizarea de dinainte de calculatoare a sublinierii pentru a evidenția pasaje din manuscrise. În primele sisteme timpurii interactive de tehnologie computerizată, sublinierea nu a fost posibilă, iar utilizatorii au compensat această lipsă și lipsa de formatare din ASCII folosind anumite simboluri ca înlocuitori. Accentul, de exemplu, ar putea fi obținut în ASCII în mai multe moduri:

  • Înconjurând cu asteriscuri: Eu *nu* am aflat despre asta.
  • Prin spațiere: Eu n u am aflat despre asta.
  • Înconjurând cu sublinieri: Eu _nu_ am aflat despre asta.
  • Capitalizare: Eu NU am aflat despre asta.

Înconjurarea cu sublinieri era folosită și pentru a marca titluri de cărți: Căutați mai multe în _Limbajul_de_programare_C_.

                                     

3. Limbaje de marcare

Formatarea poate fi marcată prin etichete distincte de textul corpului prin caractere speciale, cum ar fi paranteze unghiulare în HTML. De exemplu, acest text:

Denumirea latinească a câinelui este Canis lupus familiaris, folosită în taxonomie.

este marcat în HTML astfel:

Textul cu caractere italice este închis cu o etichetă italică de deschidere și una de închidere. În LaTeX, textul va fi marcat astfel:

Majoritatea limbajelor de marcare pot fi editate cu orice editor de text, fără a avea nevoie de software special. Multe limbi de marcare pot fi, de asemenea, editate cu software special conceput pentru a automatiza unele funcții sau pentru a prezenta ieșirea în format WYSIWYG.

                                     

4. Fișiere document formatate

De la invenția MacWrite, primul procesor de texte WYSIWYG, în care tipograful codează formatarea vizual, mai degrabă decât prin introducerea de marcare textuală, procesoarele de text au avut tendința de a salva în fișiere binare. Deschiderea unor astfel de fișiere cu un editor de text relevă textul înfrumusețat cu diverse caractere binare, fie în jurul zonelor formatate de exemplu, în WordPerfect, fie separat, la începutul sau la sfârșitul fișierului de exemplu, în Microsoft Word.

Documentele text formatate în fișiere binare prezintă, de asemenea, dezavantaje. În timp ce gradul de formatare este marcat cu precizie prin limbile de marcare, formatarea WYSIWYG se bazează pe memorie, adică, de exemplu, prin păstrarea butonului pentru caractere aldine apăsat până la terminarea pasajului de text. Acest lucru poate duce la erori de formatare și probleme de întreținere. De asemenea, formatele de fișiere de documente text formatate tind să fie proprietare și nedocumentate, ceea ce duce la dificultăți în compatibilitatea codificării de către terți și, de asemenea, la actualizări inutile din cauza modificărilor versiunii.

WordStar a fost un procesor de texte popular care nu a folosit fișiere binare cu caractere ascunse.

OpenOffice.org Writer salvează fișierele în format XML. Cu toate acestea, fișierul rezultat este unul binar, deoarece este comprimat.

PDF este un alt format de fișier text formatat, care este de obicei binar folosind compresia pentru text și stocarea de grafice și fonturi în mod binar. Este, în general, un format pentru utilizatorii finali, scris dintr-o aplicație precum Microsoft Word sau OpenOffice.org Writer, și nu poate fi modificat de către utilizator odată finalizat.



                                     
  • pagină sau formatare eventual și tipărire de orice tip de material destinat tipăririi. Procesoarele de text descind din primele unelte de formatare de așezare
  • PowerPoint RTF - fișier cu text formatat de complexitate medie swf - fisier complex conținând cod binar TXT - fișier cu text simplu, pur, neformatat
  • utilizat format pentru procesare de text Este un tip de fișier binar, care pe lângă textul propriu - zis stochează și datele legate de formatarea acestuia
  • complexă. Spre deosebire de procesoarele de texte un editor de text nu oferă funcțiile complexe de exemplu formatarea paginilor specifice creării asistate
  • și audio, se mai poate folosi la intrare și un stream suplimentar de tip text așa ca la un televizor care decodifică nu numai imaginea cu sunet, dar și
  • text paragraf - metodă de adăugare a unei cantități mare text care poate fi ușor formatat barcode - unealtă care permite integrarea codurilor de bară
  • Textul cunoscut Well - known text - WKT este un limbaj de marcare pentru reprezentarea obiectelor geometrice de tip vector pe o hartă Un echivalent binar
  • docx OpenDocument odt Outlook Express Mail eml Rich Text Format rtf Text txt, text astfel că este capabil să lucreze cu aproape toate tipurile
  • Layer I MP1 CELP, HVXC, TwinVQ, Text - To - Speech Interface și Structured Audio Orchestra Language SAOL Un alt format mai puțin folosit este Apple Lossless
  • de text inclus în sistemul de operare Windows de la Microsoft, începând din 1985, cu Windows 1.0. Are puține funcții pentru formatarea textului fiind
  • un format definit de către Unicode Consortium pentru codarea, stocarea și interpretarea textelor pe suporturi informatice. Unicode este formatul standard