Digitalització de textos (Els alfabets del món)
Els alfabets del món:
Comunicació:
Donar a conèixer a uns altres les meves:
-Emocions.
-Sentiments.
-Formes de pensar.
-Situació en la qual em trobo...
A través de certs símbols, signes i paraules que permetin donar-me a entendre amb les altres persones que m'envolten.
Principis:
Comunicació gestual gestos o símbols fets amb el mateix cos.
Comunicació gestual:
Gestos o símbols fets amb el mateix cos més sons simples.
Després:
Comunicació gestual:
Gestos o símbols fets amb el mateix cos més sons complexos.
Després:
Comunicació gestual:
Gestos o símbols fets amb el mateix cos més sons més complexos
Plasmació de senyals, símbols, signes usats en la comunicació oral en paret o pedres.
Per què?
Simplement per necessitat (donar-le a entendre als altres el que volia una persona).
Com ho fan?
Recursos humans gràfics a mà:
Un pal, una pedra, els dits, les ungles, un tros d'ós de l'últim animal caçat.
Lent refinament de les demandes i necessitats:
El món està explicat per la màgia. (Necessitat i màgia)
Art rupestre
Després:
Necessitat i comunicació: primers signes d'escriptura.
Escriptura
Forma de donal-li un signe o símbol al llenguatge parlat.
Paraules: imiten sons de la naturalessa expressions d'aquesta.
Llenguatges: a partir dels sons que acompanyen els gestos fets per comunicar-se.
Establiment de codis consensuats per poder completar el procès comunicatiu:
Emisor - Canal - Codi - Missatge - Receptor
Alfabet
Agrupació de símbols amb un orde determinat utilitzat en el llenguatge escrit que serveix com sistema de comunicació.
Dreriva del nom les dues lletres greges 'alfa' i 'beta'.Els alfabets del món:
A) Escriptura conceptual:
A través d'icones o representacions gràfiques expressa idees o paraules.
Pictograma:
Representació icònica que pot ser realista o bé una idealització
Exempres: jerogrific egipci, hitita jeroglífic
Escriptura cuneiforme:
Amb un punxó es feien pictogrames deformant la pedra.
Exeple: sumeri.
Ideograma:
Element gràfic que representa paraules.
Exemple: escriptura xinesa
B)Escriptura lingüística
a través de signes expressa sons.
Escriptura sil·làbica:
Cada paraula está representada per signes que la comonen.
Exemples: Lineal B, sil·labari xipriota, i el japonés
Escriptura alfabètica:
Cada signe representa un fonema.
Exemples: fenici, grec, llatí, alfabèt fonetic internacional
No són escriptures perfectes, per exemple el català:
· ss, sc, ç representen /s/
· h no representa cap so
· qu representa /k/ o /kw/.
Origen de l'escriptura
En llocs independents del món neix independentment a diverses civilitzacions probablement a partir de pictogrames. Té com a primer ús la comptabilitat. Els testimones més antincs són les taules mesopotàmiques.
Hi ha investigadors que defensen la influència mesopotàmica sobre l'escriptura egípcia i la xinesa.
Mesopotàmia
Escriptura sumèria
A partir del 3300 ae, a Sumer s'escriuen taules s'argila amb un sistema semipictogràfic que cap añ 2500 ae, esdevé escriptura cuneïforme.
La llengua sumèriia, poc coneguda, és de tipus aglutinant (ni indoeuropea ni semítica).
Orientació de l'escriptura: per columnes (d'esquerra a dreta) i de dal a baix.
Orient mitjà i àsia menor
Adaptaran la tècnica cuneiforme els pobles de l'Orient Mitjà i l'Àsia Menor:
Acadis, elemites, assitis, babilònics, hurrites, hitites.
Cap al 500 ae els perses empren un nou sistema cuneiforme, de tipus sil·làbic.
Egipte: sistema jerogrlífic
Des del 3000 ae fins al 400, a egipte s'empra el sistema jeroglífic (6.000 pictogrames), a partir del qual es desenvolupen dues escriptures cursives:
- demòtica
cap al 650 ae, més simplificada i per usos administratius i econòmicas
- hieràtica
gairebé tan antiga com la jerogrlífica, reservada des de l'aparició de la demòtica a la religió.
Orientació de l'escriptura: dreta/esquerra, esquerra/dreta (bustrofedó)
Xina
Escriptura logogràfica:
Els primers caràcters de l'escriptura xinesa (4.500 signes) ja apareixen a la dinastia Shang (1400ae). Des de la reforma de la dinastia Quin (s.III ae) fins al s.XX, quan hi ha una darrera simplificació i s'introdueix l'àlfabet llatí (anys 1950), els caràcters xinessos augmenten fins a 50.000, 1.500 dels quals són apressos a l'escola bàsica. L'origen pictogràfic d'alguns signes és evident, però l'escriptura xinesa ha esdevingut sobretot semanticofonètica(logogrames)
Des del s.V, existeixen cassos d'escriptura sil·làbica, el més reixit dels quals va ser el fanchi'eh (62 signes), començaments del segle XX.
Japó
A partir dels hanzi o carácters xinesos, els japonesos comencen a adaptar (s.v de), poc sistemàticament i amb valor fonètic, els seus kanki (5.000 signes, dels quals s'aprenen uns 1.800 a l'escola).
Fins al segle IX no es desenvolupen els dos sil·labaris principals:
Per a la llengua oficial, el katakana o kana (47 signes derivats del k'ai-shi o escriptura xinesa, que ajuden a pronunciar el kanji);
Per a l'escriptura corrent, el hiragana (més de 300 signes, derivats del ts'ao-shu o cursiva xinesa). Actualment, al Japó s'empra una escriptura mixta i sovint complicada amb kanji i kana (mots estrangers), hiragana (literatura, premsa, carrer) i romaji (alfabet llatí).
Amèrica Central
Els sistemes d'escriptura més complets d'amèrica precolombina (els indis americans feien pictogrames i els inques, "quipus" o nusas) són:
- L'asteca (Mèxic centra)
- El maia (Mèxic meridional, Guatemala, Hondures, El Salvador).
Tots dos sistemes combinen elements fonogràfics o logogràfics, fet ben evivent després del desxiframent gairebé total (85%) dels signes maies.
Els primers testimonatges d'escriptura contreamericans són:
Creta
Escriptura jeroglífica i sil·làbica
A creta s'empra una escriptura jeroglífica que evoluciona cap a dues cursives:
-Lineal A (fins 1450 ae): encara no desxifrada, correspondria a la llengua minoica (no indoeuropea).
-Linal B (fins 1200 ae): derivada de la lineal A, correspon ja a una llengua grega (indeouropea). Més o menys desxifrada.
Totes dues són sil·làbiques, tot i que fan servir logogrames, s'escriuen sobre tauletes s'argila i el seu ús principal és la comptabilitat.
Escriptures alfabètiques
Les primeres escriptures alfabètiques registren llengües semítiques:
a) evolucionen a partir dels jeroglífics egipcis com les:
- inscripcions protosinaítiques
- protopalestines
b) o bé evolucionen de l'escriptura cuneïforme, com l'alfabet d'ugarit (Síria)
Alfabet fenicil'alifat fenici també registra una llengua semítica.
Inscripcions més antigues: daten del 1200 ae (sarcòfeg del rei Ahiram de Biblos), però les diferències són insignificants respeste a l'alfabet establert cap al 1000 ae a Biblos : 22 signes consonantics, orientats de dreta a esquerra.
Origen: el vinles culturals i comercials de Fenícia amb Egipte, així com l'escriptura semítica comuna de les server llengües, van permetre que l'alfabet fenici fos adaptat probablement de "l'escriptura egípcia"
Derivacions de l'alfabet fenici
Després del seu establiment, l'escriptura fenícia es va difondre pel Mediterrani, per l'orient Pròxim i mitjà i va arribar fins a l'índia, de manera que presenta les següents subdivisions:
- Branca Fenícia
- Branca Palestina
- Branca Aramea
- Àrab meridional
Alfabet grec
La primera inscripció coneguda és del segle VIII ae, però hi ha especialistes que avancen l'adopció cap al 1000 ae.
El préstec s'hauria fet a diversos llocs del món grec i evoluciona amb el temps.
Així:
Grec clàssic amb 24 lletres i una orientació esquerra / dreta
Grec arcaic variable i l'orientació té la forma de bustrofedó.
Inovacions pròpies del grec:
-l'anotació de vocals
-l'alfegiment d'algunes consonants inexistents en les llengües semítiques
Destacar:
a) Aportació de vocals fonamentals:
fa posible transcripció fonètica satisfactòria de les llengües europees
Primeres vocals:
Alfa, Espsilón, Iota, Omicrón, Ypsilón.
b) Periode clàssic:
Les lletres
Digamma, San, Qoppa, Sampi desapareixen, i per això no tenim les seves minuscules.
Derivacions de l'alfabet grec
L'alfabet grec participarà en el procés de formació de diverses escriptures:
A L'ÈPOCA ANTIGA:
-Llengües no hel·leniques d'Àsia Menor (cari, lici, lidi)
-Les escriptures itàliques (etrusc)
-El copte (egipci i nubi)
A L'ÈPOCA MEDIEVAL:
- El gòtic
- L'eslau (ciríl·lic).
Alfabet llatí
L’alfabet llatí és una més de les nombrosses escriptures locals que les etrusca i les itàlics prenen, més o menys directament, d’alfabets grecs occidentals
En el cas de roma es tracta probablement d’una adaptació etrusca de l’escriptura d’eubea
Els primers testimonis llatins daten del segle VI ae
-L’alfabet clàssic S.I ae el contitueixen definitivament 23 lletres amb orientació inicial bustròfedica i posteriorment ss. VI-IV ae d’esquerra a dreta
-Després d’una larga evolució l’escritura latina ha esdevingut una de les mes universals
A destacar: en principi 21 lletres
Nous sons CH PH RH TH
ALFABET ARAMEU
-Els amargues son un doble semític establert a Síria, on van esdevenir mercenaris i comerciants
-L’escriptura aramea, adoptada de la fenícia (segle X ae) va ser oficial durant més d’un mil·leni a diversos imperis( babilònics tardà, assiri, persa) i la seva lengua és també bíblica
-Té 22 consonants i orientació dreta/esquerra.
ALFABET ALIFABET HEBREU
-Té dues formes diferents:
-La més antiga deriva de l’escriptura fenícia (S.IX) s’anomena hebreu quadrat i és emprada actualment a Israel: Té 22 consonants i alguns signes complementaris per a les vocals
-L’orientació és dreta/esquerra
ALFABET ÀRAB
-Els àrabs es contitueixen com a poble entre els segles IX-VII ae, però no tenen un regne fins al segle I ae (nabateus)
-L’escriptura àrab deriva proablement de l’alfabet arameu-nabateu (500ae), que evolucionarà cap als dos tipus principals del període islàmic (S. VII):
Cúfic (monumental)
Naskhi (cursiva)
*Té 28 consonants, signes vocàlics i orientació dreta/esquerra.
*ha estat un afabet adoptat a Àsia, Àfrica i Europa per pobles no semítics ( persa, afganés, malasi, bantús)
A destacar:
-No transcripció de vocals curtes
-No hi ha majúscules
-No permet divisió a final de la línea
-Consonants dobles (tashdiid)
-Cal·ligrafia àrab: art en si mateixes
INDIA
-Existeix una escritura protoíndica (2500 ae), corresponent a la civilización de Harappa i Mohenjodaro (vall de l’indo)
-Té uns 250 signes sense desxifrar encara (podría registrar una llengua dravítica)
-Les escriptures modernes deriven de l’alfabet arameu.
-La harosti
-La brahmi, que té 32 signes consonantics i 4 vocalics orientats d’esquerra a dreta i una gran varietant d’escriptura locals a l’india i Àsia central i Tibet entre los quals sobresurt
Alfabets eslaus
-El primer alfabet eslau va ser una creació original de ciril·li SIX, com a eina per a l’evagenlització dels pobles eslaus:
-són els 40 signes glagolitics
-Més recent ésl’alfabet ciil:·lic SX incertament atributiu a Ciril
-Té 43 signes que dereiven de lletres gregues (24) glagolitiques i d’altres signes
-A partir del 1050 ( separació de l’esglesia romana i ortodoxa) els pobles eslaus han de triar entre l’alfabet ciril:lic i e llatí
-Abans d’arribar als 30 signes actuals, l’alfabet rus va simplificar dos cops S.XVIII i S.XX l’alfabet ciril·lic.
Escriptura germanica
-El futhark o alfabet rúnic S.XVII és una creació pròpia dels pobles germànics, amb aportacions de l’alfabet llatí
-Tenia entre 16 i 24 signes ab forma lineal orientats de manera variable (dreta, esquerra, capgirats)
L’etapa més rica és la de les runes escandinaves S.VIII-XI
Caràcters rúnics:
-Associats a qüestions màgiques i mistiques
-Les runes transmetren un missatge secret
-Cada signe té la seva qualitat
-Els mestres de les gaudeixen de prestigi ( saben gravar-les)
Alfabet Iberic
-A partir dels segles VI-V ae es van fer servir a la península ibérica diverssos alfabets
-El fenici
-El grec jònic
-L’escriptura tartesso-iberica S.IV ae que - emprava un sistema mixt, sil·làbic i alfabètic, de 27 signes
-Orientació dual (dreta-esquerra al sud, esquerra/dreta al nord-est)
-Petites variants variants fon`tiques (diferenciació entre oclusives sordes i sonores al nord-est
Les inscripcions ibériques actualment es poden llegir malgrat que no coneixem totalment el significat dels mots ni l’origen de la llengua ibérica
Nous alfabets:
-Amb els pas dels segles no han deixat d’apareixer nous alfabets codis de signes i sistemes d’expresions escrits o visual
-La taquigrafia
-El telegraf
-L’escriptura per a cecs
-L’IPA o alfabet foetic internacional
-El llenguatge de concordança mundial, l’esperento (llengua auxiliar planificada) Zamennhof 1887
-El codi de signes per a sords
-Els senyals de transit, etc
-Els elements amb els quals produim o fixem l’escriptura també han evolucionat radicalment
-La imprenta (XIna, S.VII gutenberg 1440)
-La maquina d’escriure
-El procesador electrònic de textos 1940
Frases del procés de tractament de textes:
Originals de textes
Idea, redactor, transcripció paper o digital, correcció, correcció de text, fotocomposició, pdf baixa resolució, correcció ortografia, correcció de maquetació, pdf alta resolució, filmació (fotolit / planxa), impressió.
Idea, redactor, transcripció paper o digital, correcció, correcció de text, fotocomposició, pdf baixa resolució, correcció ortografia, correcció de maquetació, pdf alta resolució, filmació (fotolit / planxa), impressió.
1. Composició manual.
2. Metall fos.
3. Fotocomposició.
4. Tipografia digital / autoedició.
Manuscrits:
-Escrits a mà.
-No Molt usuals en l'actualitat. Dificultats i costos en el canvi de format.
-Escrits a mà.
-No Molt usuals en l'actualitat. Dificultats i costos en el canvi de format.
Mecanografiats:
En desús. En aquest cas, l'original es presenta mecanografiat.
Presentació habitual d'originals de text fins fa pocs anys en la actualitat s'ha vist relegat per la irrupció de la informàtica i les seves múltiples avantatges.
Amb tot, encara hi ha tutors aferrats a questa forma de...?
Amb tot, encara hi ha tutors aferrats a questa forma de...?
Impresos:
Aquells originals que ja han estat impressos en una anterior ocasió però dels que no es disposa de còpia digital. Aquest és el ca habitual en obres de domini public o en obres publicades en altres païssos de mateixa manera.
Digitalitzats:
Aquells originals elaborats amb un equip informàtic
Ofereixen múltiples avantatges sobre la resta d'originals
Grau diferent d'acabat:
-originals Digitalitzats sense compondre.
-originals Digitalitzats mitjà compostos.
-originals Digitalitzats compostos.
Grau diferent d'acabat:
-originals Digitalitzats sense compondre.
-originals Digitalitzats mitjà compostos.
-originals Digitalitzats compostos.
Originals digitalitzats sense compondre:
-El Autor es limita a picar el text (sense cursiva, etc.).
-Les Idees flueixen lliurement.
Originals mig compostos:
-El Autor lliura una proposta de composició però no la final.
-Idees Exposades per l'autor amb la tecnologia informàtica.
Originals digitalitzas compostos:
-Tractat Per l'autor, imprès. Coneixements de composició, contingut i forma.
Estalvia treball en la fase pre-impressió.
Preparació d'originals:
Especificacions d'entrega originals no digitalitzats:
-Les especificacions són un conjunt de normes bàsiques que serveixen de guia perquè l'autor lliuri el seu treball.
-L'ús ha propiciat una unificació d'aquestes normes comunes per a les empreses.
Important tenir una còpia del treball original, es lliura la còpia i l'autor de queda l'original.
Especificacions d'entrega d'originals de manuscrits:
-Presentarlos escrits per una sola cara. Escriptura neta, sense ratlles, marge, separació per facilitar la feina.
-Formats de paper normalitzats. DIN A4 (recomanat). Paper blanc, pàgs numerades, si l'autor vol fer alguna correcció d'usar un altre color.
-El Autor lliura una proposta de composició però no la final.
-Idees Exposades per l'autor amb la tecnologia informàtica.
Originals digitalitzas compostos:
-Tractat Per l'autor, imprès. Coneixements de composició, contingut i forma.
Estalvia treball en la fase pre-impressió.
Preparació d'originals:
Especificacions d'entrega originals no digitalitzats:
-Les especificacions són un conjunt de normes bàsiques que serveixen de guia perquè l'autor lliuri el seu treball.
-L'ús ha propiciat una unificació d'aquestes normes comunes per a les empreses.
Important tenir una còpia del treball original, es lliura la còpia i l'autor de queda l'original.
Especificacions d'entrega d'originals de manuscrits:
-Presentarlos escrits per una sola cara. Escriptura neta, sense ratlles, marge, separació per facilitar la feina.
-Formats de paper normalitzats. DIN A4 (recomanat). Paper blanc, pàgs numerades, si l'autor vol fer alguna correcció d'usar un altre color.
Especificacions d'originals no digitalitzats:
Entregat d'originals parlats
Entregat d'originals parlats
-Presentats En una K7, digital, mp3, flv ... Dicció clara i entenedora.
Especificacions d'entrega mecanografiats:
-Per Una sola cara, DIN A4 (21cm x 29,7cm).
-El blanc del marge a de ser ampli (2 cm) i han de ser més grans de cap a peu.
-Interlineal (doble espai)
-Nombre de pàgines a la capçalera i a la dreta.
S'ha d'aplicar una sagnia d'un tabulador a la primera línia de cada paràgraf.
El text es presentarà sense justificar, marginat a l'esquerra.
L'autor no ha d'incloure correccions en l'original. OCR (reconeixement òptic de caràcter).
L'original ha de presentar-se sense ratlles i amb el grafisme ben contrastat, per facilitar la digitalització.
Orginals d'impressió:
-Bon contrast entre color del text i el fons, sense traspàs de tinta ni transparències que entorpeixin la digitalització.
-Algunes fonts donen problemes, fer una prova prèvia. Es comprova que l'original s'adapti a l'escàner, que el llibre s'obri completament i que el format sigui més petit que l'àrea d'escaneig.
Especificacions d'entrega d'originals digitalitzats
-Les Especificacions són un conjunt de normes bàsiques que serveixen de guia a l'autor per lliurar el seu treball, l'empresa tractarà el treball posteriorment.
-L'ús ha propiciat una unificació d'aquestes normes, de manera que molts d'elles són comunes per a totes les empreses implicades.
(Si els textos tenen sagnat, negreta, cursiva ...)
Especificacions relatives a aplicacions i formats:
Copia por una sola cara:
-Nombre De pàgines de l'última versió lliurada.
-Llistat D'arxius amb l'extensió corresponent.
Aplicació amb què s'ha creat.
-La Seva versió.
-Entorn Operatiu.
Aplicacions més comuns:
-Editor De textos (TextEdit)
-Editor De textos professional, Word, WordPerfect.
-Per A la manipulació Quarkxpress, Pagemaker.
-Ventura Publisher, Indesign. L'autor ha de consultar prèviament amb el pre-impressor.
-És recomanable que es guardi el treball com a arxiu independent.
-S'ha de tenir en compte l'ordre de la feina / arxius. Enumerar-(zeros i desenes).
Especificacions relatives al text
-DIN A4, espai, marge, interlineat.
-Blanc del marge 2 cm, més grans els marges de cap a peu.
-Doble espai (interlineal).
-Núm. pàg al peu i a la dreta.
Formats de paper:
DIN A1 = 84 x 59,4
DIN A2 = 59,4 x 42
DIN A3 = 42 x 29,7
DIN A4 = 29,7 x 21
DIN A5 = 21 x 14,8
DIN A6 = 14,8 x 10,5
DIN A7 = 10,5 x 7,4
Són preferibles originals sense compondre, tret que l'autor vulgui compondre-.
El text es presentarà alineat a l'esquerra, sense justificar i sense partició de paraules.
NO forçar el canvi de línia ni de pàgina.
Utilitza un sol tipus de lletra, la més estàndard, un sol cos i un sol estil.
Les notes s'han d'incloure en el lloc que aniran ubicades, separades del text general per guions llargs.
Quadres i taules, s'han de compondre en un document a part i adjuntar-les com arxius independents.
S'ha d'aplicar sagnat de tabulació en la 1a línia de cada paràgraf.
Els paràgrafs NO s'han de separar entre si per línies en blanc.
Equips i aplicacions informàtiques aplicades en el procès:
Perifèrics d'entrada:
-Escáner, Disposar d'OCR (reconeixement òptic de caràcters), que permet la digitalització dels originals impresos però del que es disposa d'un arxiu digital.
-Connexió externa i interna. Un fax complementa l'enviament dels originals a través de xarxes telemàtiques.
Equips d'àudio si el treball és parlat.
Ordenadores IBM(PC) Macintosh (MAC)
Compatibles:
Fonts: Tots els ordinadors incorporen una selecció per defecte de les principals fonts i que es puguin adquirir o llogar externament.
Aplicacions ID InDesing
Prepara originals digitals i els formats en què permeten guardar els documents més comuns.
WordPad (PC WINDOWS)
TextEdit (MAC)
MicrosoftWord
super index = exponent
Formats digitals d'arxius de texte:
Formats oberts:
-ASCII: No conté informació de tipografia o disseny. (American Standard Code for Information Interchange)
-RTF: Conté informació de tipografia o disseny molt bàsica. (Rich Text Format)
Formats específics
Processador de textos (InDesign). Conté tota la informació de tipografia o disseny. Permeten exportar en EPS PostScript.
Tipografia:
PostScript: 2 arxius. 1ª per a la tipografia i 2n per imprimir.
TrueType: 1 arxiu
OpenType: Tipografia oberta.
Nucleo formatiu 2 Digitalització d'originals:
-Es procedeix a la digitalització de la còpia de l'original ajustant el format o format específic i en el temps previst.
Procedimiento general
-Instalados i operatives les aplicacions.
-Entorn de treball adequat.
-Es posa la còpia de l'original en un faristol.
-En el cas dels originals d'àudio es necessita un equip de reproducció corresponent.
-Es obre l'aplicació.
-Es genera un document de treball, nom adequat
Originals no digitalitzats manuscrits:
-Lectura Atenta per evitar una mala interpretació. És important que el teclista tingui contacte directe amb l'autor per si ha d'aclarir dubtes. Seria millor que l'autor llegiu la declaració i el teclista escriviu.
Parlats
1º es pica el text sense realitzar la interpretació de l'original per no badar.
Estableciments dels paràmetres tipogràfics:
-Es realitza una vegada que s'ha digitalitzat el text original i s'han còpies impreses sense compaginar.
-Després de fer la correcció de galerades, on s'introdueixen les modificacions que s'estimin oportunes en relació amb el contingut, els estils i els errors gramaticals i ortogràfics.
-Això es fa amb l'autor al costat dels correctors corresponent.
-Aquestes especificacions han d'aparèixer en un lloc lògic i visible.
-1ª pàg. de la còpia en la capçalera i un annex del treball unit a això.
Optimizatció de recursos
El OCR reconeix automàticament símbols o caràcters que pertanyen a un determinat alfabet.
Segueix uns patrons o plantilles.
El dispositiu que obté la imatge pot introduir nivells de grisos que en realitat no pertanyen a la imatge original afectant els píxels que han de ser processats.
La resolució d'aquest dispositiu pot introduir soroll a la imatge.
La separació de caràcters, com no hi ha un espai fix, es produeixen errors en l'hora del reconeixement.
La connexió de dos o més caràcters per píxels comuns també produeixen errors.
1 Binarització:
La major part d'algoritmes de OCR parteixen com a base d'una imatge binària (dos colors). Per tant és convenient convertir una imatge d'escala de grisos, o una de color, en una imatge en blanc i negre, de tal manera que es preservin les propietats essencials de la imatge. Una manera de fer-ho és mitjançant l'histograma de la imatge, on es mostra el nombre de píxels per a cada nivell de grisos que apareix a la imatge. Per binarizarla hem d'escollir un llindar adequat, a partir del qual tots els píxels que no els superen es convertiran en negre i la resta en blanc.
2 Fragmentació:
Procés més costós però necessari per al posterior reconeixement de caràcters.
La segmentació d'una imatge implica la detecció mitjançant processaments d'etiquetatge determinista o estocàstic (no hi ha ordre determinat) dels contorns o regions de la imatge basant-se en la informació d'intensitat o informació espacial.
Permet la descomposició d'un text en diferents entitats lògiques que han de ser invariables per ser independents de l'escriptori i significatives pel seu reconeixement.
No existeix un mètode genèric per dur a terme aquesta segmentació de la imatge que sigui eficaç.
Projeccions lineals- tècniques més utilitzades.
3 Simplificació dels components:
Un cop aïllats els components connexos de la imatge, ha d'aplicar un procés de simplificació.
Esborra successivament els punts dels contorns de cada component de manera que es preservi la seva tipologia.
L'eliminació dels punts ha de seguir un esquema d'escombrats successius. El escombrat es fa en paral·lel, assenyala els píxels esborrables per eliminar tots alhora.
Classificació i reconeixement.
4 Comparació de patrons:
Es comparen els caràcters obtinguts amb patrons emmagatzemats en una base de dades.
Mètodes: mètode de projecció vertical i horitzontal.
Altres mètodes: geomètrics o estadístics, estructurals, neuro-mimètics, markovians.
Comentarios
Publicar un comentario