Processament i reconeixement d'imatges de text amb tècniques d'Àlgebra Lineal
Tipus de documentProjecte/Treball Final de Carrera
Data2012-09
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-SenseObraDerivada 3.0 Espanya
Abstract
Aquest projecte té com a objectiu comprovar la viabilitat d'una eina matemàtica, com els
valors singulars (SVD), al reconeixement de caràcters (OCR). La implementació i execució
de l'algoritme es realitzarà amb el programa informàtic MATLAB.
Aquest procediment pot tenir un potencial per extreure informació d'imatges, quan es tracta
d'identificar elements en un catàleg limitat de possibles formes (lletres, molècules...) Així
aquesta tècnica es pot esperar que tingui aplicacions al reconeixement de molècules i
enllaços d'imatges de microscòpia. Tot i que aquest projecte basarà el contingut principal en
l'estudi i identificació de caràcters de l'alfabet, ja que és el cas més senzill.
Per tal d'obtenir resultats amb prous garanties s'han realitzat quatre mostres amb diferents
característiques que sumen un total de 40.000 caràcters aproximadament. Aquestes
mostres es realitzen amb diferents variacions: idiomes, resolucions i tipologia de lletra.
El mètode ha funcionat satisfactòriament amb resolucions bones i, d'un alfabet que procedia
de la mateixa font, s'ha obtingut uns resultats d'un 85% aprox. de precisió. Quan la font ha
estat comparada amb un catàleg de fonts i de resolucions diferents, l'èxit ha disminuït
radicalment fins a obtenir resultats del 20%. Finalment, s'ha realitzat una mostra només
modificant la resolució i s'ha pogut comprovar que, a baixes resolucions varien la forma de
les lletres i no donen bons resultats. Per tant, aquesta metodologia funciona amb èxit quan
les lletres que es comparen són semblants a les del catàleg.
Aquest software no està preparat per competir amb OCR comercials però permet
desenvolupar ràpidament un reconeixement de caràcters per qualsevol sistema. Podria tenir
una millor aplicació per a distingir fonts o resolucions diferents.
Per tal de millorar el sistema es recomana realitzar un catàleg que tingui en compte diverses
fonts amb diferents resolucions. Que un mateix caràcter incorpori patrons amb més d'una
resolució i tipologia de lletra, i amb l'ajut d'algoritmes lògics s'obtingui un criteri de decisió
adient.
MatèriesImage processing -- Mathematics, Optical character recognition, Algorithms, Algebras, Linear, Imatges -- Processament -- Matemàtica, Reconeixement òptic de caràcters, Algorismes, Algebra lineal
TitulacióENGINYERIA QUÍMICA (Pla 2000)
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
Memoria_ok.pdf | Memòria | 6,479Mb | Visualitza/Obre | |
annex.pdf | Annex 1/2 | 2,233Mb | Visualitza/Obre | |
annex 2.pdf | Annex 2/2 | 134,9Kb | Visualitza/Obre |