Pattern modelling and pattern processing in image and speech signals
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2099.1/15904
Tipus de documentProjecte/Treball Final de Carrera
Data2012-07-24
Condicions d'accésAccés obert
Llevat que s'hi indiqui el contrari, els
continguts d'aquesta obra estan subjectes a la llicència de Creative Commons
:
Reconeixement-NoComercial-SenseObraDerivada 3.0 Espanya
Abstract
[ANGLÈS] In the context of signal processing, the aim of this memoir is to explore the pattern theory (PT) of Grenander and Mumford by focussing on two proof-of-concept applications, one dealing with images and the other with voice. The image application not only classifies the symmetry type of mosaics given a digital picture, but also can generate mosaic images with virtually any pattern decoration. The voice application classifies the phonemes in a digital voice recording and also can generate virtually unlimited variations on its pronunciation. These applications illustrate, in ways that are described in detail in the memoir, some of the key advantages of PT over and beyond the more familiar approaches known as pattern recognition and pattern classification. One important advantage is a sort of "division of labor": the construction of pattern models, which takes into account the data and is eminently theoretical, is separate from the pattern processing work (implementation, algorithms, programs). A second advantage is that pattern analysis (recognition, classification) and pattern synthesis (generating random instances that "look and feel" just as the world signals being modeled) become two sides of the same coin, in the sense that the same approach provides both. Actually, analysis is done via synthesis, because the inspiration for the proposed models comes from the data and recognition is resolved by using suitable plausibility rules in order to find the best pattern parameters fitting the data. Another advantage of the approach is its resilience in front of noisy and ambiguous samples. Finally, it is important to remark that pattern models can often be reused on data that are totally unrelated to the data that led to those models. [CASTELLÀ] En el contexto del procesamiento de la señal, el objetivo de esta memoria es la de explorar la teoría de patrones (PT) de Grenander y Mumford, centrándose en dos aplicaciones, uno relativa a las imágenes y la otra a la voz. La aplicación de imagen no sólo clasifica el tipo de simetría de los mosaicos dada una imagen digital, sino también puede generar imágenes de mosaico con prácticamente cualquier decoración. La aplicación clasifica los fonemas de voz de una grabación digital de voz y también puede generar variaciones prácticamente ilimitadas en su pronunciación. Estas aplicaciones ilustran, de manera que se describen en detalle en la memoria, algunas de las principales ventajas de más de PT sobre enfoques más conocidos conocidos como reconocimiento de patrones y clasificación de patrones. Una ventaja importante es una especie de "división del trabajo": la construcción de modelos de patrones, que tenga en cuenta los datos y es de carácter eminentemente teórico, es independiente de la labor de procesamiento de patrones (de aplicación, algoritmos, programas). Una segunda ventaja es que la síntesis de patrones (reconocimiento, clasificación) y el análisis (la generación de instancias aleatorias que parecen al igual que las señales del mundo que se está modelando) se vuelven dos caras de una misma moneda, en el sentido de que el mismo enfoque se utiliza en las dos. En realidad, el análisis se realiza a través de la síntesis, porque la inspiración de los modelos propuestos proviene de los datos y el reconocimiento se resuelve mediante el uso de normas adecuadas de verosimilitud con el fin de encontrar los mejores parámetros de patrón de ajuste de los datos. Otra ventaja del método es su resistencia frente a las muestras ruidosas y ambiguas. Por último, es importante destacar que los modelos de patrones a menudo pueden ser reutilizados en los datos que son totalmente ajenos a los datos que condujeron a esos modelos. [CATALÀ] Dins del context del processament de senyal, l'objectiu d'aquesta memòria és explorar la teoria de patrons (PT) de Grenander i Mumford centrant-nos en aplicar-la a dos aplicacions, una de veu i una d'imatge. L'aplicació d'imatge no només classifica els tipus de simetries d'un mosaic donat en una imatge digital, sinó també pot generar mosaics amb virtualment qualsevol tipus de patró de decoració. L'aplicació de veu classifica els fonemes d'una veu registrada i també les genera. Aquestes aplicacions il·lustren, d'una forma que està descrita en detall a la memòria, alguns dels avantatges de la PT sobre alguns termes més usuals com reconeixement de patrons i classificació de patrons. Un important avantatge és una espècie de "divisió del treball": la construcció de models de patrons, que tingui en compte les dades i és de caràcter eminentment teòric, és independent de la tasca de processament de patrons (d'aplicació, algorismes, programes). Un segon avantatge és que la síntesi d'anàlisi de patrons (reconeixement, classificació) i l'anàlisi (la generació d'instàncies aleatòries que es comportin i semblin igual que els senyals del món que s'està modelant) es tornen les dues cares d'una mateixa moneda, en el sentit que el mateix enfocament es pot aplicar als dos. En realitat, l'anàlisi es realitza a través de la síntesi, perquè la inspiració dels models proposats prové de les dades i el reconeixement es resol mitjançant l'ús de normes adequades de versemblança per tal de trobar els millors paràmetres de patró d'ajust de les dades. Un altre avantatge del mètode és la seva resistència enfront de les mostres sorolloses i ambigües. Finalment, és important fer notar que els models de patrons sovint poden ser reutilitzats en les dades que són totalment sense relació amb les dades que va portar a aquests models.
Descripció
Aplicar teoria de patrons a senyals de veu i imatge.
MatèriesAutomatic speech recognition, Optical pattern recognition, Image processing--Digital techniques, Reconeixement automàtic de la parla, Reconeixement òptic de formes, Imatges--Processament--Tècniques digitals
TitulacióENGINYERIA DE TELECOMUNICACIÓ (Pla 1992)
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
PFC-etsetb.pdf | 4,615Mb | Visualitza/Obre |