Mapping physical stores using google street view

Document typeBachelor thesis
Date2020-06
Rights accessOpen Access
Abstract
Comprendre la informació textual en imatges d'escenes naturals té un paper crucial en camps
com la detecció de text i el reconeixement de text. Aquesta informació es pot utilitzar
àmpliament per automatitzar el que ara són treballs manuals com numerar i classificar
substantius i trobar una parella que concordi en una base de dades. El desenvolupament
d’aquestes tècniques de detecció i reconeixement és el que farà que aquests mètodes siguin cada
vegada més fiables.
La solidesa d'aquestes dues tasques s'implementarà i analitzarà per separat. Per a aquest
propòsit, caldrà una base de dades etiquetada feta per nosaltres on es duran a terme experiments
i mètriques, tant per a la detecció de text com un primer pas, on el sistema obté coordenades on
es detecta el text a la imatge, i per el reconeixement de text com a segon pas, on el sistema extreu
cadenes de paraules per a cada coordenada obtinguda prèviament.
Finalment, com aquest projecte té com a objectiu automatitzar la tasca esmentada, l'anotació i
l'aparellament, les cadenes extretes s'utilitzaran per localitzar la posició associada amb la
informació textual obtinguda, i descarregar a través de Google Street View una visió natural de
la geolocalització per comparar la correspondència amb la base de dades.
3 Comprender la información textual en imágenes de escenas naturales tiene un papel crucial en
campos como la detección de texto y el reconocimiento de texto. Esta información podría usarse
ampliamente para automatizar lo que ahora son trabajos manuales como anotar y clasificar
sustantivos y encontrar un emparejamiento que coincida en una base de datos. El desarrollo de
estas técnicas de detección y reconocimiento es lo que hará que estos métodos sean cada vez más
confiables.
La solidez de estas dos tareas se implementará y analizará por separado. Para ese propósito, será
necesario una base de datos etiquetada hecha por nosotros donde se llevarán a cabo
experimentos y métricas, tanto para la detección de texto como un primer paso, donde el
sistema obtiene coordenadas donde se detecta el texto en la imagen, y para el reconocimiento de
texto como segundo paso, donde el sistema extrae cadenas de palabras para cada coordenada
obtenida previamente.
Finalmente, como este proyecto tiene como objetivo automatizar la tarea mencionada, la
anotación y el emparejamiento, las cadenas extraídas se utilizarán para geolocalizar la posición
asociada con la información textual obtenida, y descargar a través de Google Street View una
vista natural de la geolocalización para comparar la correspondencia con la base de datos.
2 Understanding textual information in natural scenes images has a crucial role in fields like text
detection and text recognition. This information could be widely used to automatize what are
now manual jobs as annotating and classifying nouns and find a matching a pairing in a
database. The development of these detection and recognition techniques is what will make
these methods more reliable.
The robustness of these two tasks will be separately implemented and analyzed. For that
purpose, it will be necessary a labeled database made by ourselves where experiments and
metrics will be carried out, both for text detection as a first step, where the system obtains
coordinates where the text is detected in the image, and for text recognition as a second step,
where the system extracts word strings for each coordinate previously obtained.
Finally, as this project aims to automatize the mentioned task, annotating and pairing, the
extracted strings will be used to geolocate the position associated with the textual information
obtained, and download through Google Street View a natural view of the geolocalization to
compare the correspondence with the database.
1
Files | Description | Size | Format | View |
---|---|---|---|---|
Final Report Adria Gonzalez.pdf | 1,413Mb | View/Open |
All rights reserved. This work is protected by the corresponding intellectual and industrial
property rights. Without prejudice to any existing legal exemptions, reproduction, distribution, public
communication or transformation of this work are prohibited without permission of the copyright holder