Implementació d'un gestor en entorns de BigData

Also Curto, Joan Albert

dc.contributor	Fernández Muñoz, Marcel
dc.contributor.author	Also Curto, Joan Albert
dc.contributor.other	Universitat Politècnica de Catalunya. Departament d'Enginyeria Telemàtica
dc.date.accessioned	2015-06-16T14:13:19Z
dc.date.available	2015-06-16T14:13:19Z
dc.date.issued	2015-05
dc.identifier.uri	http://hdl.handle.net/2099.1/26232
dc.description	Implementacio d'un gestor en entorns de Big Data
dc.description.abstract	[ANGLÈS] Massive or big data consist in seeing and understanding the relationships between the source and the different pieces of information that, until recently, we struggled to fully grasp. One of the most important changes that the ICT is going through is the increase of capacity to generate, store and manage data. This is the increase in the numbers of sensors, which combine information (increased quantification), as well as the user involvement that have become active consumers, who are progressively becoming difficult to treat. Despite the capacity of computers and storage devices expand; these factors have brought into focus a new situation on the treatment of such data. And because of the volume of data generated and the speed with which they are created and must be processed, the range introduces a greater complexity in its treatment. Furthermore, the veracity, which is the ability to add value to an organization, is an essential variable of Big Data. Consequently, they come into play what is known as the 4 V's of Big Data: volume, velocity, variety and veracity. Hence, Big Data is an emerging sector within the area of information and communications technology and it deals with how to store and how to process the large amounts of information or data set. This paper presents a comprehensive study within the theoretical framework of the different tools, but it also shows a practical analysis of some of the existing solutions performed. Using Big Data tools like Cloudera, which is based on the Hadoop framework, it will be sought a one-way analysis of these data from storage to exploitation. The purpose of this is to obtain an extraction of information, so that the user can draw their own conclusions, i.e. the collection of reports.
dc.description.abstract	[CASTELLÀ] Los datos masivos o Big Data consisten en ver y comprender las relaciones en el origen y entre los distintos fragmentos de información que, hasta hace poco, nos esforzábamos por captar plenamente. Uno de los cambios más importantes por el que está pasando el ámbito de las TIC es el aumento de las capacidades de generar, guardar y gestionar los datos. Tanto por el aumento del número de sensores que aglutinan información - incremento de la cuantificación- así como por la participación del usuario convertido en consumidor activo, que hacen cada vez más difícil su tratamiento. A pesar de ampliar la capacidad de los ordenadores y los dispositivos de almacenamiento, estos factores han puesto sobre la mesa una nueva situación sobre el tratamiento de este tipo de datos. Además del volumen de datos generados y la velocidad con que estos son creados y se deben procesar, la variedad introduce mayor complejidad en su tratamiento. Asimismo, la veracidad, que es la capacidad para aportar valor a una organización, es una variable esencial del Big Data. Entran en juego, por tanto, lo que se conoce como las 4 v’s del Big Data: volumen, velocidad, variedad y veracidad. Así pues, Big Data es el sector emergente dentro del área de las tecnologías de la información y la comunicación, que se ocupa de cómo almacenar y tratar grandes cantidades de información o conjunto de datos. En este trabajo se realiza un estudio dentro del marco teórico de las distintas herramientas y un análisis práctico de alguna de las soluciones existentes. Utilizando herramientas Big Data como Cloudera, que está basada en el framework Hadoop, buscaremos una vía de análisis de estos datos, desde su almacenaje hasta su explotación. Todo esto con el objetivo de obtener una extracción de información de tal forma que el usuario pueda extraer sus propias conclusiones; esto es, la obtención de informes.
dc.description.abstract	[CATALÀ] Les dades massives o Big Data consisteixen en veure i comprendre les relacions en l’origen i entre diferents fragments d’informació que, fins fa molt poc, ens esforçàvem en captar de forma plena. Un dels canvis més importants pel qual està passant l’àmbit de les TIC és l'augment de la capacitat de generar, emmagatzemar i gestionar dades. Tant l’augment del nombre de sensors que recopilen informació, l’augment de la quantificació, així com la participació de l'usuari convertit en un consumidor proactiu fan, cada vegada més, dificultós el seu tractament. Malgrat l'ampliació constant de la capacitat dels ordinadors i els dispositius d'emmagatzematge, aquests factors han posat sobre la taula una nova situació pel que fa al tractament d’aquestes dades. A més del volum de dades generades i de la velocitat en què es creen i s'han de processar, la seva varietat introdueix encara més complexitat en el seu tractament. També la seva veracitat, la capacitat per aportar valor a l'organització, és una variable essencial del Big Data. Entren en joc el que es coneix com les 4 v del Big Data: volum, velocitat, varietat i veracitat. Així doncs, Big Data és el sector emergent dintre l’àrea de les tecnologies de la informació i la comunicació que s’ocupa de com emmagatzemar i tractar grans quantitats d’informació o conjunt de dades. En aquest treball es fa un estudi dintre el marc teòric de les diferents eines i un anàlisi pràctic d’alguna de les solucions existents. Fent-nos valer d’eines Big Data com Cloudera, que es basa en el framework Hadoop, buscarem una via d’anàlisi d’aquestes dades, des del seu emmagatzematge fins a la seva explotació. Tot això amb l’objectiu d’obtenir una extracció d’informació de tal forma que l’usuari pugui extreure les seves pròpies conclusions; això és, l’obtenció d’informes.
dc.language.iso	cat
dc.publisher	Universitat Politècnica de Catalunya
dc.rights	S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.subject	Àrees temàtiques de la UPC::Enginyeria de la telecomunicació
dc.subject	Àrees temàtiques de la UPC::Informàtica::Sistemes d'informació::Bases de dades
dc.subject.lcsh	Information storage and retrieval systems
dc.subject.lcsh	Big data
dc.subject.other	Hadoop
dc.subject.other	information
dc.subject.other	bases de datos
dc.subject.other	información
dc.subject.other	Bases de dades
dc.subject.other	Processament distribuït de dades
dc.title	Implementació d'un gestor en entorns de BigData
dc.title.alternative	Implementation of a Big Data environment manager
dc.title.alternative	Implementación de un gestor en entornos de BigData
dc.type	Master thesis (pre-Bologna period)
dc.subject.lemac	Informació -- Sistemes d'emmagatzematge i recuperació
dc.subject.lemac	Macrodades
dc.identifier.slug	ETSETB-230.107776
dc.rights.access	Open Access
dc.date.updated	2015-06-16T05:51:19Z
dc.audience.educationlevel	Estudis de primer/segon cicle
dc.audience.mediator	Escola Tècnica Superior d'Enginyeria de Telecomunicació de Barcelona
dc.audience.degree	ENGINYERIA DE TELECOMUNICACIÓ (Pla 1992)

Fitxers d'aquest items

Nom:: Implementació d'un gestor en ...
Mida:: 4,022Mb
Format:: application/zip

Visualitza/Obre

Aquest ítem apareix a les col·leccions següents

Enginyeria de Telecomunicació (Pla 1992) [1.590]

Mostra el registre d'ítem simple

UPCommons. Portal del coneixement obert de la UPC

Implementació d'un gestor en entorns de BigData

Fitxers d'aquest items

Aquest ítem apareix a les col·leccions següents

Explora