Breast tumor detection in Hematoxylin & Eosin stained biopsy images
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/354645
Tipus de documentTreball Final de Grau
Data2021-06-28
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
El càncer fa referència a un conjunt de malalties molt presents en la nostra societat. Gràcies als nous avenços en el camp de la medicina, la taxa de supervivència en els diferents tipus de càncer augmenta contínuament. Un dels aspectes fonamentals és fer una detecció ràpida de la malaltia mitjançant diverses proves diagnòstiques. En el cas del càncer de mama, s'extreu una mostra de teixit a partir d'una biòpsia, es tenyeix amb una tinció anomenada Hematoxilina-Eosina i s'analitza per tal de detectar regions amb cèl·lules tumorals. Aquesta tasca és molt exigent degut al gran volum de feina que comporta, ja que els patòlegs han d'analitzar tota la mostra de teixit escanejada en imatges histològiques digitals. Són imatges d'una mida molt gran degut al gran nivell de detall amb el que s'ha capturat la mostra. Aquest treball es desenvolupa dins del projecte DigiPatICS, que té com a objectiu proporcionar algorismes d'anàlisi per l'Institut Català de la Salut (ICS). Així doncs, per ajudar als patòlegs en la detecció del càncer de mama, l'objectiu d'aquest treball és entrenar una xarxa neuronal per tal d'identificar les regions tumorals presents en el teixit. Concretament, s'entrena una arquitectura U-Net per tal de fer la segmentació de les imatges en 5 classes diferents, entre elles, tumor. Degut a la impossibilitat d'obtenir imatges anotades pròpies per aquest projecte, s'han utilitzat les del Breast Cancer Semantic Segmentation (BCSS) challenge. Per tant, en aquest projecte s'entrena la xarxa neuronal amb aquestes dades i, un cop obtingut el model òptim, es fa inferència utilitzant les dades de l'Institut Català de la Salut. El model s'ha entrenat a partir de les dades de BCSS amb les quals s'han obtingut uns resultats molt bons, sobretot en la classe referent al tumor. Pel que fa la inferència, les prediccions obtingudes també són força bones, tot i que no ha sigut possible mesurar els resultats quantitativament per la manca d'anotacions o bé obtenir impressions per part dels patòlegs dels resultats obtinguts. Així doncs, s'espera en un futur poder validar i/o corregir aquestes prediccions de les imatges de l'ICS per tal de poder re-entrenar la xarxa i millorar el seu funcionament. Cancer refers to a group of diseases that are very present in our society. Thanks to new advances in the field of medicine, the survival rate in different types of cancer is continuously increasing. One of the fundamental aspects is to make a fast detection of the disease through various diagnostic tests. In the case of breast cancer, a tissue sample is extracted from a biopsy, stained with a stain called Hematoxylin-Eosin, and analysed for regions with tumour cells. This task is very tough due to the large volume of work involved, as pathologists have to analyse the entire scanned tissue sample on digital histological images. These images are very large due to the big level of detail with which the sample has been captured. This work is developed within the DigiPatICS project, which aims at providing algorithms for the Catalan Institute of Health (ICS). So, to help pathologists in the detection of breast cancer, the objective of this work is to train a neural network to identify the tumour regions present in the tissue. Specifically, a U-Net architecture is trained to segment the images into 5 different classes, including tumour. Due to the impossibility of obtaining our own annotated images for this project, those of the Breast Cancer Semantic Segmentation (BCSS) challenge have been used. Therefore, in this project the neural network is trained with these data and, once the optimal model is obtained, the inference is made using data from the Catalan Health Institute. Therefore, the model has been trained from the BCSS data with which very good results have been obtained, especially in the tumour class. In terms of inference, the predictions obtained are also quite good, although it has not been possible to obtain quantitative results due to the lack of annotations or getting impressions from the pathologists on the results obtained. So, we hope that in the future it can be able to validate and/or correct these predictions of the ICS images in order to retrain the network and improve its performance.
TitulacióGRAU EN CIÈNCIA I ENGINYERIA DE DADES (Pla 2017)
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
160159.pdf | 2,699Mb | Visualitza/Obre |