Breast Cancer Tissue Classification with Contrastive Learning on Whole Slide Images

dc.audience.degreeGRAU EN CIÈNCIA I ENGINYERIA DE DADES (Pla 2017)
dc.audience.educationlevelGrau
dc.audience.mediatorFacultat d'Informàtica de Barcelona
dc.contributorCasas Pla, Josep Ramon
dc.contributorRabanaque Rodríguez, Sonia
dc.contributor.authorQiu, Yikai
dc.contributor.otherUniversitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
dc.date.accessioned2023-07-19T08:44:10Z
dc.date.available2023-07-19T08:44:10Z
dc.date.issued2023-06-29
dc.date.updated2023-07-06T04:02:39Z
dc.description.abstractEl carcinoma ductal in situ i el carcinoma invasiu representen el 90% dels càncers de mama. El primer és controlable i gairebé tots els pacients en aquesta etapa poden curar-se, mentre que el segon és significativament més greu a causa de la infiltració. L'objectiu d'aquest estudi és entrenar un model capaç de distingir entre els casos in situ i invasius utilitzant sub-imatges extretes d'imatges completes de talls (WSI) tenyits amb H&E. Per aconseguir això, proposem entrenar en finetuning l'EfficientNet pel seu gran rendiment en tasques similars. A més, per abordar el problema de les dades limitades, explorem l'aplicació de la tècnica SimCLR utilitzant les dades disponibles. Els resultats d'aquest estudi demostren que SimCLR no és beneficiós amb les dades disponibles. No obstant això, és possible obtenir un model de classificació amb un rendiment destacat, amb una puntuació F1 superior a 0,85, utilitzant només les dades anotades. A més, els resultats són notables en concatenar les prediccions de cada sub-imatge com una imatge completa de tall (WSI).
dc.description.abstractDuctal carcinoma in situ and invasive carcinoma represent 90% of breast cancers. The former is controllable, and nearly all patients at this stage can be cured, while the latter is significantly more severe due to infiltration. The objective of this study is to train a model capable of distinguishing between in situ and invasive cases using sub-images extracted from Whole Slide Images stained with H&E. To achieve this, we propose fine-tuning EfficientNet due to its high performance in similars tasks. Additionally, in order to address the issue of limited data, we explore the application of the SimCLR technique using the available data. The results of this study demonstrate that SimCLR is not beneficial with the available data. However, it is possible to achieve a well-performing classification model with an F1-score above 0.85 only using the annotated data, with remarkable results when concatenating each sub-image prediction as an entire Whole Slide Image.
dc.identifier.slug179102
dc.identifier.urihttps://hdl.handle.net/2117/391669
dc.language.isoeng
dc.publisherUniversitat Politècnica de Catalunya
dc.rights.accessOpen Access
dc.subjectÀrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la imatge i del senyal vídeo
dc.subject.lcshBreast--Cancer
dc.subject.lcshDiagnostic imaging--Digital techniques
dc.subject.lemacMama--Càncer
dc.subject.lemacImatgeria per al diagnòstic--Tècniques digitals
dc.subject.otherCàncer de mama
dc.subject.otherSimCLR
dc.subject.otherEfficientNet
dc.subject.otherBreast cancer
dc.subject.otherimage classification
dc.subject.otherH&E
dc.subject.otherclassificació d'imatges
dc.titleBreast Cancer Tissue Classification with Contrastive Learning on Whole Slide Images
dc.typeBachelor thesis
dspace.entity.typePublication

Fitxers

Paquet original

Mostrant 1 - 1 de 1
Carregant...
Miniatura
Nom:
179102.pdf
Mida:
17.42 MB
Format:
Adobe Portable Document Format