Breast Cancer Tissue Classification with Contrastive Learning on Whole Slide Images
Títol de la revista
ISSN de la revista
Títol del volum
Autors
Correu electrònic de l'autor
Tutor / director
Tribunal avaluador
Realitzat a/amb
Tipus de document
Data
Condicions d'accés
item.page.rightslicense
Publicacions relacionades
Datasets relacionats
Projecte CCD
Abstract
El carcinoma ductal in situ i el carcinoma invasiu representen el 90% dels càncers de mama. El primer és controlable i gairebé tots els pacients en aquesta etapa poden curar-se, mentre que el segon és significativament més greu a causa de la infiltració. L'objectiu d'aquest estudi és entrenar un model capaç de distingir entre els casos in situ i invasius utilitzant sub-imatges extretes d'imatges completes de talls (WSI) tenyits amb H&E. Per aconseguir això, proposem entrenar en finetuning l'EfficientNet pel seu gran rendiment en tasques similars. A més, per abordar el problema de les dades limitades, explorem l'aplicació de la tècnica SimCLR utilitzant les dades disponibles. Els resultats d'aquest estudi demostren que SimCLR no és beneficiós amb les dades disponibles. No obstant això, és possible obtenir un model de classificació amb un rendiment destacat, amb una puntuació F1 superior a 0,85, utilitzant només les dades anotades. A més, els resultats són notables en concatenar les prediccions de cada sub-imatge com una imatge completa de tall (WSI).
Ductal carcinoma in situ and invasive carcinoma represent 90% of breast cancers. The former is controllable, and nearly all patients at this stage can be cured, while the latter is significantly more severe due to infiltration. The objective of this study is to train a model capable of distinguishing between in situ and invasive cases using sub-images extracted from Whole Slide Images stained with H&E. To achieve this, we propose fine-tuning EfficientNet due to its high performance in similars tasks. Additionally, in order to address the issue of limited data, we explore the application of the SimCLR technique using the available data. The results of this study demonstrate that SimCLR is not beneficial with the available data. However, it is possible to achieve a well-performing classification model with an F1-score above 0.85 only using the annotated data, with remarkable results when concatenating each sub-image prediction as an entire Whole Slide Image.

