Scanflow: an end-to-end agent-based autonomic ML workflow manager for clusters

Visualitza/Obre
Cita com:
hdl:2117/359094
Tipus de documentComunicació de congrés
Data publicació2021
EditorAssociation for Computing Machinery (ACM)
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
Machine Learning (ML) is more than just training models, the whole life-cycle must be considered. Once deployed, a ML model needs to be constantly managed, supervised and debugged to guarantee its availability, validity and robustness in dynamic contexts. This demonstration presents an agent-based ML workflow manager so-called Scanflow1, which enables autonomic management and supervision of the end-to-end life-cycle of ML workflows on distributed clusters. The case study on a MNIST project2 shows that different teams can collaborate using Scanflow within a ML project at different phases, and the effectiveness of agents to maintain the model accuracy and throughput of the model serving while running in production.
CitacióLiu, P. [et al.]. Scanflow: an end-to-end agent-based autonomic ML workflow manager for clusters. A: ACM/IFIP International Middleware Conference. "Middleware'21 demos and posters: proceedings of the 2021 International Middleware Conference Demos and Posters: December 6-10, 2021, Virtual event, Canada". New York: Association for Computing Machinery (ACM), 2021, p. 1-2. ISBN 978-1-4503-9154-2. DOI 10.1145/3491086.3492468.
ISBN978-1-4503-9154-2
Versió de l'editorhttps://dl.acm.org/doi/10.1145/3491086.3492468
Col·leccions
- Doctorat en Arquitectura de Computadors - Ponències/Comunicacions de congressos [232]
- Computer Sciences - Ponències/Comunicacions de congressos [501]
- CAP - Grup de Computació d'Altes Prestacions - Ponències/Comunicacions de congressos [782]
- Departament d'Arquitectura de Computadors - Ponències/Comunicacions de congressos [1.849]
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
Middleware21.pdf | 517,7Kb | Visualitza/Obre |