Online reinforcement learning is an emerging machine learning
approach that addresses the challenge of design-time uncertainty
faced when building self-adaptive systems. Online reinforcement
learning means that the self-adaptive system can learn from data
only available at run time. After introducing the fundamentals
of self-adaptive systems and reinforcement learning, the keynote
discusses three relevant issues and recent solutions related to data
quality in online reinforcement learning for self-adaptive systems.
Beobachtung von Veränderungen in Umgebung, Anforderungen und sich selbst
Anpassungen von Struktur, Parametern und Verhalten
--
M. Papazoglou, K. Pohl, M. Parkin, and A. Metzger, Eds., Service Research Challenges and Solutions for the Future Internet: S-Cube – Towards Mechanisms and Methods for Engineering, Managing, and Adapting Service-Based Systems, ser. LNCS. Heidelberg, Germany: Springer, 2010, vol. 6500.
Beobachtung von Veränderungen in Umgebung, Anforderungen und sich selbst
Anpassungen von Struktur, Parametern und Verhalten
--
M. Papazoglou, K. Pohl, M. Parkin, and A. Metzger, Eds., Service Research Challenges and Solutions for the Future Internet: S-Cube – Towards Mechanisms and Methods for Engineering, Managing, and Adapting Service-Based Systems, ser. LNCS. Heidelberg, Germany: Springer, 2010, vol. 6500.
Trotz dieser Möglichkeiten, zeigen sich beim Einsatz von ML für AS konkrete Probleme, von denen ich auf zwei im weiteren verlauf genauer eingehen werde…
--
Bradley Schmerl, David Garlan, Christian Kästner - CMU
Danny Weyns – U Leuven
Pooyan Jamshidi – U South Carolina
Javier Camara – U York
Hongbing Wang – U Nanjing
Sven Tomforde – U Kiel
---
N. Esfahani, E. Kouroshfar, and S. Malek, “Taming Uncertainty in Self-adaptive Software,” in Proceedings of the 19th ACM SIGSOFT Symposium and the 13th European Conference on Foundations of Software Engineering, ser. ESEC/FSE ’11, 2011, pp. 234–244.
--
A. J. Ramirez, A. C. Jensen, and B. H. C. Cheng, “A taxonomy of uncertainty for dynamically adaptive systems,” in 7th International Symposium on Software Engineering for Adaptive and Self-Managing Systems, SEAMS, 2012, pp. 99–108.
--
Trotz dieser Möglichkeiten, zeigen sich beim Einsatz von ML für AS konkrete Probleme, von denen ich auf zwei im weiteren verlauf genauer eingehen werde…
--
Bradley Schmerl, David Garlan, Christian Kästner - CMU
Danny Weyns – U Leuven
Pooyan Jamshidi – U South Carolina
Javier Camara – U York
Hongbing Wang – U Nanjing
Sven Tomforde – U Kiel
---
N. Esfahani, E. Kouroshfar, and S. Malek, “Taming Uncertainty in Self-adaptive Software,” in Proceedings of the 19th ACM SIGSOFT Symposium and the 13th European Conference on Foundations of Software Engineering, ser. ESEC/FSE ’11, 2011, pp. 234–244.
--
A. J. Ramirez, A. C. Jensen, and B. H. C. Cheng, “A taxonomy of uncertainty for dynamically adaptive systems,” in 7th International Symposium on Software Engineering for Adaptive and Self-Managing Systems, SEAMS, 2012, pp. 99–108.
--
Beobachtung von Veränderungen in Umgebung, Anforderungen und sich selbst
Anpassungen von Struktur, Parametern und Verhalten
--
M. Papazoglou, K. Pohl, M. Parkin, and A. Metzger, Eds., Service Research Challenges and Solutions for the Future Internet: S-Cube – Towards Mechanisms and Methods for Engineering, Managing, and Adapting Service-Based Systems, ser. LNCS. Heidelberg, Germany: Springer, 2010, vol. 6500.
Die Beiträge wurden u.a. veröffentlicht auf dem SEAMS Symposium, sowie aktuell auf der ICSOC, wo wir den Best Paper Award erhielten
Strategy exploits semantics typically encoded in feature models. Non-leaf features are usually abstract features, which delegate their realization to their sub-features. Sub-features thus may offer different realizations of their abstract parent feature.
If no configuration containing f or a sibling feature of f is found, then the strategy moves on to the parent feature of f, which is repeated until a configuration is
found (line 13) or the root feature is reached (line 22).
We used an e decay rate of 0.97 (i.e., e < 1% after time step 150), as this led to fastest
convergence with highest asymptotic rewards for e-greedy.
Grund: viele Konifgurationen mit sehr ähnlicher Performanz
Die Beiträge wurden u.a. veröffentlicht auf dem SEAMS Symposium, sowie aktuell auf der ICSOC, wo wir den Best Paper Award erhielten