Katalog Plus
Bibliothek der Frankfurt UAS
Bald neuer Katalog: sichern Sie sich schon vorab Ihre persönlichen Merklisten im Nutzerkonto: Anleitung.
Dieses Ergebnis aus BASE kann Gästen nicht angezeigt werden.  Login für vollen Zugriff.

Non-asymptotic analysis of a sequential rupture detection test and its application to non-stationary bandits ; Analyse non asymptotique d'un test séquentiel de détection de rupture et application aux bandits non stationnaires

Title: Non-asymptotic analysis of a sequential rupture detection test and its application to non-stationary bandits ; Analyse non asymptotique d'un test séquentiel de détection de rupture et application aux bandits non stationnaires
Authors: Besson, Lilian; Kaufmann, Emilie
Contributors: CentraleSupélec; Institut d'Électronique et des Technologies du numéRique (IETR); Université de Nantes (UN)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes); Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS); Sequential Learning (SEQUEL); Inria Lille - Nord Europe; Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 (CRIStAL); Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS); Signal, Communication et Electronique Embarquée (SCEE); Institut d'Electronique et de Télécommunications de Rennes (IETR); Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes); Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Ecole Supérieure d'Electricité - SUPELEC (FRANCE)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes); Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Ecole Supérieure d'Electricité - SUPELEC (FRANCE)-Centre National de la Recherche Scientifique (CNRS); SUPELEC-Campus Rennes; Ecole Supérieure d'Electricité - SUPELEC (FRANCE); Centre National de la Recherche Scientifique (CNRS); Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 (CRIStAL); Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS)
Source: GRETSI 2019 - XXVIIème Colloque francophone de traitement du signal et des images ; https://inria.hal.science/hal-02152243 ; GRETSI 2019 - XXVIIème Colloque francophone de traitement du signal et des images, Aug 2019, Lille, France ; http://gretsi.fr/colloque2019/
Publisher Information: HAL CCSD
Publication Year: 2019
Collection: Université de Rennes 1: Publications scientifiques (HAL)
Subject Terms: [INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG]; [MATH.MATH-ST]Mathematics [math]/Statistics [math.ST]; [STAT.ML]Statistics [stat]/Machine Learning [stat.ML]
Subject Geographic: Lille; France
Description: National audience ; We study a strategy for online change-point detection based on generalized likelihood ratios (GLR) and that can be expressed with the binary relative entropy. This test is used to detect a change in the mean of a bounded distribution, and we propose a non-asymptotic control of its false alarm probability and detection delay. We then explain how it can be useful for sequential decision making by proposing the GLR-klUCB bandit strategy, which is efficient in piece-wise stationary multi-armed bandit models. ; Nous étudions un test pour la détection séquentielle de rupture, basé sur le rapport de vraisemblance généralisé (GLR) et qui s'exprime en fonction de l'entropie relative binaire. Il s'applique à la détection de rupture sur la moyenne d'une distribution bornée, et nous obtenons un contrôle non-asymptotique de sa probabilité de fausse alarme et de son délai de détection. Nous expliquons son utilisation pour la prise de décision séquentielle en proposant la stratégie de bandit GLR-klUCB, efficace dans des modèles de bandit stationnaires par morceaux.
Document Type: conference object
Language: French
Availability: https://inria.hal.science/hal-02152243; https://inria.hal.science/hal-02152243v1/document; https://inria.hal.science/hal-02152243v1/file/GRESTI__2019__Paper__Lilian_Besson__03-19.pdf
Rights: http://creativecommons.org/licenses/by-nc-sa/ ; info:eu-repo/semantics/OpenAccess
Accession Number: edsbas.4DE06BC9
Database: BASE