Un esempio: durata di un contratto telefonico (1000 contratti) Evento iniziale: stipula oggi Durata ?? Evento finale: Disdetta Durata: mantenimento del contratto
???????
Versione semplificata: tempo in anni
I contratti in corso sono tipicamente delle OSSERVAZIONI CENSURATE Di questi contratti sappiamo che non sono stati disdettati ad “OGGI” e che sono stati stipulati nel mese precedente l’”OGGI” Cioè che il loro tempo di durata t è ad una certa soglia T Qui nasce il primo problema sul tempo continuo/discreto: Per quanto rendiamo piccolo l’intervallo temporale considerato, (qui è un mese) esso rimane SEMPRE un INTERVALLO Il che significa che noi classifichiamo come appartenente al mese m anche chi stipula il contratto l’ultimo giorno e consideriamo come disdetta nel mese m+1 anche le disdette che avvengono il primo giorno del mese m+1 Poiché siamo interessati ad una probabilità, abbiamo il problema di definire quale sia l’insieme dei casi possibili, cioè la popolazione a rischio. Dobbiamo in qualche modo trattare il problema dei censurati, naturalmente con qualche ipotesi (ad esempio una ipotesi di omogeneità, immaginando che nuovi contratti siano stipulati in una stessa quota tutti i giorni del mese)
Organizziamo i dati:
Quantità importanti, che descrivono compiutamente la distribuzione delle durate: Data una variabile aleatoria T (la durata) essa è descritta da: una densità: una ripartizione Da cui si ricavano: Funzione di Sopravvivenza (Survival function) Probabilità di sopravvivere almeno fino a t Funzione di Rischio (hazard) Rischio che l’uscita avvenga in t+t posto che lo stato è durato fino a t Dove è l’intervallo unitario Hazard cumulato
Nel continuo sarà, data F(t): Densità: Sopravvivenza Hazard Hazard cumulata Relazione S-H
72 12 Inizio: tempo 0 Tutti contratti stipulati = 1000 Dopo 12 mesi sono “vivi” il 90% dei contratti = (circa) 900 Simmetricamente: per arrivare ad a perdere (1-0.6) il 40% dei contratti sono stati necessari circa 5 anni 72 12
Su dati mensili:
Introduzione all’inferenza: formule di Green
Confronto tra gruppi se non ci sono censurati ususali test non parametrici (Wilcoxon, Mann Whitney) In presenza di censura vanno modificati (es. Wicolxon modificato da Gehan): Due gruppi (X e Y) di numerosità nx e ny e siano:
Definiamo la quantità: W aumenta ogni volta che vi sono in X durate maggiori o censure maggiori di una durata conclusa in Y W diminuisce ogni volta che vi sono in Y durate maggiori o censure maggiori di una durata conclusa in X W dovrebbe tendere a 0 se è vera H0
Più precisamente: NB. Ci sono diverse “scorciatoie” per il calcolo di W
Confronto tra “gruppi” (trimestrale): stato civile
Titolo di studio: