Unanalisi empirica Università degli Studi dellInsubria - Varese
2 Obiettivo dellanalisi Ottenere una stima della probabilità di insolvenza di un gruppo di imprese Fornire uno strumento PRELIMINARE di valutazione per le banche della probabilità di insolvenza dei propri clienti
3 Fonte dei Dati Base Informativa Pubblica su cd-rom (BIPCDROM) della Banca dItalia 2000 Banca dati OECD presente allUniversità degli Studi dellInsubria di Varese
4 Organizzazione del lavoro Periodo di osservazione: 31/12/1985 -> 31/12/2000 = 16 tassi di insolvenza annuali Selezione delle variabili economiche congiunturali (fonte: OECD) Settori economici e selezione degli stessi Adattamento dei dati
5 Analisi effettuate Totalità dei settori economici e classi di grandezza Classi di grandezza del credito (3 classi) Selezione settori economici Previsione futura probabilità di default
6 Principali Strumenti Statistici Programma R -> sito Modello di regressione lineare generalizzata -> Modello logistico Coefficiente di correlazione lineare (ρ) Coefficiente di determinazione (R²) Akaike Information Criterion (AIC) Distanza di Cook
7 Variabili Esplicative Tasso di Disoccupazione (TU) Tasso di crescita delleconomia (GDP) Indice delle vendite del settore industriale e manifatturiero
8
9
10 Totalità dei settori economici Anno TUGDP Imp.default Imp.tot. Prob.default ,1730, ,1752, ,8407% ,1771, ,0965% , ,3648% , ,7032% , ,9412% ,4866, ,0133% ,9878, ,2738%
11 Anno TUGDP Imp.default Imp.tot. Prob.default ,6885, ,4405% ,1877, ,7450% ,1896, ,4457% ,6923, ,1549% ,6933, ,0867% ,7952, ,1866% ,8969, ,5953% ,4984, ,8018% ,61012, ,7733% ,51030,8
12 Output modello Logit con le variabili originarie (1° modello) Variabili Coefficienti Stimati Intercetta β1 (gdp) β2 (tu) Null deviance (15 gradi di libertà) Residual deviance (13 gradi di libertà) AIC R ² 0, I p-value calcolati da R sono tutti molto significativi : < 2e-16
13 Grafico output 1° modello
14 Output modello Logit con logaritmo delle variabili originarie (2° modello) VariabiliCoefficienti stimatiP-value Intercetta β1 (lngdp) <2e-16 *** β2 (lntu) <2e-16 *** Null deviance (15 gradi di libertà) Residual deviance (13 gradi di libertà) AIC R² 0, Significato dei codici: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
15 Output modello Logit con il differenziale del logaritmo delle variabili originarie (3° modello) Variabili Coefficienti Stimati Intercetta β1 (dlngdp) β2 (dlntu) Null deviance (15 gradi di libertà) Residual deviance (13 gradi di libertà) AIC R² 0, I p-value calcolati da R sono tutti molto significativi : < 2e-16
16 Grafico output 3° modello
17 Perché scelgo il terzo modello? P-value sono tutti significativi AIC è il più basso quindi il modello mi fornisce il maggior numero di informazioni R² é più elevato rispetto agli altri modelli
18 Miglioriamo il terzo modello: Eliminando delle osservazioni anomale Distanza di Cook
19 Distanza di Cook dove: = valore previsto di quando li-esimo caso è escluso dal modello; = i-esimo valore predetto dalla regressione; n = numero dei casi; p = numero di variabili presenti nel modello; s² = varianza stimata dei residui.
20 Grafico distanza di Cook
21 Grafici a confronto PrimaDopo
22 Output modello Logit con il differenziale del logaritmo delle variabili originarie eliminando la dodicesima osservazione Variabili Coefficienti Stimati Intercetta β1 (dlngdp) β2 (dlntu) Null deviance (15 gradi di libertà) Residual deviance (13 gradi di libertà) AIC R² I p-value calcolati da R sono tutti molto significativi : < 2e-16
23 Classi di grandezza del credito AICR²R² Crediti inferiori a ,20, < Crediti < ,70, Crediti superiori a ,270,
24 Grafico 2ª classe di grandezza
25 Settori AICR²R² Prodotti tessili, cuoio, calzature, abbigliamento 361,960, Edilizia e opere pubbliche 1.069,10, Trasporti e comunicazioni 276,720,
26 Aggiunta di una variabile esplicativa Settore dei prodotti tessili, cuoio, calzature e abbigliamento Variabili Coefficienti Stimati P-value Intercetta <2e-16 *** β1 (dlngdp) <2e-16 *** β2 (dlntu) * β3 (dlnindvendite) * Null deviance (15 gradi di libertà) Residual deviance (12 gradi di libertà) AIC (prima ) R² (prima 0, ) Significato dei codici: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1
27 Previsione imprese insolventi anno 2000 Ci riferiamo al modello logit che usa il differenziale del logaritmo della variabili originarie escludendo lultimo anno di rilevazione Stimiamo il modello Utilizziamo la funzione logistica Sostituiamo allinterno della stessa i coefficienti stimati Otteniamo la stima della probabilità di insolvenza Moltiplichiamo tale valore per il numero di imprese nel 2000 Ottengo stima numero di imprese che dovrebbero risultare insolventi nel 2000 Confronto con il numero reale osservato nel 2000 Conclusioni
28 Stima Variabili Coefficienti Stimati Intercetta β1 (dlngdp) β2 (dlntu)
* = 9544 Non differisce eccessivamente dal risultato realmente ottenuto nel > 9129 Stima
30 Conclusioni Il modello applicato ha prodotto risultati molto soddisfacenti Ulteriori sviluppi del modello : utilizzo delle variabili esplicative di bilancio delle imprese Ulteriori affinamenti e verifiche qualità dei dati e trattamento delle variabili esplicative