


Ho bisogno del tuo feedback su un progetto a cui sto lavorando ultimamente. Si chiama KalpiCast ed è un modello di previsione elettorale per la Grecia, basato su sondaggi, dati economici e statistiche bayesiane.
Non è una semplice media dei sondaggi. Non significa “inserisci 15 sondaggi e ottieni una media”. Si cerca di rispondere alla domanda:
Se prendiamo tutti i dati disponibili e li modelliamo correttamente, qual è il allocazione di intenzione di voto, quali scenari elettorali e cosa opportunità ognuno ne ha uno?
Cosa fa?
- Tiene conto del fatto che le percentuali dei partiti non sono indipendenti l’una dall’altra (ci sono correlazioni).
- Modella attentamente le loro dinamiche nel tempo (non una fotografia statica).
- Valuta le società di sondaggi in base alle prestazioni storiche e all’imparzialità.
- Non considera che “n=1000” significhi automaticamente ±3%.
- Modella la redistribuzione degli indecisi mentre ci avviciniamo alle elezioni
- Tiene conto dei possibili errori sistematici comuni delle società di sondaggi.
- Incorpora dati economici per migliorare la valutazione del partito al governo.
- Simula 50.000 scenari tramite la catena bayesiana di Markov Monte Carlo e fornisce distribuzioni di probabilitànon “previsioni” deterministiche.
Cosa mostra?
- Stima attuale dell’intenzione di voto
- Intervalli di confidenza
- Assegnazione dei posti possibili
- Probabilità per vari scenari
- Valutazioni delle società di sondaggi
In altre parole: cerca di mostrare non solo ciò che è vero in media, ma anche quanto possiamo essere certi in ciascun caso.
Perché ce l’ho fatta
Due obiettivi principali:
- Dovrebbe esserci un modello trasparente e tecnicamente documentato per il caso greco (nessun “numero magico”, nessun posizionamento politico).
- Acquistiamo un po’ più di familiarità con il concetto di incertezza.
In Grecia spesso trattiamo le percentuali come se fossero fatti deterministici (tutto è bianco o nero, e il grigio non esiste…).
Ma la realtà è contemplativa.
Il 25% che leggiamo non è esattamente il 25%, è un range di possibili valori vicini ad esso.
E comprendere le probabilità è importante, non solo per le elezioni, ma per il modo in cui pensiamo in generale.
Metodologia
- Metodologia di sondaggio e previsione del quadro generale
- Metodologia del modello dei dati finanziari
- Metodologia di valutazione delle società di sondaggi
Vorrei un feedback
- Sei interessato a un approccio del genere?
- Ci sono funzionalità che troveresti utili?
- Avete proposto modifiche alla metodologia
Il progetto è personale, indipendente e non finanziato.
https://kalpicast.gr/el/poll-aggregate
di StructuredChaos42
6 commenti
Δυνατό φαινεται μακαρι να σου παει καλα
Γιατί έγραψες το ποστ με Ilm?
Εγώ σπουδάζω πληροφορική επιστήμη, αλλά είμαι ακόμα στα βασικά του machine learning, lìnear/logistic regression. Με αυτά που ξέρω όμως θα πρότεινα έρευνα για τα features gdp, gdp per capita, life expectancy, country population, για να δεις πόσο επεράζουν άμα θα ξαναβγεί το τωρινό κόμμα ή θα ψηφιστεί άλλο. Φυσικά αυτό θα ήταν ουσιαστικά εντελώς άλλο μοντέλο, αλλά όπως είπα σε αυτά που αναφέρεις δεν έχω εμπειριά για να προτείνω κάτι :/
Νδ παλι θα βγει τσαμπα εκανες τη μελετη. Αν υπαρξει σοβαρη αντιπολιτευση τοτε μιλαμε παλι
ΝΙΚΗ+ Undecided + other = Golden Dawn αν δεν ήταν όλοι στην φυλακή
Καλησπέρα , ενδιαφέρον φαίνεται. Με τι ασχολείσαι αν επιτρέπεται , εγώ είμαι 3ο έτος Στατιστικής και πρώτη φορά βλέπω στην πράξη ότι μαθαίνουμε.