Feeds:
Articoli
Commenti

Posts Tagged ‘campione’

Nello studio di un dato fenomeno che riguarda una POPOLAZIONE, spesso, per motivi di convenienza e fattibilità si restringe lo studio ad un suo sottinsieme, chiamato CAMPIONE.

Nei problemi che abbiamo svolto in 4^ le caratteristiche della popolazione erano note A PRIORI, ovvero si conosce la sua distribuzione di probabilità ed i parametri che la descrivono.
Il tipo di ragionamento che viene fatto è DEDUTTIVO (dal generale al particolare)

L’Inferenza Statistica si occupa invece del problema inverso: in generale non conosciamo le caratteristiche della popolazione, al massimo possiamo dire il tipo di distribuzione di probabilità che meglio descrive il fenomeno, ma non conosciamo i parametri. Abbiamo solo i dati estratti dal campione e vogliamo trovare un metodo per poter estendere le conclusioni che otteniamo dal campione all’intera popolazione.
Il tipo di ragionamento che viene fatto è INDUTTIVO, basato sull’esperienza (dal particolare al generale).

ESEMPIO:

immaginiamo di studiare il peso di una determinata popolazione, la v.a. “Peso” è distribuita come una Normale, ma non conosciamo i parametri μ e σ2, vogliamo dunque STIMARLI dal CAMPIONE.

Abbiamo quindi due problemi da risolvere:

1) La ricerca di METODI PER ESTRARRE CAMPIONI da una popolazione.

2) La ricerca di STIMATORI

___________________________________________________________________________________-

Read Full Post »

Immaginiamo di voler fare un’indagine statistica, chiamiamo Variabile Statistica X il fenomeno che vogliamo Studiare, ad esempio X = peso, statura, reddito, sesso, gruppo sanguigno, voto, preferenza musicale, partito politico, …

Innanzitutto determiniamo le Modalità con cui si manifesta X
ad esempio

  1. X = sesso                       Modalità= M, F
  2. X = gruppo sanguigno       Modalità = A, B, AB, O
  3. X= giudizio                      Modalità = scadente, sufficiente, adeguato, buono, ottimo
  4. X= voto                         Modalità = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
  5. X= reddito              Modalità = tutti i valori all’interno di un intervallo da un minimo ad un massimo
  6. X = peso                   Modalità = tutti i valori all’interno di un intervallo da un minimo ad un massimo

Le variabili statistiche 1, 2, 3 si dicono qualitative, mentre la 4 si dice quantitativa discreta, e le 5 e 6 quantitative continue.

Individuiamo il collettivo su cui l’indagine viene fatta: tutta la popolazione, oppure un campione estratto dalla popolazione.

Se studiamo un FENOMENO FISICO consideriamo n esperimenti, se invece studiamo un FENOMENO SOCIALE consideriamo n persone a cui chiederemo dei dati tramite questionari, interviste o censimenti…

In entrambi i casi chiamiamo CAMPIONE le n osservazioni riguardanti il fenomeno.
Quello che interessa dunque è andare a contare quante volte ciascuna modalità è andata a verificarsi nel campione considerato.

Vediamo come si procede nel caso di variabili statistiche quantitative

E’ l’esercizio che abbiamo visto lunedì 27 settembre in laboratorio.

_______________________________________________________________________________________

Read Full Post »

Benvenuti al corso di Probabilità e Statistica, di seguito vi riassumo l’introduzione alla statistica fatto oggi in classe.
Se volete leggere il piano di lavoro previsto per quest’anno, cliccate sul link e scaricatevi il pdf.

Cos’è un FENOMENO DETERMINISTICO ?

Date le condizioni iniziali e la legge che regola il fenomeno il risultato è completamente e univocamente determinato. Pensiamo ad esempio alla legge fisica F=m·a, che ci permette di prevedere il comportamento di un oggetto quando esso è soggetto a questa legge.

Cos’è invece un FENOMENO ALEATORIO ?

Date le condizioni iniziali, non si conoscono tutte le forze che agiscono sul sistema e dunque non è possibile prevedere esattamente il risultato, ma si può solo dare un insieme di possibili risultati.

Diamo alcuni ESEMPI di fenomeni aleatori:

  • Fenomeni di massa (comportamenti o caratteri di popolazioni, fisica molecolare…)
  • Fenomeni intrinsecamente aleatori (giochi d’azzardo, dadi, carte, estrazioni…)

Perchè studiare i giochi?

Perchè sono dei MODELLI, delle semplificazioni di fenomeni reali complessi, che ci insegnano un metodo per esaminarli.

Interessante… direte voi… ma A CHE SERVE ?

Le applicazioni della Statistica si trovano su svariati campi del mondo del lavoro e della vita quotidiana:

CARTE DI FIDELIZZAZIONE (Es la Fidaty Esselunga o altro supermercato)
Ogni volta che fate un acquisto, lasciate dei dati su di voi che dicono chi siete, che preferenza avete, quali prodotti comprate assieme …ecc…
Con tutti questi dati il Supermercato ad esempio può decidere come disporre le merci sugli scaffali o quali prodotti vendere in offerta per invogliare a comprare e spendere di più, massimizzando quindi il suo profitto.

SONDAGGI POLITICI
In prossimità delle elezioni spesso i candidati si affidano a dei sondaggi che sono indagini campionarie per capire l’indice di gradimento e decidere la migliore campagna elettorale

FARMACIA
L’efficacia di medicinali e vaccini viene testata su campioni di popolazione per verificarne efficacia e possibili danni collaterali in modo da decidere se mettere sul mercato nuove terapie

INGEGNERIA  CIVILE
Studiare le precipitazioni o le portate di un fiume sul quale si vuole costruire un ponte o una diga, studiare la frequenza e l’intensità di fenomeni sismici per decidere le migliori tecniche di costruzione

MEDICINA
Trovare correlazioni tra abitudini di vita e patologie invalidanti, ad esempio fumo, alcool, sedentarietà, infarto, diabete, bronchite cronica…

SOCIOLOGIA
Confrontare qualità e stili di vita di diverse popolazioni, ad esempio indici di mortalità infantile, scolarizzazione, reddito medio …ecc… nei paesi del terzo mondo e sviluppati

Qual è una delle parole più ricorrenti?

DECIDERE

La Statistica serve dunque a prendere decisioni e l’errore che si può commettere è quantificabile, misurabile in termini di probabilità. Si cerca quindi di prendere la decisione che ha più bassa probabilità di insuccesso.

Chi si avvale della Statistica per prendere decisioni?

Chiunque lavori per una collettività, sia in termini idealmente altruistici, come dovrebbe essere per politici, medici e ingengeri, ma in generale anche chiunque lavori con una collettività a scopo di personale vantaggio, come manager di aziende ecc…

Read Full Post »

Cosa vuol dire fare una stima per intervalli?

Facciamo alcuni esempi:

  • Da una popolazione di N  persone (es. tutti i maschi adulti italiani)  si vuole dare una stima dell’altezza media della popolazione (media teorica).
    Dato che non è possibile intervistare davvero tutta la popolazione, si estrae a caso un campione di n persone n<N (es 1000 maschi adulti italiani) e si calcola la media campionaria su questo sottinsieme di persone.
    Ebbene, questa media campionaria ci dà una stima della media della popolazione.
  • Si vuole costruire una diga o un ponte su un fiume, serve una stima della portata media del fiume (media teorica), allora si fanno n misurazioni della portata del fiume, ad esempio una alla settimana per un anno intero. Si ottiene un campione di n misurazioni, dal quale si può ottenere una media campionaria che stima la media teorica.
  • Si vuole fare un’analisi economica sulle spese sostenute dalle famiglie italiane in un anno.
    Si considerano n famiglie estratte a caso dalla popolazione e si valutano le spese annuali per famiglia.
    Dalla media campionaria stimiamo la spesa media annuale di tutta la popolazione italiana

………………… ecc……………

Spesso anzichè una STIMA PUNTUALE , può essere utile avere una STIMA PER INTERVALLI  del parametro incognito (in tutti questi esempi il parametro era la media della popolazione e la stima puntuale era la media campionaria)

Ovvero cerchiamo un intervallo dentro al quale è probabile che sia contenuto il valore incognito da stimare e tale probabilità è definita a priori.

Qual è la differenza tra le due stime?

La stima puntuale ci trova un valore che approssima il parametro teorico, ma non è possibile sapere quanto questa stima sia precisa, ovvero quanto il valore teorico sia davvero vicino alla sua stima.

Invece con la stima per intervalli è possibile stabilire A PRIORI quale sia il margine di errore che riteniamo accettabile nella nostra stima, perciò sappiamo quanto siamo vicini al valore teorico che non è possibile conoscere, ma non abbiamo un unico numero bensì due: gli estremi dell’intervallo.

Scarica il pdf con le spiegazioni e le formule risolutive nel caso di una popolazione normale di cui si conosca la varianza σ2.

Read Full Post »

Abbiamo visto in classe che dato un campione X1, X2,…,Xn di n v.a. indipendenti distribuite come una Normale N(μ,σ2) la v.a. Media Campionaria si comporta ancora come una Normale N(μ, σ2/n).

Il fatto veramente notevole è che questo risultato può essere esteso a qualsiasi campione di var. aleatorie indipendenti con la stessa distribuzione, qualunque sia la loro distribuzione.
Ovvero:

Dato un campione di n  variabili aleatorie  X1, X2,…,Xn (Indipendenti Identicamente Distribuite), di media μ e varianza σ2, la loro media aritmetica si comporta, per n molto grande, come una var. aleatoria Normale di media ancora μ e varianza σ2/n qualunque sia la distribuzione di partenza delle n variabili che formano il campione

Read Full Post »

Supponiamo di voler studiare l’altezza in una popolazione, ad esempio l’altezza dei maschi adulti italiani. La media teorica μ di tale popolazione è chiaramente incognita (sarebbe necessario intervistare tutta la popolazione!)

Consideriamo quindi un campione di n persone estratte da quella popolazione, vogliamo trovare una legge che garantisca che le informazioni che otteniamo dal campione si possono estendere all’intera popolazione considerata.

Non conosciamo μ, che sarebbe la VERA altezza media di tutte le persone che compongono la popolazione, se fosse possibile calcolarla, possiamo però fare una STIMA utilizzando la media aritmetica del campione.

Quanto questa stima è affidabile?

Possiamo basarci su questa stima per generalizzarla all’intera popolazione?

La Legge dei grandi numeri dà una risposta a queste domande…
Vedi il pdf con il teorema di Chebicev e la Legge dei grandi numeri.

Read Full Post »

Vi metto in linea l’esercitazione che abbiamo svolto in Laboratorio venerdì 25 settembre.

Cliccate sul link per scaricare il file excel.

Per chi non si ricorda o non c’era…

“Numero di libri letti in un anno da un campione di 40 persone”

L’esercizio parte dandovi due colonne: la prima contiene la numerazione progressiva delle persone intervistate, la seconda colonna contiene le loro risposte, ovvero la persona n. ha letto tot libri.

Scopo dell’esercizio era mostrarvi come ottenere la tabella delle modalità e frequenze di una variabile statistica a partire dai dati grezzi. Una volta ottenuta la tabella delle frequenze assolute dovevate costruire le frequenze relative e le percentuali e poi il grafico dell’istogramma.

Potete usare o le percentuali o le frequenze è lo stesso, cambia la scala dell’asse y, non cambia la forma delle aste dell’istogramma.

Oltre alle frequenze percentuali veniva richiesto di calcolare anche la colonna delle frequenze % cumulate e farne il grafico.

Read Full Post »

Older Posts »

Iscriviti

Ricevi al tuo indirizzo email tutti i nuovi post del sito.