Gli svantaggi della regressione lineare

La regressione lineare è un metodo statistico per esaminare la relazione tra una variabile dipendente, indicata come y,
e una o più variabili indipendenti, indicata come x
. La variabile dipendente deve essere continua, in quanto può assumere qualsiasi valore o almeno vicina a continua. Le variabili indipendenti possono essere di qualsiasi tipo. Sebbene la regressione lineare non possa mostrare la causalità da sola, la variabile dipendente è generalmente influenzata dalle variabili indipendenti.
La regressione lineare è limitata alle relazioni lineari

Per sua natura, la regressione lineare considera solo le relazioni lineari tra dipendente e variabili indipendenti. Cioè, presuppone che ci sia una relazione lineare tra loro. A volte questo non è corretto. Ad esempio, la relazione tra reddito ed età è curva, vale a dire che il reddito tende ad aumentare nelle prime parti dell'età adulta, si appiattisce nella successiva età adulta e diminuisce dopo che le persone si ritirano. Puoi capire se questo è un problema osservando le rappresentazioni grafiche delle relazioni.
La regressione lineare esamina solo la media della variabile dipendente

La regressione lineare esamina una relazione tra la media della variabile dipendente e le variabili indipendenti. Ad esempio, se si osserva la relazione tra il peso alla nascita dei bambini e le caratteristiche materne come l'età, la regressione lineare esaminerà il peso medio dei bambini nati da madri di età diverse. Tuttavia, a volte è necessario esaminare gli estremi della variabile dipendente, ad es. I bambini sono a rischio quando i loro pesi sono bassi, quindi in questo esempio si dovrebbero guardare gli estremi.

Proprio come la media non è una descrizione completa di una singola variabile, la regressione lineare non è una descrizione completa delle relazioni tra variabili. Puoi affrontare questo problema usando la regressione quantile.
La regressione lineare è sensibile ai valori anomali

I valori anomali sono dati sorprendenti. I valori anomali possono essere univariati (basati su una variabile) o multivariati. Se stai guardando l'età e il reddito, i valori anomali univariati sarebbero cose come una persona che ha 118 anni o una che ha guadagnato $ 12 milioni l'anno scorso. Un valore anomalo multivariato sarebbe un diciottenne che guadagnava $ 200.000. In questo caso, né l'età né il reddito sono molto estremi, ma pochissimi diciottenni fanno così tanti soldi.

I valori anomali possono avere enormi effetti sulla regressione. Puoi risolvere questo problema richiedendo statistiche di influenza al tuo software statistico.
I dati devono essere indipendenti

La regressione lineare presuppone che i dati siano indipendenti. Ciò significa che i punteggi di una materia (come una persona) non hanno nulla a che fare con quelli di un'altra. Questo è spesso, ma non sempre, sensato. Due casi comuni in cui non ha senso sono il raggruppamento nello spazio e nel tempo.

Un classico esempio di raggruppamento nello spazio sono i punteggi dei test degli studenti, quando si hanno studenti di varie classi, gradi, scuole e distretti scolastici. Gli studenti della stessa classe tendono ad essere simili in molti modi, cioè spesso provengono dagli stessi quartieri, hanno gli stessi insegnanti, ecc. Pertanto, non sono indipendenti.

Esempi di raggruppamento nel tempo sono qualsiasi studio in cui si misurano più volte le stesse materie. Ad esempio, in uno studio sulla dieta e sul peso, potresti misurare ogni persona più volte. Questi dati non sono indipendenti perché ciò che una persona pesa in un'occasione è correlato a ciò che pesa in altre occasioni. Un modo per gestirlo è con i modelli multilivello.

Come trovare le dimensioni di un quadrato con l'area

Gli svantaggi di una piccola dimensione del campione

Altro

Come calcolare una percentuale usando una calcolatrice

Lo strano comportamento di Oxygens su Marte crea un nuovo mistero

Come elaborare le percentuali per un grafico a torta

Scienza

I componenti principali del sistema scheletrico

Gli effetti delle radiazioni nucleari sull'ambiente

Come convertire i millimoli in PPM

Scienza

Chimica

Astronomia

Energia

Natura

Biologia

Fisica

Elettronica

Geologia

Eclissi solareen

Matematica

Altro

Altro

Come determinare se la relazione è una funzione

Ingredienti nei detergenti per carburatori

Forme alternative di energia nei Caraibi

Cos'è il campionamento PPS?

Sei un genitore cane orgoglioso? È tutto nei tuoi geni!

La Turchia del Ringraziamento ti rende davvero assonnato?

Scienza

Gli effetti dell'inquinamento idrico su piante e animali

Come trovare la concentrazione quando ti viene dato il pH

Differenza di peso dell'acciaio rispetto alla ghisa