bagpupa.pages.dev






Vad är regression

Regressionsanalys, regression, är en metod inom statistik där målet är att skapa en funktion som bäst passar observerade data.

I det här avsnittet ska vi titta närmare på de båda besläktade begreppen korrelation och regressionsanalys

En analys med hög förklaringsnivå kan fortfarande vara fel. Om vi har ett spridningsschema kan vi manuellt rita en sådan ungefärlig linje och sedan räkna ut värdet på K-linjen och värdet på m, precis som vi gjorde tidigare, baserat på kända punkter. När du har hittat ekvationen och använder regressionsanalys, liksom den statistiska grunden som du har, kan du använda den här linjära modellen för att förutsäga vad du får för värden vid andra mätpunkter.

Den matematiska konstruktionen av förklaringens mäthastighet är sådan att värdena ofta inte blir så höga. Om observationsvärdena som markerades i utbredningsdiagrammet samlas runt den antagna linjen med en positiv lutning, sägs det att det finns en positiv korrelation mellan den förklarande variabeln och svarsvariabeln. Därför måste du vara noga med att dra slutsatser om att du har hittat ett orsakssamband när du faktiskt kan hitta en korrelation mellan de studerade variablerna.

Detta gäller för de serier som är markerade i diagrammet nedan. Graden av förklaring kallas denna åtgärd, och den anges i procent. Om vi ville visa att det inte spelar någon roll hur många husdjur du har för en lön, kan vi ha husdjur som vår förklarande faktor. Som vi kan se verkar det som om det finns en positiv linjär korrelation mellan ålder och medellängd. Således, om vi markerar varje par värden för en förklarande variabel och en svarvariabel i distribuerade diagram, ser det i vårt exempel ut så här: Baserat på distributionstabellen kan du få en uppfattning om det finns någon koppling eller korrelation mellan den förklarande variabeln och svarvariabeln.

Om du vill öka förklaringen av modellen kan du inkludera fler förklarande faktorer. Förklaringsgraden skulle vara låg eftersom husdjur inte påverkar vad chefer får i löner. Om observationsvärdena som du har noterat å andra sidan är grupperade runt en antagen linje med en negativ lutning, kallas detta en negativ korrelation mellan den förklarande variabeln och svarvariabeln, som vi ser ett exempel i diagrammet nedan.

Ju viktigare enskilda faktorer är i analysen, desto sämre förklarar andra faktorer skillnaderna.

Regression

Och en noggrant utvald analys kan berätta vad vi vill veta även med en låg förklaring. Om vi till exempel genomför en studie där vi jämför ålder med närvaron av en specifik sjukdom, kan det hända att det finns en stark positiv korrelation mellan hur gammal och hur vanlig sjukdomen är. Med detta menar vi att även om det finns en korrelation mellan variablerna kan det finnas någon annan variabel som inte ingår i vår analys som förklarar varför våra variabler matchar.


  • vad är regression

  • Något som är viktigt att komma ihåg när vi gör korrelationsundersökningar är att bara för att det finns en korrelation mellan de variabler vi tittar på, finns det inget behov av att vara ett orsakssamband. Om den faktor du lägger till inte betyder något för lönen får du inte heller någon förklaringsökning. Den genomsnittliga längden på svenska barn i scatterdiagrammet nedan har vi markerat den genomsnittliga längden på svarsvariabeln; längs Y-axeln för svenska barn i åldern år av den förklarande variabeln; längs X-axeln .

    Till exempel, för att få den mest exakta anpassningen, använder du sådana inbyggda funktioner för att göra den linjära regressionen som finns i många grafräknare. Ibland uppfattas förklaringsgraden som ett mått på modellens kvalitet, så en bra analysmodell bör ha en hög grad av förklaring. Dessutom finns det många saker i samhället som inte helt kan förklaras av specifika faktorer.

    I det här fallet, som vårt exempel i början av avsnittet, där det inte verkar finnas någon positiv eller negativ korrelation mellan variablerna, står det att det inte finns någon korrelation, och då kan vi dra slutsatsen att det inte finns någon koppling mellan vilken månad det är och och och hur många människor är på plattformen. Men då gör du det för lätt.

    The most common form of regression analysis is linear regression, in which one finds the line (or a more complex linear combination) that most closely fits the data according to a specific mathematical criterion

    Att förklara till exempel 30 procent är ett ganska anständigt värde. Vi kan dock inte bara dra slutsatsen att det var hög ålder som orsakade sjukdomen, eftersom det kan finnas andra faktorer som spelar in, såsom levnadsvanor, förekomsten av andra sjukdomar, dieter i början av livet etc. Så vi letar efter en linje som våra markerade punkter skiljer sig så lite som möjligt.

    Hur bra eller dåliga våra faktorer förklarar skillnaderna som vi kan mäta i antal. Då ökar graden av förklaring.