Ero lineaarisen regression ja logistisen regression välillä

Sisällysluettelo:

Anonim

The tärkein ero lineaarisen regression ja logistisen regression välillä on, että lineaarista regressiota käytetään ennustamaan jatkuvaa arvoa, kun taas logistista regressiota käytetään ennustamaan diskreetti arvo.

Koneoppimisjärjestelmät voivat ennustaa tulevia tuloksia menneiden panosten koulutuksen perusteella. Koneoppimista on kahta päätyyppiä, nimeltään valvottu oppiminen ja valvomaton oppiminen. Regressio ja luokittelu kuuluvat valvotun oppimisen alaan, kun taas klusterointi kuuluu ilman valvontaa tapahtuvaan oppimiseen. Valvotut oppimisalgoritmit käyttävät merkittyjä tietoja tietojoukon kouluttamiseen. Lineaarinen regressio ja logistinen regressio ovat kahdenlaisia ​​valvottuja oppimisalgoritmeja. Lineaarista regressiota käytetään, kun riippuva muuttuja on jatkuva ja malli on lineaarinen. Logistista regressiota käytetään, kun riippuvainen muuttuja on diskreetti ja malli on epälineaarinen.

Lineaarinen regressio, logistinen regressio, koneoppiminen

Mikä on lineaarinen regressio

Lineaarinen regressio löytää riippumattomien ja riippuvaisten muuttujien välisen suhteen. Molemmat ovat vierekkäisiä. Riippumaton muuttuja on muuttuja, jota muut muuttujat eivät muuta. Se on merkitty x: llä. Riippumattomia muuttujia voi olla myös useita, kuten x1, x2, x3 jne. Riippuva muuttuja muuttuu riippumattoman muuttujan mukaan ja on merkitty y: llä.

Kun on yksi riippumaton muuttuja, regressioyhtälö on seuraava.

y = b0+ b1x

Oletetaan esimerkiksi, että x edustaa sadetta ja y edustaa satoa.

Kuva 1: Lineaarinen regressio

Tietojoukko näyttää yllä olevalta. Sitten valitaan viiva, joka peittää suurimman osan datapisteistä. Tämä rivi edustaa ennustettuja arvoja.

Kuva 2: Etäisyys todellisten datapisteiden ja ennustettujen arvojen välillä

Sitten etäisyys kustakin datapisteestä viivaan löydetään yllä olevan kaavion mukaisesti. Tämä on etäisyys todellisen arvon ja ennustetun arvon välillä. Tämä etäisyys tunnetaan myös virheenä tai jäännöksinä. Parhaiten sopivalla rivillä pitäisi olla pienin virheiden neliösumma. Kun uusi sademäärä on annettu (x), on mahdollista löytää vastaava sato (y) tällä rivillä.

Todellisessa maailmassa voi olla useita riippumattomia muuttujia (x1, x2, x3…). Tätä kutsutaan moninkertaiseksi lineaariseksi regressioksi. Moninkertainen lineaarinen regressioyhtälö on seuraava.

Mikä on logistinen regressio

Logistista regressiota voidaan käyttää kahden luokan luokitteluun. Se tunnetaan myös nimellä binaarinen luokittelu. Muita esimerkkejä logistisesta regressiosta on tarkistaa, onko sähköposti roskapostia vai ei, ennustaa asiakas, ostaakö tuote tuotteen vai ei.

Kuva 3: Logistinen regressio

Oletetaan, että tuntimäärä, jonka opiskelija opiskeli päivässä, on riippumaton muuttuja. Sen mukaan lasketaan kokeen läpäisemisen todennäköisyys. Arvoa 0,5 pidettiin kynnyksenä. Kun uusi tuntimäärä on annettu, tämän kaavion avulla on mahdollista löytää vastaava todennäköisyys kokeen läpäisemiseen. Jos todennäköisyys on yli 0,5, sitä pidetään 1 tai hyväksyttävänä. Jos todennäköisyys on alle 0,5, sen katsotaan olevan 0 tai epäonnistunut.

Lineaarisen regressioyhtälön soveltaminen sigmoidifunktioon antaa logistisen regressioyhtälön.

Sigmoidifunktio on

Toinen tärkeä huomioitava asia on, että logistinen regressio soveltuu vain kahden luokan luokitteluun. Sitä ei käytetä moniluokkaisessa luokittelussa.

Ero lineaarisen regression ja logistisen regression välillä

Määritelmä

Lineaarinen regressio on lineaarinen lähestymistapa, jossa mallinnetaan riippuvaisen muuttujan ja yhden tai useamman riippumattoman muuttujan välinen suhde. Sitä vastoin logistinen regressio on tilastollinen malli, joka ennustaa lopputuloksen todennäköisyyden, jolla voi olla vain kaksi arvoa.

Käyttö

Lineaarista regressiota käytetään regressio -ongelmien ratkaisemiseen, mutta logistista regressiota käytetään luokitusongelmien (binääriluokitus) ratkaisemiseen.

Metodologia

Lineaarinen regressio arvioi riippuvaisen muuttujan, kun riippumaton muuttuja muuttuu. Logistinen regressio laskee tapahtuman mahdollisuuden. Tämä on yksi tärkeä ero lineaarisen regression ja logistisen regression välillä.

Lähtöarvo

Myös lineaarisessa regressiossa lähtöarvo on jatkuva. Logistisessa regressiossa lähtöarvo on diskreetti.

Malli

Vaikka lineaarinen regressio käyttää suoraa, logistinen regressio käyttää S -käyrää tai sigmoidifunktiota, tämä on toinen tärkeä ero lineaarisen regression ja logistisen regression välillä.

Esimerkkejä

Maan BKT: n ennustaminen, tuotteen hinnan ennustaminen, asunnon myyntihinnan ennustaminen, piste -ennuste ovat esimerkkejä lineaarisesta regressiosta. Ennustaminen siitä, onko sähköposti roskapostia vai ei, ennustaminen siitä, onko luottokorttitapahtuma petos vai ei, ennustaminen, ottaako asiakas lainan vai ei, ovat esimerkkejä logistisesta regressiosta.

Johtopäätös

Ero lineaarisen regression ja logistisen regression välillä on se, että lineaarista regressiota käytetään ennustamaan jatkuvaa arvoa, kun taas logistista regressiota käytetään ennustamaan diskreetti arvo. Lyhyesti sanottuna lineaarista regressiota käytetään regressioon, kun taas logistista regressiota käytetään luokitteluun.

Viite:

1. Lineaarinen regressioanalyysi | Lineaarinen regressio Pythonissa | Koneoppimisalgoritmit | Simplilearn, 26. maaliskuuta 2018, saatavana täältä. Logistinen regressio | Logistinen regressio Pythonissa | Koneoppimisalgoritmit | Simplilearn, 22.3.2018, saatavilla täältä.

Kuva:

1. ”Lineaarinen regressio”, Sewaqu - Oma työ, Public Domain) Commons Wikimedia2: n kautta. ”Residuals for Linear Regression Fit”, Thomas.haslwanter-Oma työ (CC BY-SA 3.0) Commons Wikimedia3: n kautta. "Logistic-curve", Qef (keskustelu)-Luotu tyhjästä gnuplotilla (Public Domain) Commons Wikimedian kautta

Ero lineaarisen regression ja logistisen regression välillä