Päätöspuun ja satunnaisen metsän välinen ero

Sisällysluettelo:

Anonim

The tärkein ero Päätöspuun ja satunnaisen metsän välillä on se päätöspuu on kaavio, joka käyttää haarautumismenetelmää havainnollistamaan päätöksen kaikkia mahdollisia tuloksia, kun taas satunnainen metsä on joukko päätöspuita, jotka antavat lopullisen tuloksen kaikkien sen päätöspuiden tulosten perusteella.

Koneoppiminen on tekoälyn sovellus, joka antaa järjestelmälle mahdollisuuden oppia ja kehittyä aiempien kokemusten perusteella. Päätöspuu ja satunnainen metsä ovat kaksi tekniikkaa koneoppimisessa. Päätöspuu kartoittaa useiden asiaan liittyvien valintojen mahdolliset tulokset. Se on suosittu, koska se on yksinkertainen ja helpompi ymmärtää. Kun tietojoukosta tulee paljon suurempi, yksi päätöspuu ei riitä ennusteen löytämiseen. Satunnainen metsä, joka on päätöspuiden kokoelma, on vaihtoehto tälle ongelmalle. Satunnaisen metsän tuotos perustuu kaikkien sen päätöspuiden tuotoksiin.

Päätöspuu, koneoppiminen, satunnainen metsä

Mikä on päätöspuu

Päätöspuu on puun muotokaavio, jota käytetään määrittämään toimintatapa. Jokainen puun haara edustaa mahdollista päätöstä, tapahtumaa tai reaktiota.

Päätöspuuhun liittyy useita termejä. Entropia on tietojoukon arvaamattomuuden mitta. Tietojoukon jakamisen jälkeen entropiataso laskee, kun arvaamattomuus pienenee. Tiedon saanti on entropian väheneminen tietojoukon sylkemisen jälkeen. On tärkeää jakaa tiedot siten, että tiedon saanti kasvaa. Lopullisia päätöksiä tai luokituksia kutsutaan lehtisolmuiksi. Ylintä tai pääsolmua kutsutaan juurisolmuksi. Aineistoa tulee jakaa, kunnes lopullinen entropia muuttuu nollaksi.

Yksinkertainen päätöspuu on seuraava.

Kuva 1: Päätöspuu

Päätöspuu luokittelee joukon hedelmiä. On 4 viinirypäleitä, 2 omenaa ja 2 appelsiinia. Kun halkaisija on alle 5, rypäleet luokitellaan toiselle puolelle ja appelsiinit ja omenat toiselle puolelle. Rypäleitä ei voida luokitella pidemmälle, koska niillä ei ole entropiaa. Kun luokitellaan värin perusteella eli onko hedelmä punainen punainen vai ei, omenat luokitellaan toiselle puolelle ja appelsiinit toiselle puolelle. Siten tämä päätöspuu luokittelee omenan, rypäleen tai appelsiinin 100% tarkkuudella.

Kaiken kaikkiaan päätöspuu on yksinkertainen ymmärtää, helpompi tulkita ja visualisoida. Se ei vaadi paljon tietojen valmistelua. Se voi käsitellä sekä numeerista että kategorista tietoa. Toisaalta datan melu voi aiheuttaa ylikuormitusta. Lisäksi malli voi muuttua epävakaaksi pienistä vaihteluista johtuen.

Mikä on Random Forest

Satunnaismetsä on menetelmä, joka toimii rakentamalla useita päätöspuita koulutusvaiheen aikana. Suurimman osan puiden päätökset ovat satunnaisen metsän lopullinen päätös. Yksinkertainen esimerkki on seuraava.

Oletetaan, että on olemassa joukko hedelmiä (kirsikat, omenat ja appelsiinit). Seuraavassa on kolme päätöspuuta, jotka luokittelevat nämä kolme hedelmätyyppiä.

Kuva 2: Päätöspuu 1

Kuva 3: Päätöspuu 2

Kuva 4: Päätöspuu 3

Mallille annetaan uusi hedelmä, jonka halkaisija on 3. Tämä hedelmä on oranssinvärinen ja kasvaa kesällä. Ensimmäinen päätöspuu luokittelee sen oranssiksi. Toinen päätöspuu luokittelee sen kirsikoksi ja kolmas päätöspuu oranssiksi. Kun otetaan huomioon kaikki kolme puuta, oranssille on kaksi lähtöä. Siksi satunnaisen metsän lopputulos on oranssi.

Kaiken kaikkiaan satunnainen metsä tarjoaa tarkkoja tuloksia suuremmalla tietojoukolla. Se myös vähentää ylikuumenemisen riskiä.

Päätöspuun ja satunnaisen metsän välinen ero

Määritelmä

Päätöspuu on päätöksenteon tukityökalu, joka käyttää puumaista kaaviota tai päätösten mallia ja niiden mahdollisia seurauksia, mukaan lukien satunnaiset tapahtumatulokset, resurssikustannukset ja hyödyllisyys. Satunnaiset metsät on kokonaisoppimismenetelmä, joka toimii rakentamalla lukuisia päätöspuita harjoitusaikana ja tuottamalla luokka yksittäisten puiden mukaan.

Yliasennus

Päätöspuussa voi olla liikaa. Useiden puiden käyttö satunnaisessa metsässä vähentää ylikuumenemisen riskiä.

Tarkkuus

Satunnainen metsä antaa tarkempia tuloksia kuin päätöspuu.

Monimutkaisuus

Päätöspuu on yksinkertaisempi ja helpompi ymmärtää, tulkita ja visualisoida kuin satunnainen metsä, joka on suhteellisen monimutkainen.

Johtopäätös

Ero päätöspuun ja satunnaisen metsän välillä on se, että päätöspuu on kaavio, joka käyttää haarautumismenetelmää havainnollistamaan päätöksen kaikkia mahdollisia tuloksia, kun taas satunnainen metsä on joukko päätöspuita, jotka antavat lopullisen tuloksen kaikkien tulosten perusteella sen päätöspuita.

Viite:

1. Satunnainen metsäalgoritmi - Satunnainen metsä selitetty | Random Forest in Machine Learning, Simplilearn, 12.3.2018, saatavana täältä.

Päätöspuun ja satunnaisen metsän välinen ero