Zavaros mátrix a gépi tanulásban az EXAMPLE-vel

Mi az a Confusion Matrix?

A zavarmátrix egy teljesítménymérési technika a gépi tanulási osztályozáshoz. Ez egyfajta táblázat, amely segít megismerni az osztályozási modell teljesítményét egy tesztadatok halmazán, amelyhez ismerjük a valódi értékeket. Maga a zavaros mátrix kifejezés nagyon egyszerű, de a kapcsolódó terminológiája kissé zavaró lehet. Az alábbiakban néhány egyszerű magyarázatot adunk ehhez a technikához.

A zavaros mátrix négy eredménye

A zavaros mátrix a tényleges és az előre jelzett osztályok összehasonlításával jeleníti meg az osztályozó pontosságát. A bináris összetévesztési mátrix négyzetekből áll:

Zavar táblázat
Zavar táblázat
  • TP: True Positive: A megjósolt értékek helyesen jósolva tényleges pozitívnak
  • FP: A becsült értékek hibásan jósoltak tényleges pozitívat. azaz a negatív értékeket pozitívnak jósolták
  • FN: Hamis negatív: A pozitív értékek negatívnak jósolhatók
  • TN: True Negative: A becsült értékek tényleges negatívként jósolva helyesen

Ki tudja számolni a pontossági teszt a zavaros mátrixból:

A zűrzavar mátrixának négy eredménye

Példa a zavart mátrixra

A Confusion Matrix egy hasznos gépi tanulási módszer, amely lehetővé teszi a visszahívás, a pontosság, a pontosság és az AUC-ROC görbe mérését. Az alábbiakban bemutatunk egy példát az Igaz pozitív, az Igaz negatív, a Hamis negatív és az Igaz negatív kifejezések megismerésére.

Igazi pozitív:

Pozitívat vetítettél előre, és ez igaznak bizonyult. Például azt jósolta, hogy Franciaország megnyeri a világbajnokságot, és ő nyert.

Igazi negatív:

Amikor negatívat jósoltál, és ez igaz. Megjósoltad, hogy Anglia nem fog nyerni, és veszített.

Álpozitív:

Jóslata pozitív, és hamis.

Azt jósoltad, hogy Anglia nyer, de veszített.

Hamis negatív:

Az Ön előrejelzése negatív, és az eredménye is hamis.

Azt jósoltad, hogy Franciaország nem fog nyerni, de győzött.

Ne feledje, hogy az előre jelzett értékeket igaznak vagy hamisnak vagy pozitívnak és negatívnak írjuk le.

Hogyan számítsunk ki egy zavaros mátrixot

Itt lépésről lépésre bemutatjuk a zavaros mátrix kiszámításának folyamatát adatbányászat

  • 1. lépés) Először is tesztelnie kell az adatkészletet a várható eredményértékekkel.
  • 2. lépés) Jósolja meg a tesztadatkészlet összes sorát.
  • 3. lépés) Számítsa ki a várható előrejelzéseket és eredményeket:
  1. Az egyes osztályok helyes előrejelzéseinek összessége.
  2. Az egyes osztályok hibás előrejelzéseinek összessége.

Ezt követően ezeket a számokat az alábbi módszerek szerint rendezzük:

  • A mátrix minden sora egy előre jelzett osztályhoz kapcsolódik.
  • A mátrix minden oszlopa egy aktuális osztálynak felel meg.
  • A helyes és hibás besorolások összesített száma bekerül a táblázatba.
  • Az osztályra vonatkozó helyes előrejelzések összege az adott osztályérték előrejelzett oszlopába és várt sorába kerül.
  • Az osztályra vonatkozó hibás előrejelzések összege az adott osztályérték várt sorába és az adott osztályérték előrejelzett oszlopába kerül.

Egyéb fontos kifejezések a Confusion mátrix használatával

  • Pozitív prediktív érték (PVV): Ez nagyon közel áll a pontossághoz. Az egyik jelentős különbség a két kifejezés között az, hogy a PVV a prevalenciát veszi figyelembe. Abban a helyzetben, amikor az osztályok tökéletesen kiegyensúlyozottak, a pozitív prediktív érték megegyezik a pontossággal.
  • Null hibaarány: Ez a kifejezés annak meghatározására szolgál, hogy az előrejelzés hányszor hibás, ha meg tudja jósolni a többségi osztályt. Tekintheti alapmutatónak az osztályozó összehasonlításához.
  • F pontszám: Az F1 pontszám a valódi pozitív (visszahívás) és a pontosság súlyozott átlaga.
  • Roc görbe: A Roc görbe a valódi pozitív arányokat mutatja a hamis pozitív arány ellenében különböző vágási pontokban. Ez is kompromisszumot mutat az érzékenység (visszahívás és specifitás vagy a valódi negatív arány) között.
  • Pontosság: A precíziós metrika a pozitív osztály pontosságát mutatja. Azt méri, hogy a pozitív osztály előrejelzése mennyire valószínű.

Egyéb fontos kifejezések a Confusion Matrix használatával

A maximális pontszám 1, ha az osztályozó az összes pozitív értéket tökéletesen osztályozza. A pontosság önmagában nem nagyon hasznos, mert figyelmen kívül hagyja a negatív osztályt. A metrika általában a visszahívási metrikával párosul. A visszahívást érzékenységnek vagy valódi pozitív aránynak is nevezik.

  • Érzékenység: Az érzékenység a helyesen észlelt pozitív osztályok arányát számítja ki. Ez a mérőszám megmutatja, hogy a modell mennyire alkalmas egy pozitív osztály felismerésére.

Egyéb fontos kifejezések a Confusion Matrix használatával

Miért van szüksége Confusion mátrixra?

Íme a zavaros mátrix használatának előnyei/előnyei.

  • Megmutatja, hogy bármely osztályozási modell mennyire összezavarodik, amikor előrejelzéseket készít.
  • A zavaros mátrix nemcsak az osztályozó által elkövetett hibákba nyújt betekintést, hanem az elkövetett hibák típusaiba is.
  • Ez a lebontás segít leküzdeni az osztályozási pontosság önmagában való használatának korlátait.
  • A konfúziós mátrix minden oszlopa az adott osztály példányait reprezentálja.
  • A zavaros mátrix minden sora az aktuális osztály példányait reprezentálja.
  • Betekintést nyújt nemcsak az osztályozó által elkövetett hibákba, hanem az elkövetett hibákba is.

Napi Guru99 hírlevél

Kezdje a napját a legfrissebb és legfontosabb mesterséges intelligenciával kapcsolatos hírekkel, amelyeket azonnal kézbesítünk.