A hétköznapi beszédben az átlagos fogalmát általában valami egészen megszokottra, tipikusra, nem kiemelkedőre vagy kirívóra használjuk. Bizonyos esetekben akár negatív értelemben, csalódásunk kifejezésére is használhatjuk, hogy jelezzük, hogy valami nem volt túl jó vagy nagy durranás, lehetett volna jobb is. Ezalatt mégsem azt értjük, hogy valami rossz volt, hanem inkább azt, hogy semleges.

A matematikában és statisztikában azonban a különböző átlagértékek alapvető fontosságúak az adatok elemzésében. Ezért is érdemes ismerni az alapvető statisztikai mutatókat, például a számtani közép (átlag), a medián és a módusz számítását, valamint azt is, hogy mikor melyiket érdemes használni, és milyen előnyeik vagy korlátaik lehetnek.
Mit értünk az átlagértékek alatt a matekban?
A matematikában és a statisztikában az átlag rendkívül hasznos, és semmiféle olyan másodlagos jelentéssel sem rendelkezik, amit a hétköznapi beszédben ez a kifejezés jelenthet. A matematikai átlagokat az adathalmazok elemzésére használják, amellyel lényegében több értéket összegeznek egy értékben, hogy jobban értelmezhessék és megértsék, hogy mit jelent az adott adatsor, számsor.
A számtani átlag, medián és módusz mind más szemszögből közelíti meg az átlag fogalmát, ezért a vizsgált adattípusoktól és a céloktól függően más-más módszer lehet a legalkalmasabb arra, hogy a legvalósághűbb képet kapjuk.
Ha bárhol elakadnál, a Superprof oldalán egy magán matektanárral mindenféle matematikai fogalomról mélyrehatóan tanulhatsz!
Az ilyen matek korrepetálás segíthet a nehézségek leküzdésében.
Átlagszámítás képletek: három alapvető statisztikai mutató
A számtani közép vagy átlag, a medián és a módusz a leíró statisztika alapvető mutatói, amelyek mindegyike más-más eredményt adna ugyanarra a számhalmazra, és ez így van rendjén. Valójában a különböző típusú átlagok előnye, hogy különböző típusú adatokhoz és különböző célokra használhatjuk őket.
Ha bárhol elakadnál, a Superprof oldalán egy magán matektanárral mindenféle matematikai fogalomról mélyrehatóan tanulhatsz!
Mi az átlag?
A matematikában az átlag alatt a számtani (aritmetikai) középet értjük. Jelölése A, és úgy találhatjuk meg, hogy az adathalmazban lévő számokat összeadjuk, majd a kapott értéket elosztjuk annyival, ahány számot összeadtunk, vagyis:
- átlag = adatok összege/adatok száma
Vegyük például Melbourne legmagasabb hőmérsékleteit a héten (az írás időpontjában): 32, 24, 18, 19, 17, 17 és 18. A heti átlaghőmérséklet kiszámításához a következőket kell tennünk:
Először is össze kell adnunk ezeket a számokat, ami 145.
Ezután ki kell számolnunk, hogy hány értéket adtunk össze. Mivel a hét minden napjára vettünk egy értéket, így 7 számot adtunk össze.
Utolsó lépésként a 145-öt elosztjuk 7-tel, aminek az eredmény 20,71432.
A feladatokban általában megadják, hogy hány tizedesjegyig kell számolni, de ha mégsem, akkor két tizedesjegyig ajánlott az osztást elvégezni. Mivel az eredeti értékek egész számok voltak (fokra kerekítve), az eredményünket is érdemes ugyanúgy kerekíteni, hogy illeszkedjen a többi adat formátumához.
Ezek alapján a hét legmagasabb átlaghőmérséklete 21 fok volt. Ha megnézed a számokat, úgy érezheted, hogy ez valahogy így van, és ha ez lenne a hét bármelyik napjának legmagasabb hőmérséklete, akkor nem éreznéd szokatlannak.
Az átlag előnyei
Az átlagszámításnak több előnyei is van. Egyrészt minden értéket figyelembe vesz és felhasznál, így biztosítva, hogy minden érték hatással volt a végeredményre. Emellett egyszerű és könnyen használható, különösen kisebb adathalmazok esetén. Nagyobb adatsorozatokkal is jól működik, de ilyenkor már érdemes táblázatkezelőt használni.
Bizonyos típusú elemzésekben az átlagszámítás lehet a legalkalmasabb, mert a számított érték bármelyik két szám között lehet, így pontosabb és részletesebb képet adhat az adatainkról. Ezzel szemben a medián és a módusz csak a meglévő értékek vagy azok középértékei lehetnek. Az átlag lényegében lekerekíti a széleket olyan adatsorok esetében, amelyekben néhány kiugró érték van. Láthattad, hogy a példánkban volt egy különösen meleg nap (32 fok), de az átlag még így is 11 fokkal hűvösebb volt ennél.

Az átlag hátrányai
Az utolsó mondatunkban jól látható, hogy bár az átlagszámítás hasznos, hátrányai is vannak. Azáltal, hogy segített csökkenteni a kiugró értékek hatását, még mindig érzékeny ezekre, és befolyásolták az összképet. Ha azt a különösen forró napot eltávolítanánk, az átlagunk 18,83, vagy kerekítve 19 fokra esne vissza.
Az átlag a numerikus adatokon kívül nem igazán hasznos. Továbbá az átlagot befolyásolja az is, hogy milyen mértékegységet használunk: ha a hőmérsékleteket Fahrenheitban számítjuk, az átlag 72 °F (22 °C) lesz, míg Celsiusban 20,7 °C. A mértékegység váltása tehát az átlag értékét is megváltoztatja, hogy helyesen tükrözze az átváltási képlettel számolt értéket.
Mi a módusz?
A módusz (Mo) alatt a számhalmazban legtöbbször előforduló számot, vagyis az adatsorban legnagyobb gyakoriságú értéket értjük. A melbourne-i időjárásnál maradva a hét napjain 32, 24, 18, 19, 17, 17 és 18 fokot mértek. Mivel csak 7 számot vizsgálunk, a módusz gyorsan, bármiféle bonyodalom nélkül kiszámítható.
A módusz 17, mivel kétszer szerepel a halmazban, míg minden más szám csak egyszer fordul elő. A módusz alapján az átlagunk tehát 17, ami 4 fokkal tér el a számtani középtől. A módusz többféle eredményt is adhat, és nem feltétlenül egymáshoz közeli számokat.
A módusz előnyei
A számtani átlaghoz hasonlóan a módusznak is vannak előnyei és hátrányai. Ami mellette szól, az az, hogy valószínűleg az egyik legkönnyebben és leggyorsabban kiszámítható statisztikai mutató, mivel csak a különböző értékeket kell megszámolni. Bár ez nagy adathalmazok esetén időigényes lehet, néhány számmal bonyolult képletek és számológép nélkül is elvégezhető.
Hasznos továbbá bizonyos adathalmazok esetében, ahol a számtani átlag és medián hátrányaiból kifolyólag értelmetlenné vagy haszontalanná válnának az adatok. A móduszra kevésbé hatnak a kiugró, szélsőséges értékek is. Példánkból jól látszik, hogy nem lenne különbség, ha a 32 fokos nap 35, 40 vagy akár 50 fokos lenne, mert a módusz akkor is 17 lenne.

A módusz nemcsak numerikus adatokra alkalmazható, és hasznos lehet válaszok, szavazatok vagy más kategóriák, például színek és típusok keresésében is egy listából. A módusz tehát különösen jól alkalmazható a statisztikában a nem számszerű adatok esetében, amellyel meghatározhatjuk a tendenciákat az olyan adathalmazokban, amelyek több különböző pont körül csoportosulnak.
A módusz hátrányai
Ahogy a példánkból könnyedén kikövetkeztethetők a módusz előnyei, úgy a hátrányai is szemmel láthatók. A példánk alapján mindössze 2 eset kellett ahhoz, hogy a módusz 17 legyen. Ebből – tévesen – arra következtethetnénk, hogy ha a számsorban több különböző érték szerepel, akkor egy értékre gyorsan móduszként tekinthetünk, ha már csak pár alkalommal is ismétlődik.
Tegyük fel, hogy az egész év legmagasabb hőmérsékleteit vesszük, és szinte minden nap más volt a hőmérséklet, kivéve néhány napot, amikor a legmagasabb hőmérséklet 40 fok volt. Ha túl sok az eltérő érték, és csak néhány szélsőséges nap (például 40 fok) volt, akkor a módusz és az átlag sem lenne különösen hasznos, ha azt akarnánk megtudni, hogy milyen ruhákat csomagoljunk. Ilyenkor érdemes lehet a mediánnal kalkulálni!
Mi a medián?
A medián egy adatsor középértékét jelenti, amelynek kiszámítása nagyon egyszerű. Csak annyit kell tennünk hozzá, hogy nagyság szerint rendszerezzük a számokat, és megnézzük, hogy melyik szám található a halmaz közepén. Ez lesz a medián.
A melbourne-i időjárásnál maradva 7 értékünk van: 32, 24, 18, 19, 17, 17 és 18. Értékeinket sorrendbe helyezve a következőt kapjuk:
- 17, 17, 18, 18, 19, 24, 32
Láthatjuk, hogy a középső értékünk a negyedik szám, amellyel a medián = 18. Páros számú értékkel rendelkező adatsorok esetén a két középső érték átlagát kell venni. Ha az adatsoron belül nincs nagy eltérés, akkor a számtani átlag és a medián is közeli értékeket mutatnak.
A medián előnyei
A móduszhoz hasonlóan a mediánt sem befolyásolják különösebben a szélsőséges értékek. Még ha a két legmelegebb nap kétszer olyan forró is lenne, a mediánunk akkor is 18 lenne. Ha az adatok eloszlása nem túl egyenletes, a mediánt kell használni a nagyon magas vagy nagyon alacsony értékek hatásának csökkentésére. Míg az átlag ilyen esetben torzulhat, a medián reális képet ad az eloszlás középpontjáról.

A mediánt gyakran használják olyan dolgok átlagának kiszámításához, mint az átlagfizetések, a lakásárak és más olyan adatok, amelyeket a szupergazdagok befolyásolnának. Ha az ausztrálok átlagfizetését vennénk példának, akkor egy maroknyi milliárdos és milliomos (akiknek a fizetése nagyságrendekkel nagyobb, mint az átlagos ausztráloké) azt a benyomást keltené, hogy az ausztrálok a ténylegesnél sokkal többet keresnek.
A medián hátrányai
A medián azzal a problémával jár, hogy technikailag nem használja fel az összes adatot, és ha olyan átlagot szeretnénk, amely minden értéket tükröz, függetlenül attól, hogy az mennyire szélsőséges, akkor nem a medián lesz a legalkalmasabb.
A medián az átlaggal szemben kevésbé pontos lehet széles tartományú adathalmazokban, mert csak a középső értéket veszi figyelembe, nem pedig az adatpontok közötti lehetséges értékeket. Ha az adatok eloszlása nagyon egyenlőtlen, a medián nagy ugrást okozhat az átlaghoz képest, mivel csak egyetlen értékre fókuszál, míg az átlag minden adatpontot figyelembe vesz. Ez nem jelentett túl nagy problémát a mi kis 7 értéket tartalmazó adathalmazunkban, de nagyobb adathalmazok esetében már más lenne a helyzet.
Most, hogy már tudod, mi a módusz, medián és számtani átlag, képes leszel minden helyzetben a legmegfelelőbb statisztikai mutatót alkalmazni! Ha szeretnél többet megtudni vagy rendszeresen gyakorolni, a Superprof matektanárai segítenek jobban elmerülni a matek világában!
Emellett az online matematika lehetősége révén rugalmasan tanulhatsz az otthonod kényelméből.