2.12.4 Jak vytvořit histogram
Ing. Marek Laurenčík
Kdo už někdy zkoušel různé statistické výpočty, určitě se setkal s
pojmy jako četnost a histogram. Proto tedy ví, že existuje rozdíl mezi
sloupcovým grafem a histogramem. Mnoho lidí si oba grafy bohužel často plete.
Proč? Oba jsou přece sloupcové a na první pohled vypadají stejně. Ve
skutečnosti ale jednotlivé sloupce sloupcového grafu vykreslují obraz konkrétní
hodnoty z tabulky. To znamená, že vykreslují jedno číslo, které je přesně v
tabulce uvedeno.
Vykreslený histogram však ukazuje počet výskytů, četnost
jednotlivých hodnot v tabulce. Z toho je již vidět rozdíl, protože pokud se
hodnota v tabulce nachází, tak je ve sloupcovém grafu přesně její velikost
vykreslena. Naproti tomu v histogramu je vykresleno to, kolikrát se daná
hodnota v tabulce nachází. Tedy není vykreslena její velikost, ale počet
výskytů.
Histogram se tedy používá především ve statistických výpočtech,
které nejsou tak často využívány při běžné práci v MS Excelu, proto je tato
možnost schována v takzvaných Doplňcích.
Nahoru Jak je to s doplňky MS Excelu?
Podívejme se do nabídky Nástroje a prohlédněme si příkaz Doplňky. Jestliže na něj klepneme, zobrazí se dialogové okno, ve kterém
jsou různé doplňující funkce a nástroje tabulkového editoru MS Excel.
Standardně se při spuštění nenatahují do operační paměti. Pokud si
ale některé nástroje vybereme a označíme, do operační paměti se pro naši práci
načtou a připraví.
Zkusme označit položku Analytické nástroje a poté dialogové
okno potvrdit klepnutím na tlačítko OK. Pokud máme plnou instalaci MS
Office nebo možnost doinstalování při prvním použití, tak se v nabídce Nástroje zobrazí nová položka s názvem Analýza dat.
Po klepnutí na příkaz Analýza dat se zobrazí nabídka
jednotlivých nástrojů, které umožňují dělat také složitější statistické a
inženýrské analýzy dat. Spustíme je přímo výběrem v dialogovém okně Analýza
dat.
Pomocí vybraných statistických nebo inženýrských funkcí si můžeme
nechat zobrazit výsledky z různých měření nebo pozorování ve výstupních
tabulkách na listu MS Excelu. Některé algoritmy mají možnost i vykreslení grafů
(histogram, regrese,…).
Nahoru Proč použít histogram?
Představme si, že máme velké množství dat, která potřebujeme pro
lepší vyhodnocení rozdělit do skupin. Při dalším zpracování nás zajímá
především to, kolik lidí či výsledků měření v dané skupině je, to znamená, jak
je daná skupina významná v rámci celku.
A právě toto umí udělat nástroj Histogram. Umí prostě vaše
data rozdělit do skupin, kterým se ve statistice říká třídy četnosti. Můžeme si
to představit tak, že si program naše údaje prohlédne a pak rozdělí do skupin,
ke kterým napíše také počet jednotlivých výskytů. Hranice skupin můžeme nechat
navrhnout programem nebo si je předem sami připravíme. Nástroj Histogram také umí vykreslit klasický histogram v grafu, případně i tříděný (takzvané
pareto) a k tomu i kumulativní procentní podílový graf.
Nahoru Jak se zpracováním dat začít?
Představme si, že máme před sebou data z určitého průzkumu (příklad 2_12_4_histogram.xls). Jedna z
otázek se týkala i měsíčních nákladů za telefon (hovorné i SMS).
Můžeme hned vidět, že datový soubor obsahuje hodně položek a naším
úkolem je vypozorovat možné závislosti či některé statistické veličiny. Zajímá
nás například, jaká je částka, kterou lidé nejčastěji za hovory či SMS
zaplatí.
Při prvním zpracování si můžeme nechat navrhnout hranice programem,
proto si nyní již klepněme v nabídce Nástroje na příkaz Analýza
dat. V zobrazeném dialogovém okně označme volbu Histogram a vše
potvrďme klepnutím na tlačítko OK.
Zobrazí se nám nyní dialogové okno Histogram pro zadání
vlastních dat. To znamená, že je třeba určit nejenom vstupní a výstupní oblast,
ale i jiné potřebné informace, které výsledné zobrazení ovlivní.
Jak tedy správně vše doplnit? Do políčka Vstupní oblast je
třeba zadat odkaz na data, která se mají statisticky zpracovávat. Jestliže nás
právě…