Kódování a příprava dat pro analýzu

Mohlo by se vám líbit...

komentáře 2

  1. Anonymní napsal:

    Transformace dat
    Rozlišujeme znaky spojité a znaky diskrétní, s konečným počtem hodnot.Některé znaky s konečným počtem hodnot plní úlohu spojitých znaků, zejména pokud rozsah hodnot je velký a stupnice je dostatečně podrobná (výška postavy v cm, váha v kg, věk v letech apod.) je vhodné pro účely tabelací vyjádřit variantně v kategorizované podobě.
    V takovém případě definujeme nový znak s menším počtem hodnot, než měl původní, a stanovíme předpis jímž hodnotám ze zvolených intervalů původního znaku přiřadíme zvolené hodnoty nově konstruovaného znaku. Snažíme se přitom zachovat maximum možných relací, které v původním znaku platily.
    Kategorizaci můžeme provést:
    1. jmenovitým výčtem hodnot původního znaku
    2. častější způsob je stanovení spojitého intervalu jeho krajními body
    3. způsob je aritmetická operace zaokrouhlováním (pro celý definiční obor znaku je určeno pravidlo, jak transformovat hodnoty, zaokrouhlování nahoru/dolu) Obdobou tohoto způsobu je „ořezávání“ (truncation)
     konstrukce nového znaku z jediného znaku (pokud je původní rozložení znaku rozložení šikmé, volíme kvůli složitějším statistickým metodám transformaci, která umožní zhustit hodnoty na vzdálenější méně obsazeném konci stupnice a rozlišit četné hodnoty na opačném konci škály) [užitím logaritmické nebo logitové transformace]
     aritmetická transformace – konstrukce znaku ze skupiny znaků (sčítáním, odečítáním, násobením, dělením, umocňováním, odmocňováním, s hodnotami jednoho nebo více znaků ale i aritmet. či geometr. průměr…)
     součtová transformace(tvoříme nový znak, jehož hodnota vyjadřuje počet výskytů zvoleného kódu v baterii znaků, např. počet kladných odpovědí na množinu stejně strukturovaných otázek nebo počet správně zodpovězených otázek v testu)
     logická transformace (kombinace hodnot několika měřitelných, zjišťovaných znaků.

  2. Anonymní napsal:

    Práce s vynechávanými údaji
    V průběhu sběru dat, při kódování i ve fázi pořizování dat může dojít k řadě chyb. Najdeme-li chybu a není-li už možné nahradit chybný údaj údajem správným (nemáme ho už k dispozici), musíme nahradit chybějící hodnotu zvláštním kódem.. Takovéto kódy se pak vynechávají z analýzy a nazýváme je missing value. Obvykle se zadává 9, 99, 999. Pozor na to, že to nesmí být totožné s reálnou hodnotou, která se užívá v kódovacím klíči pro skutečné hodnoty. Někdy je žádoucí odlišoval chybějící hodnoty od neví, bez odpovědi. Těmto hodnotám můžeme například přidělit jiný kód (např. neví 97, bez odpovědi 98, chybějící hodnota; údaj nebyl vůbec vyplněn 99). Hodnotou missing value sdělujeme počítači, že danou statistickou jednotku má pro chybou zatížený znak vynechat z výpočtu koeficientu nebo z tabulky.
    Existuje i další důvod, proč chceme hodnoty vynechat z analýzy, přestože je hodnota znaku správně určena. Děje se tak z interpretačních důvodů. Např. chceme-li vynechat extrémní hodnocení nebo naopak zařadit do výpočtu respondenty, kteří se vyjádřili neurčitě. Takový to způsob vynechání z analýzy je pouze součástí definice úlohy a nemusí být trvalou součástí definice dat. Rozlišujeme tedy vynechávaná data na trvalevynechávaná a přechodněvynechávaná.

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *