www.all2know.com Google WWW All2know fi
  Etusivu Etusivu | Tietoja Tietoja 
  Navigaatio
» Etusivu
» Artikelkategorier
» Luettelo luetteloista
» Aakkosellinen hakemisto
» Kalenteri
» Arvottu artikkeli
» Muokkaa Aiheesta muualla
Viimeisimmät muutokset: 2007-11-05
  Tänne linkitetyt sivut 
Matematiikka
Taloustiede
Tiede
Astrologia
Tilasto
Trigonometria
Osmo Soininvaara
Tieteellinen menetelmä
Tilastokeskus
Todennäköisyys
Poissonin jakauma
Varianssi
Markovin piilomalli
Khii toiseen -jakauma
Histogrammi
Lineaarinen regressioanalyysi
Aikasarja-analyysi
Spatiaalinen tilastotiede
Bioinformatiikka
Merkkitesti
Suomalaisen filosofian historia
Ekonometria
Helsingin yliopiston matemaattis-luonnontieteellinen tiedekunta
R (ohjelmisto)
Paneeliaineisto
Korrelaatio
Koneoppiminen
Voynichin käsikirjoitus
Vektorianalyysi
Uskottavuusosamäärä
Instrumenttimuuttuja
Regressioanalyysi
Endogeeninen
Nollahypoteesi
Mittausvirhe
Satunnaisuus
William Edwards Deming
Kirjastotieteellis-bibliografinen luokittelu
Khii toiseen -testi
Leo Törnqvist
David Cox (tilastotieteilijä)
Karl Pearson
6 Sigma
Naistutkimus
Keskivirhe
F-jakauma
Lista linkeistä » Toivo T. Kaila
Lista linkeistä » Luotettavuustekniikka
Luettelo matemaattisista merkeistä
Vinous
Huipukkuus
Mars-ilmiö
Lista linkeistä » David Blackwell
C. R. Rao
  Muut kielet 
daStatistik
deStatistik
frStatistiques
noStatistikk
svStatistik
Luokka: Tilastotiede

Tilastotiede

Tilastotiede on matematiikkaa ja etenkin todennäköisyyslaskentana soveltava tiede, joka tarkastelee aineisto keräämistä, analysointia, tulkintaa sekä esitystä. Sitä sovelletaan hyvin monilla tieteen aloilla, joihin kuuluvat esimerkiksi luonnon-, yhteiskunta- ja humanistiset tieteet. Tilastollisella päättelyllä on tärkeä rooli tieteellisessä hypoteesintestauksessa.

Kun tilastotieteen menetelmiä käytetään aineiston esittämiseen, on kyse lähinnä kuvailevasta tilastotieteestä. Kun kuvailusta siirrytään aineiston tarkasteluun tai mallinnukseen siten, että aineiston epävarmuus ja havaintojen satunnaisuus otetaan huomioon, puhutaan tilastollisesta päättelystä. Näissä molemmissa tapauksissa on kyse soveltavasta tilastotieteestä. Matemaattinen tilastotiede keskittyy puolestaan tarkastelemaan tilastotieteen teoreettista perustaa.

1 Lähestymistapa
2 Menetelmiä
3 Tutkimusalueita
4 Ohjelmistoja
5 Katso myös

Lähestymistapa

Tilastotieteen soveltaminen tarkasteltavaan tieteelliseen, teolliseen tai yhteiskunnalliseen ongelmaan alkaa populaation määrittelyllä. Kyseessä voi olla jonkin maan väestö tai tehtaan valmistamat tuotteet. Toisaalta voidaan havainnoida aineistoa tuottava prosessi eri ajankohtina, jolloin kyseessä on aikasarja.

Aineistoa on tavallisesti mahdollista kerätä vain populaatio osajoukosta, jolloin tutkimuksen kohteena on otos. Otoksesta voidaan kerätä aineistoa joko havainnoiden tai kokeellisessa asetelmassa. Kun aineisto on kerätty, siitä tehtävä analyysi voidaan jakaa kuvailuun ja päättelyyn, jotka tosin liittyvät usein toisiinsa läheisesti:

  • Kuvaileva tilastollinen analyysi on aineiston esittämistä joko numeerisesti tai graafisesti. Tyypillisiä tunnuslukuja ovat keskiarvo ja keskihajonta. Histogrammi on taas esimerkki tilastollisesta kuvaajasta.
  • Tilastollinen päättely on aineiston mallintamista, satunnaisuuden huomioon ottamista sekä aineistosta saatujen tuloksien yleistämistä populaatioon. Päättelyyn kuuluu muun muassa tilastollinen hypoteesin testaus, parametrien estimointiiden, korrelaatio tarkastelu sekä regressioanalyysi.

Tilastotieteessä on tärkeää tehdä ero kausaliteetin ja korrelaation välillä. Kausaliteetti eli syy-seuraussuhde tarkoittaa tilastollisessa yhteydessä, että yhden muuttujan arvosta seuraa toisen muuttujan arvo. Kahden muuttujan välinen korrelaatio taas tarkoittaa, että niiden arvot vaihtelevat yhdessä aineistossa, mutta kausaliteetin suuntaan ei oteta kantaa. Esimerkiksi tulojen ja eliniän tutkimus voi osoittaa, että köyhät elävät rikkaita pidempään. Tällöin tulot ja elinikä ovat aineistossa korreloituneita. Tästä ei voida kuitenkaan johtaa kausaalisuhdetta, jonka mukaan varallisuus lisäisi elinikää. Korrelaatio voi syntyä kolmannen havaitsemattoman muuttujan vaikutuksesta, joka saattaisi olla esimerkiksi terveyspalveluiden saatavuus.

Jos tarkasteltava otos on edustava eli kuvaa populaatiota, voidaan tilastollinen päättely laajentaa otoksesta koko populaatioon. Keskeinen ongelma on se, missä määrin otos on edustava. Tilastotieteen menetelmät mahdollistavat satunnaisvaihtelun huomioimisen, joka syntyy otoksen keräämisestä eli otannasta. Toisaalta koesuunnittelun teoria tarkastelee kontrolloitujen kokeiden suorittamista.

Menetelmiä

Aineisto kerätään kiinnostuksen kohteena olevasta populaatiosta otantamenetelmän avulla. Satunnaisotannassa kullakin populaation jäsenellä on sama todennäköisyys tulla poimituksi. Ennen aineiston käsittelyä on tiedettävä, millä mitta-asteikolla kukin havainto on mitattu. Havaintojen perusteella pyritään tekemään päätelmiä kiinnostuksen kohteena olevan muuttujan jakaumasta .

Frekvenssi kertoo kuinka monta havaintoa on annetussa havaintoluokassa.

Aineistoa kuvailevia tunnuslukuja

Sijainnin tunnuslukuja eli keskilukuja:

Vaihtelun tunnuslukuja: Riippuvuuden tunnuslukuja:

Tilastollisia testejä

Tilastollisilla testeillä testataan tunnusluvuille tai parametreille asetettuja hypoteeseja. Testisuure lasketaan olettaen nollahypoteesin olevan totta. Jos aineiston perusteella laskettu tunnusluku poikkeaa nollahypoteesista ja aineiston vaihtelu on riittävän pientä suhteessa otoksen kokoon, nollahypoteesi voidaan hylätä valitulla merkisevyystasolla. Vaihtoehtoisesti nollahypoteesi jää voimaan. Merkitsevyystaso kuvaa testin todennäköisyyttä hylätä nollahypoteesi virheellisesti. Testin voima on todennäköisyys millä nollahypoteesi hylätän kun vaihtoehtoinen hypotessi on tosi.

Otantamenetelmiä

Tutkimusalueita

Ohjelmistoja

Vapaita tilasto-ohjelmistoja:

  • R
  • GNU Octave

Kaupallisia tilasto-ohjelmistoja:

Katso myös

Tarjoaa Wikipedia, vapaa tietosanakirja. Aiheesta muualla. Kaikki teksti on saatavilla GNU Free Documentation License Aiheesta muualla.