Jotkut poikkeamat ovat selvästi mahdottomia . Mainitset 48 kg vauvan painosta. Tämä on selvästi virhe. Se ei ole tilastollinen kysymys, se on aineellinen asia. Ihmisvauvoja ei ole 48 kg. Mikä tahansa tilastollinen menetelmä tunnistaa tällaisen pisteen.
Henkilökohtaisesti sen sijaan, että luotan mihinkään testiin (jopa sopiviin testeihin, kuten @Michael suositteli), kuvaan tiedot graafisesti. Sen osoittaminen, että tietty data-arvo (tai arvot) on epätodennäköistä joissakin oletetuissa jakaumissa, ei tarkoita, että arvo on väärä, ja siksi arvoja ei pitäisi poistaa automaattisesti vain siksi, että ne ovat äärimmäisiä.
Lisäksi ehdottamasi sääntö (2 SD keskiarvosta) on vanha sääntö, jota käytettiin päivinä ennen kuin tietokoneet tekivät asioista helppoja. Jos N on 100 000, niin odotat varmasti melkoisen arvon, joka on yli 2 SD keskiarvosta, vaikka normaali jakauma olisi täydellinen.
Mutta entä jos jakelu on väärä? Oletetaan, että populaatiossa kyseinen muuttuja ei ole normaalijakautunut, mutta sillä on painavammat hännät?