예를 들어 남자와 여자의 키를 비교한다면 가설을 '남자의 키가 클 것이다.'와 같이 세울 수 있습니다. 이처럼 가설을 세울 때 방향이 정해지는 것을 단측검정이라고 합니다. 이미 가설의 방향을 알고 있거나 혹은 편견을 가지고 있는(?) 상태에서 검증에 들어가는 겁니다.
반면에 같은 내용이라고 해도 '남녀 사이에 차이가 있을 것이다.'처럼 어느 쪽으로 방향을 정하지 않고 가설을 세울 때, 양측검정이라고 합니다.
위의 예에서 가설을 세울 때, 귀무가설은 "남녀의 차이가 없다" 가 되고, 대립가설은 "남자의 키가 크다"(단측검정), "남녀의 차이가 있다"(양측검정)가 됩니다.
다음에는 분석을 해야하는데, 이 때는 유의수준이라는 개념이 중요합니다. 유의수준(α)이란 제1종 오류(귀무가설이 사실일 때, 귀무가설이 기각할 확률)를 범할 확률이며 일반적으로 0.01, 0.05, 0.01 등이 사용되며, 일반적으로 사회과학에서는 0.05를 가장 많이 사용합니다. 님의 질문에 나온 "관례적 수준" 이란 아마도 0.05를 가리킨다고 생각됩니다. 사회과학 분야의 검정이라면 말입니다.
어떤 검정에서 α를 0.01에서 0.05로 낮춘다는 것은 귀무가설이 진실임에도 기각할 오류를 더 크게 합니다. 유의수준이 0에 가까울수록 귀무가설이 인정될 신뢰구간이 더 커지게 되며, 귀무가설이 사실인데도 불구하고 귀무가설이 기각될 가능성은 점점 더 줄어들게 됩니다. 따라서 연구의 목적과 성질에 따라서 적절한 유의수준을 결정하여야 한다.
유의수준이 결정되면 임계치를 구할 수 있는데, 임계치는 주어진 유의수준에서 귀무가설의 채택과 기각에 관한 의사결정을 할 경우, 그 기준이 되는 점으로 기각치라고도합니다. 검정결과가 단측 검정으로 분석한 경우에는 유의한 수준으로 나왔지만, 양측검정으로 분석한 경우에는 유의수준이 0.05보다 크게 나왔다는 말이 됩니다. 일반적으로 단측검정으로 검정하는 경우가 양측검정보다 훨씬 유의수준이 낮게 나오게 됩니다. 이미 방향을 알고 가설을 설정하기 때문입니다.
예를 들어, "어느 고등학교 한 반 학생들의 평균키가 175cm 보다 크다"고 가설을 세워서 단측검정을 하는 경우에는, "어느 고등학교 한 반 학생들의 평균키가 175cm과 차이가 있다(크거나 혹은 작다)"고 가설을 세워서 양측검정을 하는 경우와 계산되어지는 통계량은 같지만, 그 기각치가, 양측검정인 경우에는 단측검정인 경우보다 더 커지게 됩니다.
따라서, 경우에 따라서는 단측검정의 기각치보다는 크지만, 양측검정의 기각치보다는 작게 나올 수가 있습니다. 이 경우, 단측검정으로는 세워진 가설이 유의하게 나오지만, 양측검정을 사용한 검정의 경우는 세워진 가설이 유의하지 않게 나올 수가 있습니다. 이 말을 "양측 검정의 관례적 수준에는 이르지 못했지만 단측 검정에는 유의미했다." 고 말한다 . 많은 경우 연구결과들은 이렇게 그 차이가 확연하게 드러나지 않아서, 차이가 있다고 말하기가 어려운 경우가 많은데, 그럴 때마다 연구자들은 약간의 편견(?)을 가지고 단측검정을 사용하여 결과를 분석하고자 하는 유혹(?)에 빠지기 쉽습니다. 하지만, 많은 경우 단측검정보다는 양측검정을 사용하여 분석하는 것이 훨씬 중립적인 연구 방법입니다.
출처 : [스크랩] 양측검정과 단측검정
댓글 영역