계층화 된 무작위 표본 추출이란 무엇입니까?
층상의 임의 샘플링 방법의 샘플링을 포함하는 부문의 인구로 작은 하위 그룹으로 줄일 수 있습니다. 에서는 계층화된 무작위 샘플링,또는 계층,지층을 형성에 기반한 회원은’공유 속성이나 특성을 같은 수입 또는 교육 목적입니다.
층상의 임의 샘플링이라고도에 비례 무작위 샘플링 또는 할당량을 임의 샘플링입니다.,
키 테이크 아웃
- 층상의 임의 샘플링을 수 있는 연구자를 구하는 샘플 인구를 가장 잘 나타내는 전체 인구는 공부한다.
- 층화 된 무작위 샘플링은 전체 모집단을 지층이라고하는 균질 그룹으로 나누는 것을 포함합니다.
- 층상의 임의 샘플링에서 다릅니다 단순한 임의 샘플링을 포함하는 임의의 선택의 데이터에서는 전체 인구,그래서 가능한 각 샘플이 동등하게 발생할 가능성이 있습니다.,
층상의 임의 샘플링
어떻게 계층화의 임의 샘플링 작품
을 완료 할 때 분석이나 연구에의 그룹 엔과 유사한 특성을 연구 하는 것을 찾을 수 있습니다 인구의 크기가 너무 커서는 완료하는 연구이다. 시간을 절약하고,돈을 분석할 수 있습을에서 더 실현 가능한 접근 방식을 선택해 작은 그룹에 있습니다., 소그룹은 전체 모집단을 나타내는 데 사용되는 모집단의 하위 집합 인 표본 크기라고합니다. 샘플은 여러 가지 방법을 통해 모집단에서 선택 될 수 있으며,그 중 하나는 계층화 된 무작위 샘플링 방법입니다.
층화된 임의 샘플링을 포함한 나누어로 전체 인구 동일한 그룹이라는 계층(복수 위해 지층). 그런 다음 각 지층에서 무작위 샘플이 선택됩니다., 예를 들어,졸업 후 3 개월 이내에 취업 제안을받은 2007 년 MBA 학생 수를 알고 자하는 학술 연구원을 생각해보십시오.
그는 곧 그 해 동안 거의 20 만 MBA 졸업생이 있었다는 것을 알게 될 것입니다. 그는 단지 50,000 명의 졸업생의 간단한 무작위 표본을 채취하여 설문 조사를 실행하기로 결정할 수도 있습니다. 더 나은 여전히,그는 인구를 지층으로 나누고 지층에서 무작위 표본을 채취 할 수있었습니다. 이를 위해,그는 그들 인구에 따라 그룹별,연령,범위,인종,국적,경력 배경입니다., 각 지층의 무작위 표본은 모집단과 비교할 때 지층의 크기에 비례하는 숫자로 채취됩니다. 그런 다음 지층의 이러한 하위 집합이 풀링되어 무작위 샘플을 형성합니다.
예의 층 무작위 샘플링
정 연구 팀하는 외국 대학생에 걸쳐 미국 연구팀은 어려움에서 데이터를 수집하는 모든 21 백만명의 대학생들,그것을 결정하고 무작위 샘플의 인구를 사용하여 4,000 학생입니다.,
이제는 가정은 팀에서 보이는 서로 다른 특성의 샘플을 참가자에 불가사의하면 어떤 차이가 있는지를 알 수 있에서 gpa 들고 학생들의 전공. 가을 찾는 560 학생들은 영어를 전공,1,135 는 과학 전공,800 는 컴퓨터과학 전공,1,090 는 공학 전공,그리고 415 은 수학을 전공. 팀은 표본의 지층이 모집단의 무작위 표본에 비례하는 비례 층화 무작위 표본을 사용하려고합니다.
팀이 U 에서 대학생의 인구 통계를 연구한다고 가정합니다.,S 와 학생들이 전공하는 것의 비율을 찾습니다:영어 전공 12%,과학 전공 28%,컴퓨터 과학 전공 24%,공학 전공 21%,수학 전공 15%. 따라서 층화 된 무작위 표본 추출 과정에서 5 개의 지층이 생성됩니다.그런 다음 팀은 모집단의 지층이 표본의 지층에 비례하는지 확인해야합니다., 팀은 다음을 요구하는 재 샘플 4,000 에서 학생 인구와 무작위로 선택 480 영어,1,120 과학 960 컴퓨터 과학,840 엔지니어링,600 수학 학생입니다.
그는 비례 계층화의 임의 샘플의 대학생,제공하는 더 나은 표현의 학생들의 대학 전공에서는 미국 연구팀은 다음을 강조 표시 특정 계층을 관찰한 다양한 연구 결과는 미국 대학 학생들을 관찰한 다양한 학점 평균입니다.,
단순한 임의의 대 층상의 임의 샘플
단순한 임의의 샘플 및 계층화의 임의 샘플은 모두 통계적인 측정 도구입니다. 간단한 무작위 표본은 전체 데이터 모집단을 나타내는 데 사용됩니다. 계층화 된 무작위 표본은 모집단을 공유 된 특성에 따라 더 작은 그룹 또는 지층으로 나눕니다.,
단순한 임의의 샘플을 자주 사용할 때 아주 작은 정보에 대해 사용할 수 있는 데이터는 인구,데이터 인구는 지금까지도 많은 차이를 나누는 다양한 하위 집합,또는 하나만 있을 때 뚜렷한 특성 중에서 데이터 인구입니다.예를 들어,사탕 회사는 제품 라인의 미래를 결정하기 위해 고객의 구매 습관을 연구하기를 원할 수 있습니다. 10,000 명의 고객이있는 경우 해당 고객 중 100 명을 무작위 샘플로 선택할 수 있습니다., 그런 다음 그 100 명의 고객으로부터 찾은 것을 나머지 기지에 적용 할 수 있습니다. 계층화와는 달리,그것은 그들의 개별 특성에 대한 관계없이 순수하게 무작위로 100 명의 회원을 샘플링합니다.
비례 및 불균형 충화
층상의 임의 샘플링을 통해 각 하위 그룹의 특정 인구는 적당하게 표현에서는 전체 샘플의 인구 연구 연구이다. 층화는 비례하거나 불균형 할 수 있습니다., 비례 계층화 된 방법에서 각 지층의 표본 크기는 지층의 모집단 크기에 비례합니다.
경우,예를 들어,연구원이 원하는 샘플의 50,000 졸업자용 범위는 비례 계층화의 임의 샘플을 사용하여 얻은 이 수식:(샘플 크기/구 크기)x 계층 크기입니다. 아래 표는 연간 180,000MBA 졸업생의 인구 규모를 가정합니다.,>
번호에서 사람들의 지층
90,000
60,000
30,000
180,000
지층 샘플 크기
25,000
16,667
8,333
50,000
지층 샘플 크기 MBA 졸업생 나이 범위에서의 24 28 살이로 계산됩(50,000/180,000) x90,000=25,000., 다른 연령대 그룹에서도 동일한 방법이 사용됩니다. 지금은 지층 샘플 크기는 알려진 연구원할 수 있는 간단한 무작위 샘플링을 수행하는 각 계층을 선택하려면 그의 설문조사 참가자가 있습니다. 다시 말해서,25,000 졸업 24-28 연령 그룹에서 무작위로 선택된 전체 인구,16,667 졸업 29-33 나이 범위를 선택됩에서 인구,무작위로 그리고.
불균형 층화 샘플에서 각 지층의 크기는 모집단의 크기에 비례하지 않습니다., 연구원은 34-37 세 그룹 내의 졸업생의 1/2 과 29-33 세 그룹 내의 졸업생의 1/3 을 샘플링하기로 결정할 수 있습니다.한 사람이 여러 지층에 들어갈 수 없다는 점에 유의해야합니다. 각 엔티티는 하나의 지층에만 적합해야합니다. 데이 겹치는 부분군을 의미하는 어떤 사람들은 높은 선택의 기회를 위한 설문조사,이는 완전히 부정 개념의 계층화된 샘플링 형식으로 확률의 샘플링입니다.,
포트폴리오는 관리자를 사용할 수 있습 층상의 임의 샘플링을 만드는 포트폴리오를 복제하여 인덱스와 같이 채권의 인덱스입니다.
이점의 층 무작위 샘플링
의 주요 장점은 층의 임의 샘플링을 캡처하는 주요 인구적 특성에서 샘플입니다. 가중 평균과 유사하게,이 샘플링 방법은 전체 모집단에 비례하는 샘플의 특성을 생성합니다., 층상의 임의 샘플링에 대해 잘 작동 인구의 다양한 속성이 있지만 그렇지 않으면 효과가 없으면 하위 그룹을 형성 할 수 없습니다.
층화는 간단한 무작위 샘플링 방법보다 추정에서 더 작은 오차와 더 큰 정밀도를 제공합니다. 지층 간의 차이가 클수록 정밀도의 이득이 커집니다.
의 단점은 층의 임의 샘플링
불행하게도,이 방법이 연구에 사용할 수 없습니다 모든 연구이다. 이 방법의 단점은 적절하게 사용되기 위해서는 몇 가지 조건이 충족되어야한다는 것입니다., 연구원은 연구중인 인구의 모든 구성원을 확인하고 각 구성원을 하나의 하위 집단으로 분류해야합니다. 그 결과,계층화의 임의 샘플링을 불리한 경우 연구원은 할 수 없이 자신 있게 분류하는 모든 회원의 인구로군. 또한 전체 인구의 철저하고 확실한 목록을 찾는 것이 어려울 수 있습니다.
겹치기는 여러 하위 그룹에 속하는 주제가있는 경우 문제가 될 수 있습니다. 간단한 무작위 샘플링이 수행되면 여러 하위 그룹에있는 사람들이 선택 될 가능성이 더 큽니다., 결과는 인구의 허위 진술이나 부정확 한 반영 일 수 있습니다.
위의 예제는 쉽게 그것을 학부,대학원,남성과 여성이 명확하게 정의된 그룹이 있습니다. 그러나 다른 상황에서는 훨씬 더 어려울 수도 있습니다. 인종,민족 또는 종교와 같은 특성을 통합한다고 상상해보십시오. 정렬 프로세스가 더 어려워 지므로 계층화 된 무작위 샘플링을 효과가없고 이상적인 방법보다 적게 렌더링합니다.,