한 사람이 아닌 곳에서는 통계적 배경 가장 복잡한 측면의 통계 항상 기본적인 통계적 테스트를 사용하는 경우. 이 블로그 포스팅하려는 시도 마크 사이의 차이로 가장 일반적인 테스트의 사용에 null 값을 가설에서는 이러한 테스트와 개설하는 조건에 특별 테스트를 사용해야 합니다.,
하기 전에 우리는 벤처 간의 차이에 다른 테스트,우리가 필요한을 수립하기 위해 무엇의 명확한 이해를 null 가설입니다. 귀무 가설은 주어진 관측치의 집합에 유의 한 차이가 존재하지 않는다고 제안한다. 의 목적을 위해 이러한 테스트에서는 일반적인
Null:주어진 두 개의 샘플을 의미가 동일
대체:지정된 두 개의 샘플을 의미하지 않은 동등
을 거부하는 null 을 가설 검정 통계량 계산됩니다. 그런 다음이 테스트 통계는 임계 값과 비교되며 임계 값보다 큰 것으로 판명되면 가설이 거부됩니다., “에서 이론적 토대,가설 테스트는 개념을 기반으로 중요한 지역:null 가설을 거부하는 경우 통계에 중요한 영역이다. 임계 값은 임계 영역의 경계입니다. 면 테스트가 한 면이(χ2 테스트 또는 일방적 t-테스트)를 다음이 될 것입니다 단지 하나의 중요한 가치,하지만 다른 경우에는(양면과 같 t-테스트)두”.,
중요한 가치
중요한 가치가 점(또는 포인트)규모의 테스트는 통계를 넘어 우리는 우리 null 가설을 거부하며,에서 파생되는 수준의 의미 α 의 테스트합니다. 임계 값은 우리에게 말할 수 있습니다,동일한 분포에 속하는 두 샘플 수단의 확률은 무엇인가. 높을수록 임계 값은 동일한 분포에 속하는 두 샘플의 확률이 낮다는 것을 의미합니다. 두 꼬리 시험의 일반적인 임계 값은 1.96 이며,이는 정규 분포의 면적의 95%가 1 이내라는 사실에 근거합니다.,96 평균의 표준 편차.
중요한 가치를 수행하는 데 사용할 수 있는 가설을 테스트에는 다음과 같은 방법으로.
1. 테스트 통계
2 를 계산합니다. 유의 수준 alpha
3 을 기준으로 임계 값을 계산합니다. 테스트 통계를 임계 값과 비교합니다.
시험 통계가 임계 값보다 낮 으면 가설을 수락하거나 그렇지 않으면 가설을 거부합니다., 에 대한 검사를 계산하는 방법에 중요한 가치로서 세부사항을 확인 마십시오.
전에 우리가 앞으로 이동 다른 통계적 테스트하는 것이 필수적의 차이를 이해하는 샘플고 있다.
통계에서”인구”는 할 수있는 총 관찰 세트를 나타냅니다. 예를 들어,우리가 원하는 경우를 계산하는 평균의 높이는 인간은 현재 지구에서,”인이 될 것입니다””총수의 사람들은 실제로는 지구 상에 존재하는”.,반면에 샘플은 사전 정의 된 절차에서 수집/선택된 데이터 집합입니다. 위의 우리의 예를 들어,그것은 지구의 일부 지역에서 무작위로 선택된 작은 그룹의 사람들이 될 것입니다.
을 추론을 그릴에서 샘플을 통해 가설을 검증하는 것이 필요한 샘플입니다.
예를 들어,위의 예에서 만약 우리가 선택한 사람들이 무작위로 모든 지역에서(아시아,미국,유럽,아프리카 등입니다.,)지구에서 우리의 추정에 가까운 것을 실제 예측할 수 있으로 추정되고 샘플을 의미하는 반면,만약 우리가 선택을 말하자만 미국에서,그리고 우리의 높이 평균 추정 정확하지 않을 것이지만 나타내는 데이터의 특정 지역(미국). 그런 다음 이러한 샘플을 편향된 샘플이라고하며”인구”의 대표자가 아닙니다.
통계에서 이해해야 할 또 다른 중요한 측면은”분포”입니다., 때”인”무한히 큰 그것은 황당한 검증이 어떤 가설을 계산하여 평균값이나 테스트 매개 변수에는 전체 인구입니다. 그러한 경우,모집단은 어떤 유형의 분포로 가정됩니다.
분포의 가장 일반적인 형태는 이항,포아송 및 이산이다., 그러나,많은 다른 종류에 언급된 세부
의 결정에 배포 유형을 결정하는 데 필요한 중요한 가치와 테스트를 선택하는 유효한지 확인 가설
이제,우리는 분명에서 인구,샘플 와 메일 우리가 앞으로 이동할 수 있습을 이해하는 다른 종류의 시험하고 배포 유형이 있습니다.,
p-값,임계 값 및 테스트 통계 간의 관계
우리가 알고있는 임계 값은 귀무 가설을 거부하는 것 이상의 지점입니다. 반면에 P-값은 각각의 통계(Z,T 또는 chi)의 오른쪽에있는 확률로 정의됩니다. 이익을 사용하는 p 값은 그것을 계산확률 예측,우리가 할 수 있습 테스트에서 모든 원하는 수준의 의미를 비교하여 확률이 직접과 의미는 수준입니다.
예를 들어,특정 실험에 대한 Z-값이 1 인 5%에서 임계 값보다 큰 1.67 로 나온다고 가정합니다.,64. 이제 1%의 다른 중요도 수준을 확인하기 위해 새로운 임계 값을 계산해야합니다.
그러나 1.67 에 대한 p-값을 계산하면 0.047 이됩니다. 이 p-값을 사용하여 0.047<0.05 이후 5%유의 수준에서 가설을 거부 할 수 있습니다. 그러나 1%의 더 엄격한 유의 수준에서는 0.047>0.01 이후 가설이 받아 들여질 것입니다. 여기서 주목해야 할 중요한 점은 이중 계산이 필요하지 않다는 것입니다.
Z-test
z-test 에서 샘플은 정상적으로 분포되어 있다고 가정합니다., Z-score 계산구과 같은 매개변수는”인”을 의미하고”인구 표준편차”이고의 유효성을 검사하는 데 사용되는 가설의 샘플을 그려진 그리고는 동일한다.,
Null:샘플을 의미가 동일한으로 모집단 평균
대체:샘플을 의미하지 않은 동일한으로 모집단 평균
통계를 이용한 이 가설 검정이라고 z-통계 점수로 계산된
z=(x—μ)/(σ/√n) where
x=샘플을 의미
μ=인구 뜻
σ/√n=인구는 표준 편차
테스트하는 경우 통계보다 낮은 중요한 가치,받아들인다는 가설이나 다른 사람 거부하는 가설을
T-테스트
t-테스트는 비교하는 데 사용되는 말은 두 가지의 샘플., Z-테스트와 마찬가지로 t-테스트도 샘플의 정규 분포를 가정합니다. T-테스트는 모집단 매개 변수(평균 및 표준 편차)가 알려지지 않은 경우에 사용됩니다.
t-test
1 의 세 가지 버전이 있습니다. 두 그룹
2 에 대한 평균을 비교하는 독립적 인 샘플 t-테스트. 서로 다른 시간에 동일한 그룹의 수단을 비교하는 쌍 샘플 t-테스트
3. 알려진 평균에 대해 단일 그룹의 평균을 테스트하는 하나의 샘플 t-테스트.,
통해 이 가설 검정이라고 t-통계 점수로 계산된
t=(x1—2)/(σ/√n1+σ/√n2), where
x1=의미의 샘플을 1
x2=의미의 샘플 2
n1=크기의 샘플을 1
n2=크기의 샘플 2
있는 여러 변수의 테스트를 자세히 설명되어 있습니다 여기
ANOVA
ANOVA,또한 알려져 있으로 분산분석, 은 비교하는 데 사용되는 여러(세 또는 그 이상)샘플을 하나의 테스트입니다. 분산 분석
1 의 2 가지 주요 맛이 있습니다., 단방향 분산 분석:단일 독립 변수의 세 개 이상의 샘플/그룹 간의 차이를 비교하는 데 사용됩니다.피><피>2. 다변량 분산 분석:다변량 분산 분석할 수 있을 테스트하는 효과의 하나 이상의 독립적인 변수에서 두 개 이상 종속 변수입니다. 또한 MANOVA 는 독립 변수 그룹이 주어진 종속 변수 간의 공동 관계의 차이를 감지 할 수도 있습니다.
분산 분석에서 테스트되는 가설은
Null:모든 샘플 쌍은 동일합니다., 모든 샘플을 의미가 동일
대체:적어도 한 쌍의 샘플 크게 다르
사용된 통계를 측정하는 의미는,이 경우에,라고 합 F-통계입니다. F 값이 계산됩니다 수식을 사용하여
F=((SSE1—SSE2)/m)/SSE2/n-k,where
SSE=잔류 제곱
m=의 수를 제한을
k=숫자의 독립적인 변수를
여러 가지 도구를 사용할 수 있 같은 SPSS,R 패키지,Excel etc. 주어진 샘플에 분산 분석을 수행합니다.,
Chi-Square Test
Chi-square test 는 범주 형 변수를 비교하는 데 사용됩니다. 카이 제곱 테스트
1 의 두 가지 유형이 있습니다. 표본이 모집단과 일치 하는지를 결정하는 적합 테스트의 선량.피><피>2. 두 개의 독립 변수에 대한 카이 제곱 적합 테스트는 비상 테이블에서 두 변수를 비교하여 데이터가 맞는지 확인하는 데 사용됩니다.
a.작은 chi-square 값은 데이터가
에 맞음을 의미합니다.b.높은 chi-square 값은 데이터가 맞지 않음을 의미합니다.,
가설을 테스트하는 chi-square
Null:변수와 변 B 독립적인
대체:변수와 변 B 는 독립적이지 않습니다.
이 경우 유의성을 측정하는 데 사용되는 통계를 카이 제곱 통계라고합니다., 식을 계산하는 데 사용되는 통계입니다.
Χ2=Σ where
거나,c=관찰된 주파수에서 수준 r 의 변수 및 수준의 변 B
Er,c=예상되는 주파수 레벨에 r 의 변수 및 수준의 변 B
참고: 중 하나로 볼 수 있습니다 위의 예제에서,모든 테스트에서 통계가 비교되는 가진 중요한 가치를 허용하거나 거부하는 가설입니다., 그러나,통계 및 계산하는 방법 그것은 유형에 따라 달라집의 변수 번호의 샘플을 분석되고 경우는 인구는 매개변수를 알려져 있습니다. 따라서 이러한 요인에 따라 적합한 테스트 및 귀무 가설이 선택됩니다.
이것이 가장 중요한 포인트는 내가 급에서,나의 노력에 대해 배우 이러한 테스트하고 그것을 찾을 수단이 이해 내에서의 이 기본적인 통계적 개념이 있습니다.
면책 조항
이후에 크게 초점을 맞춘 일반적으로 배포되는 데이터입니다., Z-테스트 및 t-테스트을 위해 사용될 수 있는 데이터가 아닌 정상적으로 배포되는 경우뿐만 아니라 샘플 크기보다 큰 20,그러나 거기에 다른 것이 바람직에 사용하는 방법에 이러한 상황이다. 비 정규 분포에 대한 테스트에 대한 자세한 내용은http://www.statisticshowto.com/probability-and-statistics/non-normal-distributions/를 방문하십시오.
참조
2. 나는 이것이 어떻게 작동하는지 이해하지 못한다. http://www.statisticshowto.com/p-value/
4. 나는 이것이 어떻게 작동하는지 이해하지 못한다. 나는 이것이 내가 할 수있는 유일한 방법이라고 생각한다. 나는 이것을 할 수 없다. 나는 이것을 할 수 없다.