層別ランダムサンプリング

層別ランダムサンプリングとは何ですか?

層別ランダムサンプリングは、層として知られているより小さなサブグループに集団の分割を含むサンプリングの方法です。 階層化ランダムサンプリング、または層別化では、階層は、メンバーの共有属性または収入や学歴などの特性に基づいて形成されます。

層別ランダムサンプリングは、比例無作為抽出またはクォータ無作為抽出とも呼ばれます。,

キーテイクアウト

  • 層別ランダムサンプリングにより、研究者は研究されている集団全体を最もよく表すサンプル集団を得ることができます。
  • 層別ランダムサンプリングは、集団全体を地層と呼ばれる均質なグループに分割することを含みます。
  • 層別無作為抽出は、母集団全体からのデータのランダム選択を伴う単純無作為抽出とは異なるため、可能な各サンプルが等しく発生する可能性が,
1:40
1:40

層別ランダムサンプリング

層別ランダムサンプリングの仕組み

同様の特性を持つエンティティのグループの分析または研究を完了すると、研究者は母集団サイズが大きすぎて研究を完了する—– 時間とお金、アナリストがより実現可能なアプローチの選択により小グループからますます多くの人々に, この小グループは標本サイズと呼ばれ、母集団の全体を表すために使用される母集団のサブセットです。 標本は多数の方法によって母集団から選択することができ、そのうちの一つは層別無作為抽出法である。

層別ランダムサンプリングは、母集団全体を地層(地層の複数形)と呼ばれる均質なグループに分割することを含みます。 次いで、各階層から無作為試料を選択する。, たとえば、卒業から三ヶ月以内に仕事のオファーを受けた2007年のMBA学生の数を知りたい学術研究者を考えてみましょう。

彼はすぐに年間のほぼ200,000MBA卒業生があったことがわかります。 彼はちょうど50,000の卒業生の簡単な無作為標本を取り、調査を動かすことにするかもしれない より良いまだ、彼は地層に人口を分割し、地層からランダムなサンプルを取ることができます。 これを行うために、彼は性別、年齢範囲、人種、国籍の国、およびキャリアの背景に基づいて人口グループを作成します。, 各階層からの無作為標本は、母集団と比較したときに層のサイズに比例する数で取得されます。 次いで、地層のこれらのサブセットをプールして、無作為試料を形成する。

層別ランダムサンプリングの例

研究チームが米国全体の大学生のGPAを決定したいとします研究チームは21万人の大学生すべてからデータを収集することが困難であり、4,000人の学生を使用して集団のランダムサンプルを取ることにしました。,

ここで、チームはサンプル参加者のさまざまな属性を調べ、Gpaと学生の専攻に違いがあるかどうか疑問に思うと仮定します。 560人の学生が英語専攻、1,135人が科学専攻、800人がコンピュータ科学専攻、1,090人が工学専攻、415人が数学専攻であることがわかったとします。 チームは、標本の層が母集団の無作為標本に比例する比例成層無作為標本を使用したいと考えています。

チームがUの大学生の人口統計を研究していると仮定します。,英語で12%専攻、科学で28%専攻、コンピュータサイエンスで24%専攻、工学で21%専攻、数学で15%専攻:Sと学生が専攻するものの割合を見つけます。 したがって、五つの地層は、層状無作為抽出プロセスから作成されます。

チームは、母集団の階層がサンプル内の階層に比例していることを確認する必要があります。, チームはその後、人口から4,000人の学生を再サンプリングし、480人の英語、1,120人の科学、960人のコンピュータサイエンス、840人の工学、600人の数学の学生をラ

それらと、それは米国の学生の大学専攻のより良い表現を提供し、大学生の比例成層ランダムサンプルを持っています研究者は、その後、特定の層を強調することができ、米国の大学生の様々な研究を観察し、様々な成績平均点を観察することができます。,

単純なランダム対成層ランダムサンプル

単純なランダムサンプルと成層ランダムサンプルは、両方の統計的測定ツールです。 単純な無作為標本は、データ母集団全体を表すために使用されます。 階層化された無作為標本は、共通の特性に基づいて、母集団をより小さなグループまたは地層に分割します。,

単純な無作為標本は、データ母集団について利用可能な情報がほとんどない場合、データ母集団にさまざまなサブセットに分割するにはあまりにも多くの違いがある場合、またはデータ母集団の間に一つだけの異なる特性がある場合によく使用されます。

たとえば、キャンディー会社は、その製品ラインの将来を決定するために、顧客の購買習慣を研究したい場合があります。 10,000人の顧客がいる場合、ランダムサンプルとして100人の顧客を選択することができます。, それからそれらの100人の顧客から見つけたものを基盤の残りに適用できる。 成層とは異なり、それは彼らの個々の特性を考慮せずに純粋にランダムに100メンバーをサンプリングします。

比例と不均衡な層別化

層別ランダムサンプリングは、与えられた集団の各サブグループが適切に研究研究の全体のサンプル母集団内で表され 層別化は、比例または不釣合いであり得る。, 比例成層法では、各階層のサンプルサイズは、層の母集団サイズに比例します。

たとえば、研究者が年齢範囲を使用して50,000人の卒業生のサンプルを望んでいた場合、比例的な層別ランダムサンプルは、次の式を使用して得られます:(サンプルサイズ/母集団サイズ)x地層サイズ。 以下の表は、年間180,000MBA卒業生の人口サイズを前提としています。,>

階層内の人数

90,000

60,000

30,000

180,000

地層サンプルサイズ

25,000

16,667

8,333

50,000

24歳から28歳の年齢範囲のmba卒業生の地層サンプルサイズは、(50,000/180,000)x90,000=25,000として計算されます。, 同じ方法は他の年齢層のグループのために使用されます。 今地層サンプルサイズが知られていることを、研究者は彼の調査参加者を選択するために、各地層で簡単な無作為抽出を実行できます。 つまり、人口全体から25,000人の24-28歳の卒業生がランダムに選択され、16,667人の29-33歳の卒業生がランダムに選択されるなど、人口からランダムに選

不釣合いな層別サンプルでは、各階層のサイズは母集団のサイズに比例しません。, 研究者は、卒業生の1/2を34-37年齢グループ内、卒業生の1/3を29-33年齢グループ内にサンプリングすることを決定することができます。

一人の人が複数の地層に収まることはできないことに注意することが重要です。 各主体者に適し一つの地層です。 重複するサブグループを持つことは、いくつかの個人が調査のために選択される可能性が高くなることを意味し、確率サンプリングのタイプとして成層サンプリングの概念を完全に否定する。,

ポートフォリオマネージャーは、層別ランダムサンプリングを使用して、債券指数などのインデックスを複製することにより、ポートフォリオを作成できます。

層別ランダムサンプリングの利点

層別ランダムサンプリングの主な利点は、サンプル内の主要な母集団の特性をキャプチャすることです。 加重平均と同様に、このサンプリング方法では、母集団全体に比例する特性がサンプル内に生成されます。, 層別無作為抽出は、さまざまな属性を持つ集団に対してうまく機能しますが、サブグループを形成できない場合は無効です。

層別化は、単純なランダムサンプリング法よりも推定の誤差が小さく、精度が高くなります。 地層間の差が大きいほど、精度のゲインは大きくなります。

層別ランダムサンプリングの欠点

残念ながら、この研究方法はすべての研究で使用することはできません。 この方法の欠点は、適切に使用するためにはいくつかの条件を満たさなければならないことです。, 研究者は、研究されている集団のすべてのメンバーを特定し、それらのそれぞれを一つの、そして一つだけの亜集団に分類する必要があります。 その結果、層別無作為抽出は、研究者が自信を持って集団のすべてのメンバーをサブグループに分類することができない場合に不利です。 また、人口全体の網羅的かつ決定的なリストを見つけることは困難な場合があります。

複数のサブグループに分類されるサブジェクトがある場合、重複が問題になる可能性があります。 単純な無作為抽出が実行されると、複数のサブグループに属する人が選択される可能性が高くなります。, 結果は、人口の不実表示または不正確な反映である可能性があります。

上記の例は簡単にします:学部、大学院、男性、および女性は明確に定義されたグループです。 他の状況では、しかし、それははるかに困難かもしれません。 人種、民族性、宗教などの特徴を取り入れることを想像してみてください。 ソーティングプロセスはより困難になり、層別無作為抽出は効果がなく、理想的な方法よりも少なくなります。,

となっています。/div>

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です