무작위 변수. 이산확률변수 수학적 기대

– 신생아 10명 중 남아의 수.

이 숫자는 사전에 알려지지 않았으며 다음에 태어나는 10명의 자녀는 다음과 같습니다.

아니면 얘들아 - 단 하나뿐인나열된 옵션 중에서.

그리고 몸매를 유지하기 위해 약간의 체육 교육이 필요합니다.

– 멀리뛰기 거리 (일부 단위).

스포츠의 달인이라도 예측할 수는 없습니다 :)

그러나 당신의 가설은 무엇입니까?

2) 연속확률변수 – 수용 모두유한 또는 무한 간격의 수치 값.

메모 : 약어 DSV 및 NSV는 교육 문헌에서 인기가 있습니다.

먼저 이산확률변수를 분석해 보겠습니다. 마디 없는.

이산확률변수의 분포 법칙

- 이것 일치이 수량의 가능한 값과 확률 사이. 대부분의 경우 법은 표에 기록되어 있습니다.

이라는 용어가 꽤 자주 나오네요 분포, 그러나 어떤 상황에서는 모호하게 들리므로 "법"을 고수하겠습니다.

그리고 지금 매우 중요한 점: 랜덤 변수 이후 반드시받아들일 것이다 가치 중 하나, 해당 이벤트가 형성됩니다. 전체 그룹발생 확률의 합은 1과 같습니다.

또는 요약해서 쓰면:

예를 들어, 주사위에 굴린 포인트의 확률 분포 법칙은 다음과 같은 형식을 갖습니다.

댓글이 없습니다.

이산 확률 변수는 "좋은" 정수 값만 취할 수 있다는 인상을 받을 수 있습니다. 환상을 없애자. 무엇이든 될 수 있다:

실시예 1

일부 게임에는 다음과 같은 승리 분배 법칙이 있습니다.

...당신은 아마도 오랫동안 그런 일을 꿈꿔왔을 것입니다. :) 비밀을 알려드리겠습니다. 저도 마찬가지입니다. 특히 작업을 마친 후에는 장 이론.

해결책: 확률 변수는 세 가지 값 중 하나만 취할 수 있으므로 해당 이벤트는 다음과 같습니다. 전체 그룹, 이는 확률의 합이 1과 같음을 의미합니다.

"당파"를 폭로하다:

– 따라서 기존 유닛을 획득할 확률은 0.4입니다.

통제: 그것이 우리가 확인해야 했던 것입니다.

답변:

유통법을 직접 작성해야 하는 경우는 드문 일이 아닙니다. 이를 위해 그들은 사용합니다 확률의 고전적 정의, 사건 확률에 대한 곱셈/덧셈 정리그리고 다른 칩 테르베라:

실시예 2

상자에는 50장의 복권이 들어 있으며 그 중 12장이 당첨되고 그 중 2장은 각각 1000루블을 받고 나머지는 각각 100루블을 얻습니다. 무작위 변수의 분포에 대한 법칙, 즉 상자에서 하나의 티켓을 무작위로 뽑을 경우 상금의 크기를 작성합니다.

해결책: 아시다시피, 확률 변수의 값은 일반적으로 다음 위치에 배치됩니다. 오름차순으로. 따라서 우리는 가장 작은 상금, 즉 루블부터 시작합니다.

총 50장의 티켓이 있습니다(12 = 38). 고전적 정의:
– 무작위로 추첨된 티켓이 패자가 될 확률.

다른 경우에는 모든 것이 간단합니다. 루블을 획득할 확률은 다음과 같습니다.

확인: – 이것은 그러한 작업에서 특히 즐거운 순간입니다!

답변: 원하는 상금 분배 법칙:

다음 작업은 스스로 해결해야 합니다.

실시예 3

사수가 목표물에 맞을 확률은 입니다. 무작위 변수(2발 발사 후 안타 횟수)에 대한 분포 법칙을 작성합니다.

...당신이 그 사람을 그리워한다는 걸 알았습니다 :) 기억하자 곱셈과 덧셈 정리. 정답과 정답은 강의 마지막에 있습니다.

분포법칙은 확률변수를 완벽하게 설명하지만 실제로는 그 중 일부만 아는 것이 유용할 수 있습니다(때로는 더 유용할 수도 있음). 수치적 특성 .

이산확률변수의 기대

쉽게 말하면 이렇습니다 평균 기대값테스트가 여러 번 반복될 때. 확률변수가 확률로 값을 취하도록 하라 각기. 그러면 이 확률 변수의 수학적 기대값은 다음과 같습니다. 제품의 합계모든 값을 해당 확률로:

또는 축소됨:

예를 들어, 무작위 변수의 수학적 기대치(주사위에서 굴린 포인트 수)를 계산해 보겠습니다.

이제 가상의 게임을 기억해 봅시다.

질문이 생깁니다. 이 게임을 플레이하는 것이 전혀 수익성이 있습니까? ...누가 인상을 받았나요? 그러니 "직접"이라고 말할 수는 없습니다! 하지만 이 질문은 수학적 기대값을 계산하면 쉽게 답할 수 있습니다. 가중 평균당첨 확률:

따라서 이 게임의 수학적 기대값은 다음과 같습니다. 지는.

당신의 인상을 믿지 말고 숫자를 믿으세요!

예, 여기서는 10번, 심지어 20~30번 연속으로 승리할 수 있지만 장기적으로는 피할 수 없는 파멸이 우리를 기다리고 있습니다. 그리고 나는 당신에게 그런 게임을하라고 조언하지 않을 것입니다 :) 글쎄요, 아마도 재미로.

위의 모든 것에서 수학적 기대값은 더 이상 RANDOM 값이 아닙니다.

독립적인 연구를 위한 창의적 과제:

실시예 4

X씨는 다음 시스템을 사용하여 유럽식 룰렛을 플레이합니다. 그는 지속적으로 "빨간색"에 100루블을 베팅합니다. 무작위 변수의 분포 법칙, 즉 상금을 작성합니다. 승리에 대한 수학적 기대치를 계산하고 가장 가까운 코펙 단위로 반올림합니다. 얼마나 평균플레이어는 자신이 베팅한 100%마다 패배합니까?

참조 : 유럽식 룰렛에는 빨간색 18개, 검정색 18개, 녹색 1개(“제로”) 섹터가 있습니다. "빨간색"이 나타나면 플레이어는 베팅 금액의 두 배를 받고, 그렇지 않으면 카지노 수입으로 갑니다.

자신만의 확률 테이블을 만들 수 있는 다른 룰렛 시스템도 많이 있습니다. 그러나 이것은 플레이어의 수학적 기대치가 정확히 동일할 것이라는 것이 확실하게 확립되었기 때문에 분배 법칙이나 표가 필요하지 않은 경우입니다. 시스템마다 바뀌는 유일한 것은

이미 알려진 바와 같이, 분포 법칙은 확률변수의 특성을 완전히 나타냅니다. 그러나 유통 법칙을 알 수 없는 경우가 많아 더 적은 정보로 제한해야 하는 경우가 많습니다. 때때로 무작위 변수를 전체적으로 설명하는 숫자를 사용하는 것이 훨씬 더 수익성이 높습니다. 그런 숫자가 호출됩니다 확률변수의 수치적 특성.중요한 수치적 특성 중 하나는 수학적 기대입니다.

아래에 표시된 것처럼 수학적 기대값은 확률 변수의 평균값과 거의 같습니다. 많은 문제를 해결하려면 수학적 기대값을 아는 것만으로도 충분합니다. 예를 들어, 첫 번째 슈터가 득점한 점수에 대한 수학적 기대치가 두 번째 슈터의 점수보다 크다는 것이 알려진 경우, 첫 번째 슈터는 평균적으로 두 번째 슈터보다 더 많은 점수를 획득하므로 더 잘 슛합니다. 두 번째보다. 수학적 기대값은 확률 변수에 대한 분포 법칙보다 훨씬 적은 정보를 제공하지만, 수학적 기대값에 대한 지식은 위와 같은 문제 및 기타 여러 문제를 해결하는 데 충분합니다.

§ 2. 이산확률변수의 수학적 기대

수학적 기대이산 확률 변수는 가능한 모든 값과 확률의 곱의 합입니다.

랜덤 변수를 보자 엑스 값만 취할 수 있음 엑스 1 , 엑스 2 , ..., 엑스 , 그 확률은 각각 동일합니다. 아르 자형 1 , 아르 자형 2 , . . ., 아르 자형 . 그러면 수학적 기대값은 (엑스) 무작위 변수 엑스 평등에 의해 결정된다

(엑스) = 엑스 1 아르 자형 1 + 엑스 2 아르 자형 2 + … + 엑스 N N .

이산확률변수인 경우 엑스 셀 수 있는 가능한 값 세트를 취한 다음

(엑스)=

더욱이, 등식의 우변에 있는 계열이 절대적으로 수렴하는 경우 수학적 기대가 존재합니다.

논평. 정의에 따르면 이산 확률 변수의 수학적 기대값은 무작위가 아닌(상수) 양입니다. 이 설명은 나중에 여러 번 사용될 것이므로 기억해두는 것이 좋습니다. 연속확률변수의 수학적 기대값도 상수 값이라는 것은 나중에 설명하겠습니다.

예시 1.확률 변수의 수학적 기대값 찾기 엑스, 배포 법칙을 아는 것 :

해결책. 필요한 수학적 기대치는 무작위 변수의 가능한 모든 값과 확률의 곱의 합과 같습니다.

(엑스)= 3* 0, 1+ 5* 0, 6+ 2* 0, 3= 3, 9.

예시 2.사건 발생 횟수에 대한 수학적 기대값 찾기 한 번의 시행에서 사건의 확률이 동일 아르 자형.

해결책. 임의의 값 엑스 - 이벤트 발생 횟수 한 번의 테스트에서는 두 가지 값만 사용할 수 있습니다. 엑스 1 = 1 (이벤트 발생) 확률로 아르 자형그리고 엑스 2 = 0 (이벤트 발생하지 않음) 확률로 = 1 -아르 자형.필요한 수학적 기대

(엑스)= 1* + 0* =

그래서, 한 번의 시행에서 사건 발생 횟수에 대한 수학적 기대는 이 사건의 확률과 같습니다.이 결과는 아래에서 사용됩니다.

§ 3. 수학적 기대의 확률적 의미

생산되게 해주세요 무작위 변수가 포함된 테스트 엑스 수락됨 1 시간 가치 엑스 1 , 티 2 시간 가치 엑스 2 ,..., 케이 시간 가치 엑스 케이 , 그리고 1 + 2 + …+티 에게 = p.그런 다음 취해진 모든 값의 합계 엑스, 동일

엑스 1 1 + 엑스 2 2 + ... + 엑스 에게 에게 .

산술평균을 구해보자 무작위 변수가 허용하는 모든 값. 발견된 합계를 총 테스트 수로 나눕니다.

= (엑스 1 1 + 엑스 2 2 + ... + 엑스 에게 에게)/피,

= 엑스 1 ( 1 / N) + 엑스 2 ( 2 / N) + ... + 엑스 에게 ( 에게 /피). (*)

그 태도를 주목하면 1 / N- 상대 빈도 1 가치 엑스 1 , 2 / N - 상대 빈도 2 가치 엑스 2 등, 우리는 다음과 같이 관계(*)를 씁니다.

=엑스 1 1 + 엑스 2 2 + .. . + 엑스 에게 케이 . (**)

테스트 횟수가 상당히 많다고 가정해 보겠습니다. 그러면 상대 빈도는 사건이 발생할 확률과 거의 같습니다(이는 9장 § 6에서 입증됩니다).

1 1 , 2 2 , …, 케이 케이 .

상대 빈도를 관계 (**)의 해당 확률로 바꾸면 다음을 얻습니다.

엑스 1 1 + 엑스 2 아르 자형 2 + … + 엑스 에게 아르 자형 에게 .

이 근사 평등의 우변은 다음과 같습니다. (엑스). 그래서,

(엑스).

얻은 결과의 확률적 의미는 다음과 같습니다. 수학적 기대값은 대략 동일합니다.(정확할수록 테스트 횟수가 많아집니다) 랜덤 변수의 관측된 값의 산술 평균입니다.

비고 1. 수학적 기대값은 가능한 최소값보다 크고 최대값보다 작다는 것을 이해하기 쉽습니다. 즉, 수직선에서는 수학적 기대값의 왼쪽과 오른쪽에 가능한 값이 위치하게 됩니다. 이러한 의미에서 수학적 기대값은 분포 위치의 특징을 나타내므로 종종 다음과 같이 불립니다. 물류 창고.

이 용어는 역학에서 빌려온 것입니다. 아르 자형 1 , R 2 , ..., R 가로좌표 지점에 위치 엑스 1 , 엑스 2 , ..., 엑스 N, 그리고
그런 다음 무게 중심의 가로좌표

엑스 =
.

고려해 보면
=
(엑스) 그리고
우리는 얻는다 (엑스)= x 와 함께 .

따라서 수학적 기대치는 재료 점 시스템의 무게 중심의 가로좌표이며 가로좌표는 무작위 변수의 가능한 값과 같고 질량은 확률과 같습니다.

비고 2. "수학적 기대"라는 용어의 유래는 적용 범위가 도박으로 제한되었던 확률 이론 출현의 초기 기간(XVI - XVII 세기)과 관련이 있습니다. 플레이어는 예상 승리의 평균 값, 즉 승리에 대한 수학적 기대에 관심이 있었습니다.

기대값

분산전체 Ox 축에 속하는 가능한 값인 연속 확률 변수 X는 동등성에 의해 결정됩니다.

서비스의 목적. 온라인 계산기는 다음 중 하나에 해당하는 문제를 해결하도록 설계되었습니다. 분포 밀도 f(x) 또는 분포 함수 F(x)(예 참조). 일반적으로 이러한 작업에서는 다음을 찾아야 합니다. 수학적 기대, 표준 편차, 플롯 함수 f(x) 및 F(x).

지침. 소스 데이터 유형(분포 밀도 f(x) 또는 분포 함수 F(x))을 선택합니다.

분포 밀도 f(x)가 주어짐 분포 함수 F(x)가 주어짐

분포 밀도 f(x)는 다음과 같이 주어집니다.

분포 함수 F(x)는 다음과 같이 주어집니다.

연속 확률 변수는 확률 밀도로 지정됩니다.
(Rayleigh 분포 법칙 - 무선 공학에 사용됨). M(x) , D(x) 를 구합니다.

확률 변수 X가 호출됩니다. 마디 없는 , 분포 함수 F(X)=P(X인 경우)< x) непрерывна и имеет производную.
연속 확률 변수의 분포 함수는 주어진 간격에 속하는 확률 변수의 확률을 계산하는 데 사용됩니다.
피(α< X < β)=F(β) - F(α)
또한 연속 확률 변수의 경우 해당 경계가 이 구간에 포함되는지 여부는 중요하지 않습니다.
피(α< X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
분포 밀도 연속확률변수를 함수라고 부른다.
f(x)=F'(x) , 분포 함수의 미분.

분포 밀도의 특성

1. 확률변수의 분포밀도는 x의 모든 값에 대해 음수가 아니다(f(x) ≥ 0).
2. 정규화 조건:

정규화 조건의 기하학적 의미: 분포 밀도 곡선 아래의 면적은 1과 같습니다.
3. 확률 변수 X가 α에서 β까지의 구간에 포함될 확률은 다음 공식을 사용하여 계산할 수 있습니다.

기하학적으로 연속확률변수 X가 구간 (α, β)에 들어갈 확률은 이 구간을 기준으로 한 분포밀도곡선 아래의 곡선사다리꼴의 면적과 같습니다.
4. 분포함수는 밀도로 표현하면 다음과 같다.

x 지점의 분포 밀도 값은 이 값을 받아들일 확률과 같지 않습니다. 연속 확률 변수의 경우 주어진 구간에 포함될 확률에 대해서만 이야기할 수 있습니다. 급수가 절대적으로 수렴하는 경우 =∑x i p i라고 합니다.

서비스의 목적. 온라인 서비스 이용 수학적 기대, 분산 및 표준 편차가 계산됩니다.(예제 참조). 또한, 분포 함수 F(X)의 그래프가 그려집니다.

확률변수의 수학적 기대값의 속성

  1. 상수 값의 수학적 기대값은 그 자체와 같습니다. M[C]=C, C – 상수;
  2. M=C M[X]
  3. 확률 변수의 합에 대한 수학적 기대값은 수학적 기대값의 합과 같습니다. M=M[X]+M[Y]
  4. 독립 확률 변수의 곱에 대한 수학적 기대값은 수학적 기대값의 곱과 같습니다. X와 Y가 독립인 경우 M=M[X] M[Y] .

분산 특성

  1. 상수 값의 분산은 0입니다: D(c)=0.
  2. 상수 인자는 분산 기호 아래에서 제곱하여 꺼낼 수 있습니다: D(k*X)= k 2 D(X).
  3. 확률 변수 X와 Y가 독립이면 합의 분산은 분산의 합과 같습니다: D(X+Y)=D(X)+D(Y).
  4. 확률변수 X와 Y가 종속인 경우: D(X+Y)=DX+DY+2(X-M[X])(Y-M[Y])
  5. 다음 계산 공식은 분산에 유효합니다.
    D(X)=M(X 2)-(M(X)) 2

예. 두 개의 독립 확률 변수 X와 Y의 수학적 기대치와 분산은 다음과 같이 알려져 있습니다: M(x)=8, M(Y)=7, D(X)=9, D(Y)=6. 확률변수 Z=9X-8Y+7의 수학적 기대값과 분산을 구합니다.
해결책. 수학적 기대의 속성에 기초: M(Z) = M(9X-8Y+7) = 9*M(X) - 8*M(Y) + M(7) = 9*8 - 8*7 + 7 = 23 .
분산 특성에 기초: D(Z) = D(9X-8Y+7) = D(9X) - D(8Y) + D(7) = 9^2D(X) - 8^2D(Y) + 0 = 81*9 - 64*6 = 345

수학적 기대값을 계산하는 알고리즘

이산 확률 변수의 속성: 모든 값은 자연수로 다시 번호를 매길 수 있습니다. 각 값에 0이 아닌 확률을 할당합니다.
  1. 우리는 쌍을 하나씩 곱합니다: x i by p i .
  2. 각 쌍 x i p i 의 곱을 더합니다.
    예를 들어, n = 4의 경우: m = ∑x i p i = x 1 p 1 + x 2 p 2 + x 3 p 3 + x 4 p 4
이산확률변수의 분포함수단계적으로 확률이 양수인 지점에서 갑자기 증가합니다.

예 1.

x 나는 1 3 4 7 9
피 나는 0.1 0.2 0.1 0.3 0.3

m = ∑x i p i 공식을 사용하여 수학적 기대값을 구합니다.
기대 M[X].
M[x] = 1*0.1 + 3*0.2 + 4*0.1 + 7*0.3 + 9*0.3 = 5.9
d = ∑x 2 i p i - M[x] 2 공식을 사용하여 분산을 구합니다.
분산 D[X].
D[X] = 1 2 *0.1 + 3 2 *0.2 + 4 2 *0.1 + 7 2 *0.3 + 9 2 *0.3 - 5.9 2 = 7.69
표준편차 σ(x).
σ = sqrt(D[X]) = sqrt(7.69) = 2.78

예 2. 이산확률변수에는 다음과 같은 분포 계열이 있습니다.

엑스 -10 -5 0 5 10
아르 자형 0,32 2 0,41 0,03
a의 값, 수학적 기대값, 이 확률 변수의 표준 편차를 구합니다.

해결책. a의 값은 다음 관계식에서 구됩니다: Σp i = 1
Σp i = a + 0.32 + 2a + 0.41 + 0.03 = 0.76 + 3a = 1
0.76 + 3 a = 1 또는 0.24=3 a , 여기서 a = 0.08

예 번호 3. 분산이 알려진 경우 이산 확률 변수의 분포 법칙을 결정하고 x 1 x 1 =6; x 2 =9; x3=x; x 4 =15
p 1 =0.3; p2=0.3; p3=0.1; p4=0.3
d(x)=12.96

해결책.
여기에서 분산 d(x)를 찾기 위한 공식을 만들어야 합니다.
d(x) = x 1 2 p 1 +x 2 2 p 2 +x 3 2 p 3 +x 4 2 p 4 -m(x) 2
여기서 기대값 m(x)=x 1 p 1 +x 2 p 2 +x 3 p 3 +x 4 p 4
우리 데이터의 경우
m(x)=6*0.3+9*0.3+x 3 *0.1+15*0.3=9+0.1x 3
12.96 = 6 2 0.3+9 2 0.3+x 3 2 0.1+15 2 0.3-(9+0.1x 3) 2
또는 -9/100(x 2 -20x+96)=0
따라서 방정식의 근을 찾아야하며 그 중 두 가지가 있습니다.
엑스 3 =8, 엑스 3 =12
조건을 만족하는 것을 선택하세요 x 1 x 3 =12

이산확률변수의 분포 법칙
x 1 =6; x 2 =9; x 3 =12; x 4 =15
p 1 =0.3; p2=0.3; p3=0.1; p4=0.3

확률 변수 X의 수학적 기대값은 평균값입니다.

1. M(C) = C

2. M(CX) = CM(X), 어디 = const

3. M(X ± Y) = M(X) ± M(Y)

4. 확률변수인 경우 엑스그리고 와이독립한 다음 M(XY) = M(X) M(Y)

분산

확률변수 X의 분산은 다음과 같습니다.

D(X) = S(x – M(X)) 2 p = M(엑스 2 ) - 중 2 (엑스).

분산은 평균값에서 임의 변수 값의 편차를 측정한 것입니다.

1. D(C) = 0

2. D(X + C) = D(X)

3. 디(CX) = C 2 디(엑스), 어디 = const

4. 독립확률변수의 경우

D(X ± Y) = D(X) + D(Y)

5. D(X ± Y) = D(X) + D(Y) ± 2Cov(x, y)

확률 변수 X의 분산의 제곱근을 표준 편차라고 합니다. .

@작업 3: 확률변수 X가 확률로 두 가지 값(0 또는 1)만 취하도록 합니다. q, p, 어디 p + q = 1. 수학적 기대값과 분산을 구합니다.

해결책:

M(X) = 1p + 0q = p; D(X) = (1 – p) 2 p + (0 – p) 2 q = pq.

@작업 4: 확률변수의 기대값과 분산 엑스 8과 같습니다. 확률 변수의 수학적 기대값과 분산을 구합니다. a) 엑스 – 4; 비) 3X – 4.

풀이: M(X – 4) = M(X) – 4 = 8 – 4 = 4; D(X – 4) = D(X) = 8; M(3X – 4) = 3M(X) – 4 = 20; D(3X – 4) = 9D(X) = 72.

@과제 5: 전체 가족은 자녀 수에 따라 다음과 같이 분포됩니다.

x 나는 x 1 x 2
피 나는 0,1 p2 0,4 0,35

정의하다 x 1, x 2그리고 p2, 그것이 알려진 경우 M(X) = 2; D(X) = 0.9.

해결책: 확률 ​​p 2는 p 2 = 1 – 0.1 – 0.4 – 0.35 = 0.15와 같습니다. 알려지지 않은 x는 방정식에서 구합니다: M(X) = x 1 ·0.1 + x 2 ·0.15 + 2·0.4 + 3·0.35 = 2; D(X) = ·0.1 + ·0.15 + 4·0.4 + 9·0.35 – 4 = 0.9. x 1 = 0; x 2 = 1.

인구 및 표본. 매개변수 추정

선택적 관찰

통계적 관찰은 연속적이거나 연속적이지 않은 방식으로 구성될 수 있습니다. 지속적인 관찰에는 연구 대상 인구(일반 인구)의 모든 단위를 조사하는 것이 포함됩니다. 인구 이는 연구자가 자신의 업무에 따라 연구하는 개인 또는 법인의 집합입니다. 이는 경제적으로 실행 가능하지 않은 경우가 많으며 때로는 불가능합니다. 이와 관련하여 일반 인구의 일부만 연구됩니다. 표본 모집단 .

다음 원칙을 따르면 표본 모집단에서 얻은 결과를 일반 모집단으로 확장할 수 있습니다.



1. 표본 모집단은 무작위로 결정되어야 합니다.

2. 표본 모집단의 단위 수가 충분해야 합니다.

3. 반드시 제공되어야 함 대표성 ( 대표성) 샘플의. 대표 표본은 반영하려는 모집단의 규모는 작지만 정확한 모델입니다.

샘플 유형

실제로 다음 유형의 샘플이 사용됩니다.

a) 엄격히 무작위, b) 기계적, c) 일반, d) 직렬, e) 결합.

적절한 무작위 샘플링

~에 실제 무작위 표본 표본 모집단의 단위 선택은 추첨이나 난수 생성기를 사용하는 등 무작위로 수행됩니다.

샘플은 반복되거나 반복되지 않을 수 있습니다. 리샘플링에서는 샘플링된 단위가 반환되고 다시 샘플링될 수 있는 동일한 기회가 유지됩니다. 비반복 표본추출에서는 표본에 포함된 모집단 단위가 향후 표본에 참여하지 않습니다.

표본 모집단이 일반 모집단을 완전히 재현하지 못하기 때문에 발생하는 표본 관찰에 내재된 오류를 호출합니다. 표준오차 . 이는 표본에서 얻은 지표 값과 일반 인구 지표의 해당 값 사이의 평균 제곱 차이를 나타냅니다.

무작위 반복 표본추출의 표준오차 계산식은 다음과 같습니다. , 무작위 비반복 표본추출의 경우 다음과 같습니다. 여기서 S2는 표본 모집단의 분산이고, 해당 없음 –샘플 공유, 엔, 엔- 표본과 일반 모집단의 단위 수. ~에 n = N표준오차 m = 0.

기계적 샘플링

~에 기계적 샘플링 모집단을 동일한 간격으로 나누고 각 간격에서 하나의 단위를 무작위로 선택합니다.

예를 들어 샘플링 비율이 2%인 경우 모집단 목록에서 50번째 단위마다 선택됩니다.

기계적 샘플링의 표준 오차는 실제 무작위 비반복 샘플링의 오차로 정의됩니다.

일반적인 샘플

~에 전형적인 샘플 일반 인구를 동질적인 일반 그룹으로 나눈 다음 각 그룹에서 단위를 무작위로 선택합니다.

이질적인 모집단의 경우에는 전형적인 표본이 사용됩니다. 일반적인 샘플은 대표성을 보장하므로 보다 정확한 결과를 제공합니다.

예를 들어, 일반 인구로서 교사는 성별, 경험, 자격, 교육, 도시 및 농촌 학교 등의 기준에 따라 그룹으로 나뉩니다.

일반적인 표본의 표준 오류는 실제 무작위 표본의 오류로 정의됩니다. 유일한 차이점은 다음과 같습니다. 에스 2그룹 내 분산의 평균으로 대체됩니다.

직렬 샘플링

~에 직렬 샘플링 일반 인구를 별도의 그룹(계열)으로 나눈 다음 무작위로 선택된 그룹을 지속적으로 관찰합니다.

연속 표본의 표준 오류는 실제 무작위 표본의 오류로 정의됩니다. 유일한 차이점은 다음과 같습니다. 에스 2그룹 간 분산의 평균으로 대체됩니다.

결합된 샘플

결합된 샘플두 개 이상의 샘플 유형을 조합한 것입니다.

포인트 추정

표본관찰의 궁극적인 목적은 모집단의 특성을 찾는 것이다. 이는 직접적으로 이루어질 수 없기 때문에 표본 모집단의 특성이 일반 모집단으로 확장됩니다.

평균 표본의 데이터로부터 모집단의 산술 평균을 결정할 수 있는 근본적인 가능성이 입증되었습니다. 체비쇼프의 정리. 무제한 확대 N표본 평균과 일반 평균의 차이가 임의로 작을 확률은 1이 되는 경향이 있습니다.

이는 모집단의 특성이 . 이 평가를 가리키다 .

간격 추정

간격 추정의 기본은 다음과 같습니다. 중심 극한 정리.

간격 추정다음 질문에 답할 수 있습니다. 모집단 매개변수의 알 수 없는 원하는 값이 어떤 간격과 확률로 존재합니까?

보통 우리는 신뢰 확률에 대해 이야기합니다. = 1 a, 그것은 간격에 있을 것입니다 디< < + D, где D = t cr m > 0 한계 오류 샘플, a - 유의수준 (부등식이 거짓일 확률) t cr- 값에 따라 달라지는 임계값 N그리고 작은 표본 n의 경우< 30 t cr양측 검정에 대한 스튜던트 t-분포의 임계값을 사용하여 지정됩니다. N– 유의 수준 a의 자유도는 1입니다( t cr(N - 1, a)는 "스튜던트 t-분포의 임계값" 표, 부록 2)에서 확인할 수 있습니다. n > 30인 경우, t cr정규 분포 법칙의 분위수입니다( t cr라플라스 함수 F(t) = (1)의 값 표에서 찾을 수 있습니다. a)/2를 인수로 사용). p = 0.954에서 임계값 t cr= p = 0.997 임계값에서 2 t cr= 3. 이는 한계 오차가 일반적으로 표준 오차보다 2~3배 더 크다는 것을 의미합니다.

따라서 샘플링 방법의 본질은 모집단의 특정 작은 부분에 대한 통계 데이터를 기반으로 신뢰 확률로 구간을 찾을 수 있다는 것입니다. 일반 인구가 원하는 특성(평균 근로자 수, 평균 점수, 평균 생산량, 표준 편차 등)을 찾습니다.

@과제 1.기업 채권자와의 결제 속도를 결정하기 위해 상업 은행은 100개의 지급 서류를 무작위로 표본 조사한 결과, 평균 자금 이체 및 수취 시간은 22일(=22), 표준 편차 6으로 나타났습니다. 일(S = 6). 확률적으로 = 0.954는 표본 평균의 최대 오차와 이 회사 기업의 평균 정산 기간에 대한 신뢰 구간을 결정합니다.

풀이: 표본평균의 한계오차(1)동일디= 2· 0.6 = 1.2이고 신뢰 구간은 (22 – 1.2; 22 + 1.2)로 정의됩니다. 즉, (20.8; 23.2).

§6.5 상관관계 및 회귀