Các chùm được chọn một cách ngẫu nhiên và tất cả các phần tử của chùm đó đều được chọn vào mẫu.
Phương pháp này có thể tiết kiệm chi phí và thời gian, nhưng sai số chọn mẫu cao hơn các phương pháp trên.
d. Chọn mẫu có suy luận
Phương pháp chọn mẫu này dựa trên ý kiến của các chuyên gia về đối tượng nghiên cứu. Nhược điểm của phương pháp này là khó đảm bảo tính khách
quan.
3.1.3. Bảng phân phối thực nghiệm
Giả sử từ tổng thể với biến ngẫu nhiên gốc X rút ra một mẫu cụ thể kích thước n, trong đó:
- giá trị x1 xuất hiện n1 lần, x2 xuất hiện n2 lần, . . . , xk xuất hiện nk lần. x1 < x2 < . . . < xk và n1 + n2 + . . . + nk = n
Khi đó:
ni được gọi là tần số của xi
fi =
n i được gọi là tần suất xuất hiện của xi
n
Các bảng mô tả số liệu sau đây được gọi là bảng phân phối thực nghiệm
Bảng phân phối tần số thực nghiệm:
x1 | x2 | . . . | xk | |
ni | n1 | n2 | . . . | nk |
Có thể bạn quan tâm!
- Lý thuyết xác suất và thống kê toán - 7
- Lý thuyết xác suất và thống kê toán - 8
- Lý thuyết xác suất và thống kê toán - 9
- Các Tính Chất Của Ước Lượng Điểm
- Khoảng Tin Cậy Cho Phương Sai Trong Trường Hợp K Ỳ Vọng Đã Biết
- Lý thuyết xác suất và thống kê toán - 13
Xem toàn bộ 168 trang tài liệu này.
với n1 + n2 + . . . + nk = n Bảng phân phối tần suất thực nghiệm:
x1 | x2 | . . . | xk | |
fi | f1 | f2 | . . . | fk |
với fi =
n i , f
n 1
+ f2
+ . . . + fk = 1
Ví dụ 3.3. Điều tra thời gian đợi phục vụ của khách hàng tại một ngân hàng (đơn vị: phút), người ta chọn ngẫu nhiên 10 người, kết quả thu được như sau:
9, 8, 10, 10, 12, 6, 11, 10, 12, 8.
Khi đó:
Bảng phân phối tần số thực nghiệm:
6 | 8 | 9 | 10 | 11 | 12 | |
ni | 1 | 2 | 1 | 3 | 1 | 2 |
Bảng phân phối tần suất thực nghiệm
6 | 8 | 9 | 10 | 11 | 12 | |
fi | 0.1 | 0.2 | 0.1 | 0.3 | 0.1 | 0.2 |
xi
Chú ý:
Khi kích thước của mẫu lớn, các giá trị của mẫu khá gần nhau, người ta chia
các giá trị của mẫu thành các lớp và lập bảng phân phối thực nghiệm của mẫu lớp. Ví dụ 3.4. Đo chiều cao của 300 học sinh 12 tuổi, ta thu được bảng số liệu sau:
Tần số ni | Tần suất fi | |
117,5 – 122,5 | 9 | 0,030 |
122,5 – 127,5 | 33 | 0,110 |
127,5 – 132,5 | 74 | 0,247 |
132,5 – 137,5 | 93 | 0,310 |
137,5 – 142,5 | 64 | 0,213 |
142,5 – 147,5 | 21 | 0,070 |
147,5 – 152,5 | 6 | 0,020 |
Chú ý:
- Thông thường người ta phân chia số liệu thành từ 5 đến 15 lớp. Nếu số liệu nhiều hơn có thể giúp phân tích tốt hơn, nhưng sự cải thiện không nhiều, nếu số lớp quá ít các thông tin có thể bị mất khi xử lý.
- Giữa 2 lớp liền nhau [ai-1– ai] và [ai – ai+1] thì chúng ta quy ước phần tử ai đếm cho lớp [ai-1 – ai].
- Một bảng phân phối theo lớp có thể đưa về bảng phân phối thực nghiệm bằng phép lấy trung bình cộng của mỗi lớp. Chẳng hạn với bảng số liệu phân lớp ở ví dụ 4, ta có bảng phân phối tần số thực nghiệm tương ứng:
120 | 125 | 130 | 135 | 140 | 145 | 150 | |
ni | 9 | 33 | 74 | 93 | 64 | 21 | 6 |
3.1.4. Các đặc trưng mẫu
Xét một mẫu ngẫu nhiên (X1, X2 , . . . , Xn) có bảng phân phối tần số thực nghiệm như sau:
x1 | x2 | . . . | xk | |
ni | n1 | n2 | . . . | nk |
xi
trong đó: n1 + n2 + . . . + nk = n
a. Trung bình mẫu (Kỳ vọng mẫu)
Trung bình mẫu là một số ký hiệu là X được xác định bởi công thức:
X 1nX
n i1 i
Do X1 , X2 , . . . , Xn là các biến ngẫu nhiên độc lập cùng phân phối như X, nên trung bình mẫu X cũng là một biến ngẫu nhiên và:
EX 1nEX 1 n EX
n i1 i n
i 2
1 n 1 2
VX VX n VX
n2 i1 n n
Thực hiện phép thử đối với X sẽ thu được giá trị trung bình mẫu cụ thể, ký hiệu giá trị này là x , và được tính bằng công thức sau:
x 1kx n
n i1 i i
trị
Để đơn giản việc tính toán đối với những bảng số liệu dạng khoảng, ta thay giá
X i bằng giá trị trung bình của khoảng.
Ví dụ 3.5. Điều tra doanh thu của 20 cửa hàng vàng trong 1 tháng tại một thành phố, thu được số liệu sau:
Số cửa hàng | |
10-20 | 3 |
20-30 | 6 |
30-40 | 8 |
40-50 | 2 |
50-60 | 1 |
Giải lớp:
Tính doanh thu trung bình của các cửa hàng vàng.
Ta thay bảng số liệu ban đầu bằng bảng số liệu doanh thu trung bình của từng
Số cửa hàng | |
15 | 3 |
25 | 6 |
35 | 8 |
45 | 2 |
55 | 1 |
Doanh thu
Vậy doanh thu trung bình của các cửa hàng vàng là :
EX
b. Phương sai mẫu
1 3.15 25.6 35.8 45.2 55.1 31 .
20
n
S2= 1X X2
n i1 i
Phương sai mẫu S2 cũng là biến ngẫu nhiên, ta có thể chỉ ra:
ES2 = n 1 VX = n 1 2
n n
Thực hiện phép thử đối với S2 ta thu được giá trị phương sai mẫu cụ thể:
k
S2 = 1n x
x 2 x2x2
S2
n i1 i i
Chú ý: Độ lệch chuẩn mẫu là
c. Phương sai mẫu hiệu chỉnh
S .
- Vì giá trị trung bình của S2 không đúng bằng 2 do đó nhiều khi thay cho phương sai mẫu, ta dùng phương sai mẫu hiệu chỉnh, ký hiệu s2 để có Es2 = VX = 2.
s2 1 nX X2 n S2
n 1 i1 i
n 1
- Thực hiện phép thử đối với s2 sẽ thu được một giá trị gọi là phương sai mẫu hiệu chỉnh cụ thể
s2 1 kx x2 n S2
n 1 i1 i
n 1
- Phương sai mẫu hiệu chỉnh phản ánh độ phân tán của các giá trị của mẫu xung quanh trung bình mẫu.
s2
- Chú ý: Độ lệch chuẩn mẫu hiệu chỉnh là s
3.1.5. Cách tính các đặc trưng mẫu
a. Tính trực tiếp
x 1kx n
; x21kx2n
Suy ra: S2 = s2 =
n i1 i i
x2x2
n S2
n 1
n i1 i i
Ví dụ 3.6. Cho bảng phân phối thực nghiệm:
-2 | 1 | 2 | 3 | 4 | 5 | |
ni | 2 | 1 | 2 | 2 | 2 | 1 |
Tính trung bình mẫu, phương sai mẫu và phương sai mẫu hiệu chỉnh? Giải
Ta lập bảng:
ni | xini | xi2ni | |
-2 | 2 | -4 | 8 |
1 | 1 | 1 | 1 |
2 | 2 | 4 | 8 |
3 | 2 | 6 | 18 |
4 | 2 | 8 | 32 |
5 | 1 | 5 | 25 |
Tổng | n = 10 | xini= 20 | x2n = 92 i i |
Suy ra:
x 1kx n = 20= 2
n i1 i i10
x21kx2n = 92= 9,2
n i1 i i10
S2 =
x2x 2
= 9,2 – 22 = 5,2
s2 =
nS2 = 10 .5,2 = 5,7778
n 1 9
Chú ý: Nếu dữ liệu cho ở dạng mẫu lớp, ta chỉ có thể tính gần đúng các đặc trưng mẫu
bằng cách thay lớp [ai-1 – ai] bằng một đại diện xi =
a i1 a i
2
Ví dụ 3.7. Lượng xăng hao phí của một ô tô đi từ A đến B sau 30 lần chạy, kết quả thu được như sau:
9,6 -9,8 | 9,8 -10,0 | 10,0-10,2 | 10,2-10,4 | 10,4-10,6 |
3 | 5 | 10 | 8 | 4 |
Lượng xăng hao phí (lít)
Lớp | xi | ni | xini | xi2ni |
9,6-9,8 | 9,7 | 3 | 29,1 | 282,27 |
9,8-10 | 9,9 | 5 | 49,5 | 490,05 |
10-10,2 | 10,1 | 10 | 101 | 1020,1 |
10,2-10,4 | 10,3 | 8 | 82,4 | 848,72 |
10,4-10,6 | 10,5 | 4 | 42 | 441 |
Tổng | n = 30 | xini= 304 | x2n = 3082,14 i i |
Số lần tương ứng Giải
Suy ra:
x 1kx n
= 304= 10,1333
n i1
x21k
i i
x2 n
30
= 3082,14
= 102,738
n i1 i i30
S2 =
x2x2= 102,738 – (10,1333)2= 0,05423
s2 =
b. Tính gián tiếp
nS2 =
n 1
30 .0,05423 = 0,0561
29
Khi dữ liệu lớn phức tạp và cách đều nhau ta có thể biến đổi để giảm độ phức tạp tính toán như sau:
Bước 1: Chọn giá trị x0 tuỳ ý thuộc vào mẫu (thường ở giữa mẫu)
Bước 2: Tính di=
x i x0
h
(trong đó h = xi
– xi-1)
Bước 3: Tính n d ;
n d2
i i
Bước 4: Tính:
i i
x x
hd n
0 n i i
S2 =
h 2 2
n d
i i
1
n i di
2
n n
s2 =
n S2
n 1
Ví dụ 3.8. Tính các đặc trưng mẫu của ví dụ 6 bằng phương biến đổi.
Giải
Dễ thấy các dữ liệu của mẫu cách đều nhau một khoảng là h = 0,2 Chọn giá trị x0 = 10,1
Khi đó ta có bảng sau:
xi | di | ni | dini | di2ni | |
9,6-9,8 | 9,7 | -2 | 3 | -6 | 12 |
9,8-10,0 | 9,9 | -1 | 5 | -5 | 5 |
10,0-10,2 | 10,1 | 0 | 10 | 0 | 0 |
10,2-10,4 | 10,3 | 1 | 8 | 8 | 8 |
10,4-10,6 | 10,5 | 2 | 4 | 8 | 16 |
Tổng | n = 30 | dini= 5 | d2n = 41 i i |
Suy ra:
x x
hd n = 10,1 + 02.5 = 10,1333
,
0 n i i30
S2 =
h 22 1 2 =
(0,2)2
12= 0,05423
n i di
n i di
41
30
5
30
n
n
s2 =
n S2 = 0,0561
n 1
c. Tính bằng máy tính điện tử
Ví dụ 3.9. Kết quả thi môn Toán của 10 sinh viên lớp A như sau:
6 | 7 | 8 | 9 | 10 | |
Số sinh viên | 2 | 4 | 2 | 1 | 1 |
Giải
Tính kỳ vọng mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh ?
Bước 1: Chuyển số máy tính về chế độ thống kê
ON
MODE
- Trên Casio fx-500MS: 2
ON
MODE
MODE
- Trên Casio fx-570MS: 1
Bước 2: Nhập số liệu (các thao tác trên 2 máy là như nhau)
Sau khi bấm phím ON MODE 2 trên Casio fx-500MS và ON MODE MODE 1 trên Casio fx-570MS (vào chương trình thống kê) và khai báo các số liệu cùng với tần số:
Bấm phím: 6
8
; 2 7
DT
DT
SHIFT
SHIFT
; 2 9
; 4
DT
DT
DT
SHIFT
SHIFT
SHIFT
; 1 10 ; 1
Mỗi khi khai báo xong một số liệu cùng với tần số của nó, máy sẽ tự động đếm
;
SHIFT
các số liệu được đưa vào. Thí dụ, sau khi bấm phím 6 2 DT, màn hình sẽ hiện
n = 2 , tức là đã có 2 số liệu được khai báo (cùng bằng 6); Sau khi bấm phím tiếp 7
SHIFT
; 4 DT, màn hình sẽ hiện n = 6 , tức là đã có 6 số liệu được khai báo (hai số liệu cùng bằng 6 và bốn số liệu cùng bằng 7). Sau khi khai báo xong toàn bộ các số liệu, màn hình sẽ hiện n = 10 , nghĩa là: Tập hợp các số liệu gồm 10 giá trị.
=
SHIFT
S-SUM
Tính độ dài mẫu: Bấm phím: 3 (kết quả: n = 10). Chứng tỏ kích
thước mẫu bằng 10 (số các giá trị của mẫu là 10)
Tính tổng số liệu: Bấm phím: SHIFT S-SUM 2 = (kết quả: ) tổng số liệu bằng 75
Tính tổng bình phương số liệu: Bấm phím: bình phương số liệu bằng 577
SHIFT
S-VAR
SHIFT
S-VAR
Tính giá trị trung bình: Bấm phím: Tính độ lệch chuẩn: Bấm phím:
1 (kết quả: ) tổng
1 (kết quả: ) x = 7,5
=
=
=
SHIFT
S-SUM
2 (kết quả: )
S = 1,2041594598
Tính phương sai: Bấm tiếp phím: x2 = (kết quả: )
S2 = 1,45
SHIFT
S-VAR
Tính độ lệch chuẩn hiệu chỉnh: Bấm phím:
s = 1,269265518
3 (kết quả: )
=
Chú ý:
- Khi khai báo 6 SHIFT ; 2 DT, nghĩa là khai báo giá trị x1 = 6 có tần số là 2.
- Nếu bấm phím thì màn hình hiện ra Freq5 = 1, nghĩa là tần số của số liệu thứ
5 (x = 10) là 1.
- Bấm tiếp phím : Màn hình hiện ra x5 = 10, nghĩa là số liệu thứ 5 có giá trị là
10.
Tương tự, sử dụng phím, ta có thể kiểm tra tất cả các dữ liệu được đưa vào đã
đúng hay chưa và chúng có tần số là bao nhiêu.
3.2. Ước lượng điểm
3.2.1. Khái niệm ước lượng điểm
Khái niệm ước lượng thường được dùng trong thực tế, chẳng hạn để đánh giá trình độ của học sinh ta cần tính điểm trung bình. Đó là một ước lượng của điểm số của học sinh đó, nó dựa trên thông tin quá khứ là các điểm mà học sinh đó nhận được trong học kỳ.
Bài toán ước lượng tham số có thể phát biểu tổng quát như sau: Cho biến ngẫu nhiên gốc X có luật phân phối xác suất đã biết nhưng chưa biết tham số nào đó, ta phải xác định tham số dựa trên các thông tin thu được từ một mẫu quan sát (x1 , x2 ,
. . . , xn) của X. Quá trình đi xác định tham số như vậy gọi là quá trình ước lượng
tham số, giá trị $tìm được gọi là ước lượng của , ở đây do $là một giá trị số nên nó được gọi là ước lượng điểm.