Lý thuyết xác suất và thống kê toán - 10

Các chùm được chọn một cách ngẫu nhiên và tất cả các phần tử của chùm đó đều được chọn vào mẫu.

Phương pháp này có thể tiết kiệm chi phí và thời gian, nhưng sai số chọn mẫu cao hơn các phương pháp trên.

d. Chọn mẫu có suy luận

Phương pháp chọn mẫu này dựa trên ý kiến của các chuyên gia về đối tượng nghiên cứu. Nhược điểm của phương pháp này là khó đảm bảo tính khách

quan.

3.1.3. Bảng phân phối thực nghiệm

Giả sử từ tổng thể với biến ngẫu nhiên gốc X rút ra một mẫu cụ thể kích thước n, trong đó:

- giá trị x1 xuất hiện n1 lần, x2 xuất hiện n2 lần, . . . , xk xuất hiện nk lần. x1 < x2 < . . . < xk và n1 + n2 + . . . + nk = n

Khi đó:

ni được gọi là tần số của xi

fi =

n i được gọi là tần suất xuất hiện của xi

n

Các bảng mô tả số liệu sau đây được gọi là bảng phân phối thực nghiệm

Bảng phân phối tần số thực nghiệm:


xi

x1

x2

. . .

xk

ni

n1

n2

. . .

nk

Có thể bạn quan tâm!

Xem toàn bộ 168 trang tài liệu này.

Lý thuyết xác suất và thống kê toán - 10

với n1 + n2 + . . . + nk = n Bảng phân phối tần suất thực nghiệm:

xi

x1

x2

. . .

xk

fi

f1

f2

. . .

fk

với fi =

n i , f

n 1

+ f2

+ . . . + fk = 1

Ví dụ 3.3. Điều tra thời gian đợi phục vụ của khách hàng tại một ngân hàng (đơn vị: phút), người ta chọn ngẫu nhiên 10 người, kết quả thu được như sau:

9, 8, 10, 10, 12, 6, 11, 10, 12, 8.

Khi đó:

Bảng phân phối tần số thực nghiệm:


xi

6

8

9

10

11

12

ni

1

2

1

3

1

2

Bảng phân phối tần suất thực nghiệm

6

8

9

10

11

12

fi

0.1

0.2

0.1

0.3

0.1

0.2

xi


Chú ý:

Khi kích thước của mẫu lớn, các giá trị của mẫu khá gần nhau, người ta chia

các giá trị của mẫu thành các lớp và lập bảng phân phối thực nghiệm của mẫu lớp. Ví dụ 3.4. Đo chiều cao của 300 học sinh 12 tuổi, ta thu được bảng số liệu sau:



Lớp

(chiều cao cm)

Tần số ni

Tần suất fi

117,5 – 122,5

9

0,030

122,5 – 127,5

33

0,110

127,5 – 132,5

74

0,247

132,5 – 137,5

93

0,310

137,5 – 142,5

64

0,213

142,5 – 147,5

21

0,070

147,5 – 152,5

6

0,020


Chú ý:

- Thông thường người ta phân chia số liệu thành từ 5 đến 15 lớp. Nếu số liệu nhiều hơn có thể giúp phân tích tốt hơn, nhưng sự cải thiện không nhiều, nếu số lớp quá ít các thông tin có thể bị mất khi xử lý.

- Giữa 2 lớp liền nhau [ai-1– ai] và [ai – ai+1] thì chúng ta quy ước phần tử ai đếm cho lớp [ai-1 – ai].

- Một bảng phân phối theo lớp có thể đưa về bảng phân phối thực nghiệm bằng phép lấy trung bình cộng của mỗi lớp. Chẳng hạn với bảng số liệu phân lớp ở ví dụ 4, ta có bảng phân phối tần số thực nghiệm tương ứng:


xi

120

125

130

135

140

145

150

ni

9

33

74

93

64

21

6


3.1.4. Các đặc trưng mẫu

Xét một mẫu ngẫu nhiên (X1, X2 , . . . , Xn) có bảng phân phối tần số thực nghiệm như sau:

x1

x2

. . .

xk

ni

n1

n2

. . .

nk

xi

trong đó: n1 + n2 + . . . + nk = n

a. Trung bình mẫu (Kỳ vọng mẫu)


Trung bình mẫu là một số ký hiệu là X được xác định bởi công thức:

X 1nX

n i1 i

Do X1 , X2 , . . . , Xn là các biến ngẫu nhiên độc lập cùng phân phối như X, nên trung bình mẫu X cũng là một biến ngẫu nhiên và:

EX 1nEX 1 n EX

n i1 i n

i 2

1 n 1 2

VX VX n VX

n2 i1 n n


Thực hiện phép thử đối với X sẽ thu được giá trị trung bình mẫu cụ thể, ký hiệu giá trị này là x , và được tính bằng công thức sau:

x 1kx n

n i1 i i


trị

Để đơn giản việc tính toán đối với những bảng số liệu dạng khoảng, ta thay giá

X i bằng giá trị trung bình của khoảng.

Ví dụ 3.5. Điều tra doanh thu của 20 cửa hàng vàng trong 1 tháng tại một thành phố, thu được số liệu sau:


Doanh thu

(triệu đồng/tháng)

Số cửa hàng

10-20

3

20-30

6

30-40

8

40-50

2

50-60

1



Giải lớp:

Tính doanh thu trung bình của các cửa hàng vàng.


Ta thay bảng số liệu ban đầu bằng bảng số liệu doanh thu trung bình của từng

(triệu đồng/tháng)

Số cửa hàng

15

3

25

6

35

8

45

2

55

1

Doanh thu

Vậy doanh thu trung bình của các cửa hàng vàng là :

EX


b. Phương sai mẫu

1 3.15 25.6 35.8 45.2 55.1 31 .

20

n

S2= 1X X2

n i1 i

Phương sai mẫu S2 cũng là biến ngẫu nhiên, ta có thể chỉ ra:

ES2 = n 1 VX = n 1 2

n n

Thực hiện phép thử đối với S2 ta thu được giá trị phương sai mẫu cụ thể:

k

S2 = 1n x


x 2 x2x2

S2

n i1 i i

Chú ý: Độ lệch chuẩn mẫu

c. Phương sai mẫu hiệu chỉnh

S .

- Vì giá trị trung bình của S2 không đúng bằng 2 do đó nhiều khi thay cho phương sai mẫu, ta dùng phương sai mẫu hiệu chỉnh, ký hiệu s2 để có Es2 = VX = 2.

s2 1 nX X2 n S2

n 1 i1 i

n 1

- Thực hiện phép thử đối với s2 sẽ thu được một giá trị gọi là phương sai mẫu hiệu chỉnh cụ thể

s2 1 kx x2 n S2

n 1 i1 i

n 1

- Phương sai mẫu hiệu chỉnh phản ánh độ phân tán của các giá trị của mẫu xung quanh trung bình mẫu.

s2

- Chú ý: Độ lệch chuẩn mẫu hiệu chỉnh là s

3.1.5. Cách tính các đặc trưng mẫu

a. Tính trực tiếp

x 1kx n

; x21kx2n

Suy ra: S2 = s2 =

n i1 i i

x2x2

n S2

n 1

n i1 i i

Ví dụ 3.6. Cho bảng phân phối thực nghiệm:


xi

-2

1

2

3

4

5

ni

2

1

2

2

2

1

Tính trung bình mẫu, phương sai mẫu và phương sai mẫu hiệu chỉnh? Giải

Ta lập bảng:


xi

ni

xini

xi2ni

-2

2

-4

8

1

1

1

1

2

2

4

8

3

2

6

18

4

2

8

32

5

1

5

25

Tổng

n = 10

xini= 20

x2n = 92

i i

Suy ra:

x 1kx n = 20= 2

n i1 i i10

x21kx2n = 92= 9,2

n i1 i i10

S2 =

x2x 2

= 9,2 – 22 = 5,2

s2 =

nS2 = 10 .5,2 = 5,7778

n 1 9

Chú ý: Nếu dữ liệu cho ở dạng mẫu lớp, ta chỉ có thể tính gần đúng các đặc trưng mẫu

bằng cách thay lớp [ai-1 – ai] bằng một đại diện xi =

a i1 a i

2

Ví dụ 3.7. Lượng xăng hao phí của một ô tô đi từ A đến B sau 30 lần chạy, kết quả thu được như sau:

9,6 -9,8

9,8 -10,0

10,0-10,2

10,2-10,4

10,4-10,6

3

5

10

8

4

Lượng xăng hao phí (lít)

Lớp

xi

ni

xini

xi2ni

9,6-9,8

9,7

3

29,1

282,27

9,8-10

9,9

5

49,5

490,05

10-10,2

10,1

10

101

1020,1

10,2-10,4

10,3

8

82,4

848,72

10,4-10,6

10,5

4

42

441

Tổng


n = 30

xini= 304

x2n = 3082,14

i i

Số lần tương ứng Giải


Suy ra:


x 1kx n


= 304= 10,1333

n i1

x21k

i i


x2 n

30

= 3082,14


= 102,738

n i1 i i30

S2 =

x2x2= 102,738 – (10,1333)2= 0,05423

s2 =

b. Tính gián tiếp

nS2 =

n 1

30 .0,05423 = 0,0561

29

Khi dữ liệu lớn phức tạp và cách đều nhau ta có thể biến đổi để giảm độ phức tạp tính toán như sau:

Bước 1: Chọn giá trị x0 tuỳ ý thuộc vào mẫu (thường ở giữa mẫu)

Bước 2: Tính di=

x i x0

h

(trong đó h = xi

– xi-1)

Bước 3: Tính n d ;

n d2

i i

Bước 4: Tính:

i i

x x

hd n

0 n i i

S2 =

h 2 2

n d

i i

1

n i di

2

n n

s2 =

n S2

n 1

Ví dụ 3.8. Tính các đặc trưng mẫu của ví dụ 6 bằng phương biến đổi.

Giải


Dễ thấy các dữ liệu của mẫu cách đều nhau một khoảng là h = 0,2 Chọn giá trị x0 = 10,1

Khi đó ta có bảng sau:


Lớp

xi

di

ni

dini

di2ni

9,6-9,8

9,7

-2

3

-6

12

9,8-10,0

9,9

-1

5

-5

5

10,0-10,2

10,1

0

10

0

0

10,2-10,4

10,3

1

8

8

8

10,4-10,6

10,5

2

4

8

16

Tổng

n = 30

dini= 5

d2n = 41

i i

Suy ra:



x x

hd n = 10,1 + 02.5 = 10,1333

,

0 n i i30

S2 =

h 22 1 2 =


(0,2)2


12= 0,05423


n i di

n i di

41

30

5

30

n

n

s2 =

n S2 = 0,0561

n 1

c. Tính bằng máy tính điện tử

Ví dụ 3.9. Kết quả thi môn Toán của 10 sinh viên lớp A như sau:


Điểm

6

7

8

9

10

Số sinh viên

2

4

2

1

1



Giải

Tính kỳ vọng mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh ?


Bước 1: Chuyển số máy tính về chế độ thống kê

ON

MODE

- Trên Casio fx-500MS: 2

ON

MODE

MODE

- Trên Casio fx-570MS: 1

Bước 2: Nhập số liệu (các thao tác trên 2 máy là như nhau)

Sau khi bấm phím ON MODE 2 trên Casio fx-500MS và ON MODE MODE 1 trên Casio fx-570MS (vào chương trình thống kê) và khai báo các số liệu cùng với tần số:

Bấm phím: 6

8

; 2 7

DT

DT

SHIFT

SHIFT

; 2 9

; 4

DT

DT

DT

SHIFT

SHIFT

SHIFT

; 1 10 ; 1

Mỗi khi khai báo xong một số liệu cùng với tần số của nó, máy sẽ tự động đếm

;

SHIFT

các số liệu được đưa vào. Thí dụ, sau khi bấm phím 6 2 DT, màn hình sẽ hiện

n = 2 , tức là đã có 2 số liệu được khai báo (cùng bằng 6); Sau khi bấm phím tiếp 7

SHIFT

; 4 DT, màn hình sẽ hiện n = 6 , tức là đã có 6 số liệu được khai báo (hai số liệu cùng bằng 6 và bốn số liệu cùng bằng 7). Sau khi khai báo xong toàn bộ các số liệu, màn hình sẽ hiện n = 10 , nghĩa là: Tập hợp các số liệu gồm 10 giá trị.

=

SHIFT

S-SUM

Tính độ dài mẫu: Bấm phím: 3 (kết quả: n = 10). Chứng tỏ kích

thước mẫu bằng 10 (số các giá trị của mẫu là 10)

Tính tổng số liệu: Bấm phím: SHIFT S-SUM 2 = (kết quả: ) tổng số liệu bằng 75

Tính tổng bình phương số liệu: Bấm phím: bình phương số liệu bằng 577

SHIFT

S-VAR

SHIFT

S-VAR

Tính giá trị trung bình: Bấm phím: Tính độ lệch chuẩn: Bấm phím:

1 (kết quả: ) tổng


1 (kết quả: ) x = 7,5

=

=

=

SHIFT

S-SUM

2 (kết quả: )

S = 1,2041594598

Tính phương sai: Bấm tiếp phím: x2 = (kết quả: )

S2 = 1,45

SHIFT

S-VAR

Tính độ lệch chuẩn hiệu chỉnh: Bấm phím:

s = 1,269265518


3 (kết quả: )

=

Chú ý:


- Khi khai báo 6 SHIFT ; 2 DT, nghĩa là khai báo giá trị x1 = 6 có tần số là 2.

- Nếu bấm phím thì màn hình hiện ra Freq5 = 1, nghĩa là tần số của số liệu thứ

5 (x = 10) là 1.

- Bấm tiếp phím : Màn hình hiện ra x5 = 10, nghĩa là số liệu thứ 5 có giá trị là

10.

Tương tự, sử dụng phím, ta có thể kiểm tra tất cả các dữ liệu được đưa vào đã

đúng hay chưa và chúng có tần số là bao nhiêu.

3.2. Ước lượng điểm

3.2.1. Khái niệm ước lượng điểm

Khái niệm ước lượng thường được dùng trong thực tế, chẳng hạn để đánh giá trình độ của học sinh ta cần tính điểm trung bình. Đó là một ước lượng của điểm số của học sinh đó, nó dựa trên thông tin quá khứ là các điểm mà học sinh đó nhận được trong học kỳ.

Bài toán ước lượng tham số có thể phát biểu tổng quát như sau: Cho biến ngẫu nhiên gốc X có luật phân phối xác suất đã biết nhưng chưa biết tham số nào đó, ta phải xác định tham số dựa trên các thông tin thu được từ một mẫu quan sát (x1 , x2 ,

. . . , xn) của X. Quá trình đi xác định tham số như vậy gọi là quá trình ước lượng

tham số, giá trị $tìm được gọi là ước lượng của , ở đây do $là một giá trị số nên nó được gọi là ước lượng điểm.

..... Xem trang tiếp theo?
⇦ Trang trước - Trang tiếp theo ⇨

Ngày đăng: 16/07/2022