Đề bài:
Bảng sau thống kê lại tổng số giờ nắng trong tháng 6 của các năm từ 2002 đến 2021 tại hai trạm quan trắc đặt ở Nha Trang và Quy Nhơn.

a) Nếu so sánh theo khoảng tứ phân vị thì số giờ nắng trong tháng 6 của địa phương nào đồng đều hơn?
b) Nếu so sánh theo độ lệch chuẩn thì số giờ nắng trong tháng 6 của địa phương nào đồng đều hơn?
Phân tích và Hướng dẫn giải:
Đề bài cho bảng tần số ghép nhóm về tổng số giờ nắng trong tháng 6 của hai trạm quan trắc ở Nha Trang và Quy Nhơn.
Bài toán có hai yêu cầu chính:
a) So sánh độ đồng đều theo khoảng tứ phân vị: Khoảng tứ phân vị (ΔQ) càng nhỏ thì dữ liệu càng đồng đều. Ta sẽ ước lượng ΔQ cho từng trạm và so sánh.
b) So sánh độ đồng đều theo độ lệch chuẩn: Độ lệch chuẩn (S) càng nhỏ thì dữ liệu càng đồng đều. Ta sẽ ước lượng S cho từng trạm và so sánh.
Chúng ta sẽ sử dụng các công thức ước lượng cho dữ liệu ghép nhóm để giải quyết bài toán.
Lời giải chi tiết:
a) Cỡ mẫu n = 20.
- Xét mẫu số liệu của trạm quan trắc ở Nha Trang:
Gọi x1; x2; …; x20 là mẫu số liệu gốc về tổng số giờ nắng trong tháng 6 của các năm 2022 đến 2021 tại trạm quan trắc đặt ở Nha Trang được xếp theo thứ tự không giảm.
Ta có x1 ∈ [130; 160), x2 ∈ [160; 190), x3 ∈ [190; 220),
x4; …; x11 ∈ [220; 250), x12; …; x18 ∈ [250; 280), x19; x20 ∈ [280; 310).
Tứ phân vị thứ nhất của mẫu số liệu gốc là
(x5 + x6) ∈ [220; 250).
Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là:
}{8}.(250-220)=227,5)
Tứ phân vị thứ ba của mẫu số liệu gốc là
(x15 + x16) ∈ [250; 280).
Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là:
}{7}.(280-250)\approx267,143)
Khoảng tứ phân vị của mẫu số liệu ghép nhóm là:
∆Q = Q3 – Q1 ≈ 267,143 – 227,5 = 39,643.
Xét mẫu số liệu của trạm quan trắc ở Quy Nhơn:
Gọi y1; y2; …; y20 là mẫu số liệu gốc về tổng số giờ nắng trong tháng 6 của các năm 2022 đến 2021 tại trạm quan trắc đặt ở Quy Nhơn được xếp theo thứ tự không giảm.
Ta có y1 ∈ [160; 190), y2; y3 ∈ [190; 220), y4; …; y7 ∈ [220; 250),
y8; …; y17 ∈ [250; 280), y18; y19; y20 ∈ [280; 310).
Tứ phân vị thứ nhất của mẫu số liệu gốc là
(y5 + y6) ∈ [220; 250).
Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là:
}{4}.(250-220)=235&space;)
Tứ phân vị thứ ba của mẫu số liệu gốc là 12(y15 + y16) ∈ [250; 280).
Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là:
}{10}(280-250)=274)
Khoảng tứ phân vị của mẫu số liệu ghép nhóm là:
∆'Q = Q'3 – Q'1 = 274 – 235 = 39.
Vì ∆Q ≈ 39,64 > ∆'Q = 39 nên nếu so sánh theo khoảng tứ phân vị thì số giờ nắng trong tháng 6 của Quy Nhơn đồng đều hơn.
b) Ta có bảng sau:
Số giờ nắng | [130; 160) | [160; 190) | [190; 220) | [220; 250) | [250; 280) | [280; 310) |
Giá trị đại diện | 145 | 175 | 205 | 235 | 265 | 295 |
Số năm ở Nha Trang | 1 | 1 | 1 | 8 | 7 | 2 |
Số năm ở Quy Nhơn | 0 | 1 | 2 | 4 | 10 | 3 |
- Xét mẫu số liệu của trạm quan trắc ở Nha Trang:
Số trung bình của mẫu số liệu ghép nhóm là:

Phương sai của mẫu số liệu ghép nhóm là:
S2N=
(1∙1452 + 1∙1752 + 1∙2052 + 8∙2352 + 7∙2652 + 2∙2952) – (242,5)2
= 1248,75.
Độ lệch chuẩn của mẫu số liệu ghép nhóm là:
.
- Xét mẫu số liệu của trạm quan trắc ở Quy Nhơn:
Số trung bình của mẫu số liệu ghép nhóm là:

Phương sai của mẫu số liệu ghép nhóm là:
S2Q=
(1∙1752 + 2∙2052 + 4∙2352 + 10∙2652 + 3∙2952) – 2532 = 936.
Độ lệch chuẩn của mẫu số liệu ghép nhóm là:
.
Vì SN ≈ 35,54 > SN ≈ 30,59 nên nếu so sánh theo độ lệch chuẩn thì số giờ nắng trong tháng 6 của Quy Nhơn đồng đều hơn.