Đề bài:
Bảng sau thống kê tổng lượng mưa (đơn vị: mm) đo được vào tháng 7 từ năm 2002 đến năm 2021 tại một trạm quan trắc đặt ở Cà Mau.

a) Hãy tìm khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu trên
b) Hãy chia mẫu số liệu trên thành 4 nhóm với nhóm đầu tiên là [140; 140] và lập bảng tần số ghép nhóm.
c) Hãy tìm khoảng biến thiên, khoảng tứ phân vị của mẫu số liệu ghép nhóm và so sánh với kết quả tương ứng thu được ở câu a).
Phân tích và Hướng dẫn giải:
Bài toán này bao gồm ba phần chính, mỗi phần tập trung vào một kỹ năng thống kê khác nhau.
a) Khoảng biến thiên và khoảng tứ phân vị: Để tìm khoảng biến thiên R, ta lấy giá trị lớn nhất trừ đi giá trị nhỏ nhất trong mẫu số liệu. Để tìm khoảng tứ phân vị ΔQ, ta cần sắp xếp mẫu số liệu theo thứ tự không giảm để xác định tứ phân vị thứ nhất Q1, tứ phân vị thứ ba Q3.
b) Lập bảng tần số ghép nhóm: Dựa vào các khoảng đã cho, ta đếm số lượng các giá trị trong mẫu số liệu gốc rơi vào từng khoảng để xác định tần số.
c) Phân tích mẫu số liệu ghép nhóm: Ta sẽ tính lại khoảng biến thiên và khoảng tứ phân vị dựa trên bảng tần số ghép nhóm.
Khoảng biến thiên của mẫu số liệu ghép nhóm được tính bằng cách lấy cận trên của nhóm cuối trừ đi cận dưới của nhóm đầu.
Tứ phân vị của mẫu số liệu ghép nhóm được xác định bằng cách sử dụng công thức nội suy tuyến tính:
Với:
a: Cận dưới của nhóm chứa Qk
N: Tổng số mẫu
na: Tần số tích lũy của các nhóm trước nhóm chứa Qk
nk: Tần số của nhóm chứa Qk
h: Chiều rộng của nhóm chứa Qk
Lời giải chi tiết:
a) Sắp xếp lại mẫu số liệu trên theo thứ tự không giảm, ta được:
147 187,1 200,7 242,2 251,4 258,4 288,5
298,1 305 332 341,4 388,6 400 413,5
413,5 421 432,2 475 520 522,9
Khoảng biến thiên của mẫu số liệu trên là:
R = 522,9 – 147 = 375,9 (mm).
Cỡ mẫu n = 20.
Tứ phân vị thứ nhất là trung vị của mẫu số liệu:
147; 187,1; 200,7; 242,2; 251,4; 258,4 ; 288,5; 298,1; 305 ; 332.
Do đó, 
Tứ phân vị thứ ba là trung vị của mẫu số liệu:
341,4; 388,6 ; 400; 413,5; 413,5 ; 421; 432,2; 475; 520; 522,9.
Do đó, 
Khoảng tứ phân vị của mẫu số liệu đã cho là:
∆Q = Q3 – Q1 = 417,25 – 254,9 = 162,35.
b) Nhóm đầu tiên là [140; 240), ta chọn 3 nhóm còn lại là
[240; 340), [340; 440), [440; 540).
Từ bảng thống kê ban đầu, ta lập được bảng tần số ghép nhóm như sau:
Lượng mưa (mm) | [140; 240) | [240; 340) | [340; 440) | [440; 540) |
Số tháng | 3 | 7 | 7 | 3 |
c) Cỡ mẫu n = 20.
Khoảng biến thiên của mẫu số liệu ghép nhóm là
R' = 540 – 140 = 400 (mm).
Gọi x1; x2; …; x20 là mẫu số liệu gốc về lượng mưa đo được vào tháng 7 từ năm 2002 đến 2021 tại một trạm quan trắc đặt ở Cà Mau được xếp theo thứ tự không giảm.
Ta có x1; x2; x3 ∈ [140; 240), x4; …; x10 ∈ [240; 340),
x11; …; x17 ∈ [340; 440), x18; x19; x20 ∈ [440; 540).
Tứ phân vị thứ nhất của mẫu số liệu gốc là ∈ [240; 340).
Do đó, tứ phân vị thứ nhất của mẫu số liệu ghép nhóm là:
=\frac{1880}{7})
Tứ phân vị thứ ba của mẫu số liệu gốc là 12(x15+x16) ∈ [340; 440).
Do đó, tứ phân vị thứ ba của mẫu số liệu ghép nhóm là:
}{7}.(440-340)=\frac{2880}{7})
Khoảng tứ phân vị của mẫu số liệu ghép nhóm là:
∆'Q = Q'3 – Q'1 = 2880/7−1880/7=1000/7 ≈ 142,86.
Ta thấy khoảng biến thiên của mẫu số liệu ghép nhóm lớn hơn mẫu số liệu đã cho; khoảng tứ phân vị của mẫu số liệu ghép nhóm nhỏ hơn mẫu số liệu đã cho.