Bài tập số 3, trang 25 SGK Toán 11 Tập 2 (Cánh Diều), là bài toán tổng hợp về thống kê, yêu cầu tính toán tất cả các đại lượng đặc trưng quan trọng nhất của mẫu số liệu ghép nhóm ($n=40$ chiếc ô tô). Các đại lượng cần xác định là số trung bình cộng, trung vị, tứ phân vị và mốt.
Mẫu số liệu dưới đây ghi lại độ dài quãng đường di chuyển trong một tuần (đơn vị: kilômét) của 40 chiếc ô tô:

a) Lập bảng tần số ghép nhóm bao gồm cả tần số tích lũy với năm nhóm ứng với năm nửa khoảng:
[100; 120), [120; 140), [140; 160), [160; 180), [180; 200).
b) Xác định số trung bình cộng, trung vị, tứ phân vị của mẫu số liệu ghép nhóm trên.
c) Mốt của mẫu số liệu ghép nhóm trên là bao nhiêu?
a) Bảng tần số ghép nhóm bao gồm cả tần số tích lũy với năm nhóm ứng với năm nửa khoảng như sau:
|
Nhóm |
Giá trị đại diện |
Tần số |
Tần số tích lũy |
|
[100; 120) [120; 140) [140; 160) [160; 180) [180; 200) |
110 130 150 170 190 |
4 10 19 5 2 |
4 14 33 38 40 |
|
|
n = 40 |
|
b) Xác định số trung bình cộng, trung vị, tứ phân vị
* Số trung bình cộng của mẫu số liệu ghép nhóm đã cho là:
$\overline{x}=\frac{110.4+130.10+150.19+170.5+190.2}{40}=145,5$
* Trung vị:
Số phần tử của mẫu là n = 40.
Ta có: $\frac{n}{2}=\frac{40}{2}=20$
Mà 14 < 20 < 33 nên nhóm 3 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng 20.
Xét nhóm 3 là nhóm [140; 160) có r = 140, d = 20, n3 = 19 và nhóm 2 là nhóm [120; 140) có cf2 = 14.
Áp dụng công thức, ta có trung vị của mẫu số liệu là:
$M_e=r+\frac{\left ( \frac{N}{2}-cf_{k-1} \right )}{n_k}.d$ $=140+\frac{20-14}{19}.20\approx 146,32$
⇒ Tứ phân vị thứ hai là Q2 = Me ≈ 146,32 (km).
* Tứ phân vị:
⦁ Ta có: $\frac{n}{4}=\frac{40}{4}=10$
Mà 4 < 10 < 14 nên nhóm 2 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng 10.
Xét nhóm 2 là nhóm [120; 140) có s = 120; h = 20; n2 = 10 và nhóm 1 là nhóm [100; 120) có cf1 = 4.
Áp dụng công thức, ta có tứ phân vị thứ nhất là:
Q_1=s+\left ( \frac{\frac{n}{4}-cf_{p-1}}{n_p} \right ).h$ $=120+\frac{10-4}{10}.20=132
⦁ Ta có: $\frac{3n}{4}=\frac{3.40}{4}=30$
Mà 14 < 30 < 33 nên nhóm 3 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng 30.
Xét nhóm 3 là nhóm [140; 160) có t = 140; l = 20; n3 = 19 và nhóm 2 là nhóm [120; 140) có cf2 = 14.
Áp dụng công thức, ta có tứ phân vị thứ ba là:
$Q_3=t+\left ( \frac{\frac{3n}{4}-cf_{q-1}}{n_q} \right ).l$ $=140+\frac{30-14}{19}.20\approx 156,84$
c) Nhóm 3 là nhóm [140; 160) có tần số lớn nhất với u = 140, g = 20, n3 = 19 và nhóm 2 có tần số n2 = 10, nhóm 4 có tần số n4 = 5.
Áp dụng công thức, ta có mốt của mẫu số liệu là:
$M_o=u+\left (\frac{n_i-n_{i-1}}{2n_1-n_{i-1}-n_{i+1}} \right ).g$ $=140+\left (\frac{19-10}{2.19-10-5} \right ).20\approx 147,83$
Các đại lượng đặc trưng của mẫu số liệu ghép nhóm đã được xác định:
Số trung bình cộng ($\overline{x}$): $\mathbf{145,5 \text{ km}}$.
Trung vị ($\text{Me}$): $\mathbf{\approx 146,32 \text{ km}}$.
Tứ phân vị thứ nhất ($\text{Q}_1$): $\mathbf{132 \text{ km}}$.
Tứ phân vị thứ ba ($\text{Q}_3$): $\mathbf{\approx 156,84 \text{ km}}$.
Mốt ($\text{M}_o$): $\mathbf{\approx 147,83 \text{ km}}$.
Giá trị trung bình, trung vị và mốt đều tập trung trong khoảng $\mathbf{[140; 160)}$ (nhóm có tần số cao nhất), cho thấy đây là khoảng quãng đường di chuyển phổ biến nhất.
• Xem thêm: