Chào các em! Bài toán này là một ví dụ thực tế về cách xử lý và phân tích dữ liệu thống kê. Bằng cách ghép nhóm và tính toán các đại lượng đặc trưng, chúng ta có thể rút ra những nhận xét quan trọng từ một mẫu số liệu lớn.
Quãng đường (km) đi từ nhà đến nơi làm việc của 40 công nhân một nhà máy được ghi lại như sau:

a) Ghép nhóm dãy số liệu trên thành các khoảng có độ rộng bằng nhau, khoảng đầu tiên là [0; 5). Tìm giá trị đại diện cho mỗi nhóm.
b) Tính số trung bình của mẫu số liệu không ghép nhóm và mẫu số liệu ghép nhóm. Giá trị nào chính xác hơn?
c) Xác định nhóm chứa mốt của mẫu số liệu ghép nhóm thu được.
Để giải quyết bài toán này, chúng ta cần thực hiện các bước sau:
Ghép nhóm và tìm giá trị đại diện: Dựa vào khoảng đầu tiên [0; 5) và độ rộng đã cho để tạo ra các nhóm. Sau đó, tìm giá trị đại diện của mỗi nhóm bằng cách lấy trung bình cộng của hai đầu mút.
Tính số trung bình:
Không ghép nhóm: Cộng tất cả các giá trị lại và chia cho số lượng dữ liệu.
Ghép nhóm: Sử dụng công thức số trung bình của mẫu số liệu ghép nhóm:\bar{x} \approx \frac{\sum_{i=1}^{k} m_i n_i}{n}, trong đó mi là giá trị đại diện, ni là tần số của nhóm thứ i, và n là tổng số giá trị.
Xác định nhóm chứa mốt: Mốt của mẫu số liệu ghép nhóm là nhóm có tần số lớn nhất.
a) Giá trị nhỏ nhất của mẫu số liệu là 2, giá trị lớn nhất của mẫu số liệu là 32, do đó khoảng biến thiên là 32 – 2 = 30.
Các nhóm có độ rộng bằng nhau và độ rộng của mỗi nhóm là 5. Để cho thuận tiện, ta chia thành 7 nhóm là các nhóm [0; 5), [5; 10), [10; 15), [15; 20), [20; 25), [25; 30), [30; 35). Đếm số giá trị thuộc mỗi nhóm, ta có mẫu số liệu ghép nhóm như sau:
|
Quãng đường (km) |
[0; 5) |
[5; 10) |
[10; 15) |
[15; 20) |
[20; 25) |
[25; 30) |
[30; 35) |
|
Số công nhân |
5 |
11 |
11 |
9 |
1 |
1 |
2 |
Giá trị đại diện cho mỗi nhóm là trung bình của hai đầu mút của nhóm. Ta có bảng giá trị đại diện như sau:
|
Quãng đường (km) (giá trị đại diện) |
2,5 |
7,5 |
12,5 |
17,5 |
22,5 |
27,5 |
32,5 |
|
Số công nhân |
5 |
11 |
11 |
9 |
1 |
1 |
2 |
b) Số trung bình của mẫu số liệu ghép nhóm là:
Ta có: 5 + 3 + 10 + 20 + 25 + 11 + 13 + 7 + 12 + 31 + 19 + 10 + 12 + 17 + 18 + 11 + 32 + 17 + 16 + 2 + 7 + 9 + 7 + 8 + 3 + 5 + 12 + 15 + 18 + 3 + 12 + 14 + 2 + 9 + 6 + 15 + 15 + 7 + 6 + 12 = 476.
Số trung bình của mẫu số liệu không ghép nhóm là:
Giá trị trung bình của mẫu số liệu không ghép nhóm chính xác hơn vì nó là giá trị của mẫu số liệu gốc.
c) Tần số lớn nhất trong bảng tần số của mẫu số liệu ghép nhóm là 11.
Nen nhóm chứa mốt của mẫu số liệu ghép nhóm là các nhóm [5; 10) và [10; 15).
Qua bài 3.4, các em đã rèn luyện được kỹ năng xử lý và phân tích mẫu số liệu ghép nhóm. Việc hiểu cách tính số trung bình và xác định mốt giúp chúng ta đưa ra những nhận xét chính xác về dữ liệu. Chúc các em học tốt!
• Xem thêm: