Dưới đây là hướng dẫn giải chi tiết từng bước cùng lập luận thống kê logic giúp các em học sinh nắm trọn điểm số cao.
I. Đề bài tập 5.24 (SGK Toán 10 - Trang 90)
Bảng sau cho biết dân số của các tỉnh/thành phố Đồng bằng Bắc Bộ năm 2018 (số liệu gần đúng, đơn vị: triệu người):
| Tỉnh/thành phố | Dân số | | Tỉnh/thành phố | Dân số |
| Hà Nội | $7,52$ | | Hưng Yên | $1,19$ |
| Vĩnh Phước | $1,09$ | | Thái Bình | $1,79$ |
| Bắc Ninh | $1,25$ | | Hà Nam | $0,81$ |
| Quảng Ninh | $1,27$ | | Nam Định | $1,85$ |
| Hải Dương | $1,81$ | | Ninh Bình | $0,97$ |
| Hải Phòng | $2,01$ | | | |
(Theo Tổng cục Thống kê)
Câu hỏi:
a)Tìm số trung bình và trung vị của mẫu số liệu trên.
b)Giải thích tại sao số trung bình và trung vị lại có sự sai khác nhiều.
c)Nên sử dụng số trung bình hay trung vị để đại diện cho dân số của các tỉnh thuộc Đồng bằng Bắc Bộ?
II. Phương pháp giải và kiến thức cần nhớ
Số trung bình ($\overline{X}$): Tổng dân số của tất cả các tỉnh thành chia cho tổng số lượng tỉnh thành ($n = 11$).
Trung vị ($M_e$): Sắp xếp dãy số theo thứ tự không giảm, giá trị nằm ở chính giữa chính là trung vị.
Tiêu chí chọn số đại diện: * Nếu mẫu số liệu đồng đều $\rightarrow$ Dùng số trung bình.
III. Hướng dẫn giải chi tiết bài 5.24
a) Tìm Số trung bình và Trung vị của mẫu số liệu
Để thực hiện tính toán chính xác, trước hết chúng ta tiến hành sắp xếp dân số của $n = 11$ tỉnh/thành phố theo thứ tự không giảm (từ nhỏ đến lớn):
$$0,81;\quad 0,97;\quad 1,09;\quad 1,19;\quad 1,25;\quad 1,27;\quad 1,79;\quad 1,81;\quad 1,85;\quad 2,01;\quad 7,52$$
Tính Số trung bình cộng ($\overline{X}$):
$$\overline{X} = \frac{0,81 + 0,97 + 1,09 + 1,19 + 1,25 + 1,27 + 1,79 + 1,81 + 1,85 + 2,01 + 7,52}{11}$$
$$\overline{X} = \frac{21,56}{11} = 1,96 \text{ triệu người}$$
Xác định Số trung vị ($M_e$):
Vì tổng số phần tử $n = 11$ là một số lẻ, nên số trung vị chính là giá trị đứng ở vị trí chính giữa của dãy số đã sắp xếp (vị trí thứ 6):
$$\Rightarrow M_e = 1,27 \text{ triệu người}$$
b) Giải thích nguyên nhân có sự sai khác nhiều giữa số trung bình và trung vị
Phân tích chi tiết: * Qua kết quả tính toán ở câu a, ta thấy số trung bình là $1,96$ triệu người, trong khi số trung vị chỉ là $1,27$ triệu người (chênh lệch nhau tới $0,69$ triệu người, tương đương gần $700.000$ dân).
Nguyên nhân chính dẫn đến độ lệch lớn này là do trong mẫu số liệu xuất hiện giá trị dân số của Thủ đô Hà Nội đạt $7,52$ triệu người. Đây là một giá trị bất thường (outlier) lớn đột biến, lệch hẳn ra ngoài mặt bằng chung của 10 tỉnh thành còn lại (vốn chỉ dao động tiệm cận trong khoảng từ $0,81$ đến $2,01$ triệu người).
Do công thức tính số trung bình cộng phải cộng gộp tất cả các giá trị, nên con số khổng lồ $7,52$ của Hà Nội đã "kéo" số trung bình của cả vùng tăng vọt lên mức $1,96$ triệu người. Ngược lại, số trung vị chỉ phụ thuộc vào thứ tự đứng ở giữa dòng nên hoàn toàn không bị ảnh hưởng bởi độ lớn cực đoan của số biên $7,52$.
c) Lựa chọn số đặc trưng đại diện cho dân số cả vùng
Nhìn vào thực tế phân bố, số trung bình $\overline{X} = 1,96$ triệu người lớn hơn dân số của tận $9 / 11$ tỉnh thành trong khu vực ($1,96 > 1,85$). Điều này có nghĩa là nếu dùng số trung bình để đại diện, chúng ta sẽ làm sai lệch thông tin, tạo cảm giác dân số của các tỉnh Đồng bằng Bắc Bộ đều rất cao.
Trong khi đó, số trung vị $M_e = 1,27$ triệu người nằm ngay trung tâm vùng mật độ tập trung của dữ liệu ($0,81 \le 1,27 \le 2,01$), phản ánh vô cùng trung thực mặt bằng dân số chung của số đông các tỉnh trong vùng.
Kết luận câu c: Đối với mẫu số liệu này, chúng ta nên sử dụng Số trung vị để đại diện cho dân số của các tỉnh thuộc Đồng bằng Bắc Bộ.
IV. Mẹo nhận diện nhanh đại lượng đại diện (Dành cho thi trắc nghiệm)
Để giúp các em học sinh tạo phản xạ nhẩm siêu tốc và chốt đáp án trắc nghiệm định tính chỉ trong vòng 2 giây, các em hãy lưu lại sơ đồ la bàn tư duy sau:
Từ khóa đề bài: "Dân số vùng / Thu nhập hộ gia đình / Lương doanh nghiệp" $\rightarrow$ Đây là những mẫu số liệu thực tế mặc định luôn chứa các giá trị đầu não lớn đột biến (như dân số thủ đô, thu nhập của tỷ phú, lương của giám đốc).
Mẹo chốt câu hỏi: Cứ thấy bài toán hỏi về đại lượng đại diện cho các tập dữ liệu kinh tế - xã hội có tính chất lệch biên này $\rightarrow$ Các em hãy tìm ngay phương án chứa từ Trung vị để khoanh. Tuyệt đối không chọn số trung bình vì số trung bình luôn bị các giá trị "khủng" làm nhiễu loạn bản chất sạch của dữ liệu!
V. Kết luận
Bài tập 5.24 là một câu hỏi thực tiễn tuyệt vời để khép lại toàn bộ mạch kiến thức Chương V Toán 10. Bài toán giúp học sinh hiểu được ý nghĩa sâu sắc của Thống kê học: toán học không chỉ là những con số vô hồn, mà là công cụ để chúng ta phân tích, nhìn nhận và đưa ra các đánh giá khách quan nhất về bức tranh xã hội thực tế.
Hy vọng với lời giải trên, các em đã hiểu rõ hơn cách chọn số đặc trưng! Mọi ý kiến đóng góp hoặc thắc mắc các em hãy để lại nhận xét ngay phía dưới bài viết để nhận được sự hỗ trợ từ chúng mình. Chúc các em luôn học tốt và đạt điểm số thật cao!
• Xem thêm:
Bài 5.21 SGK Toán 10 tập 1 Kết nối tri thức
Bài 5.22 SGK Toán 10 tập 1 Kết nối tri thức
Bài 5.23 SGK Toán 10 tập 1 Kết nối tri thức
Bài 5.25 SGK Toán 10 tập 1 Kết nối tri thức
Bài 5.26 SGK Toán 10 tập 1 Kết nối tri thức