Trung vị và trung bình là hai khái niệm thống kê được sử dụng để mô tả trung tâm của một tập dữ liệu. Dưới đây là sự so sánh giữa trung vị và trung bình, cùng với ví dụ minh họa:
1. **Trung bình (Mean):**
- **Định nghĩa:** Trung bình của một tập dữ liệu được tính bằng cách cộng tất cả các giá trị trong tập dữ liệu rồi chia cho số lượng các giá trị đó.
- **Công thức:** \(\text{Trung bình} = \frac{\text{Tổng các giá trị}}{\text{Số lượng giá trị}}\)
*Ví dụ:* Cho tập dữ liệu \(X = \{2, 4, 6, 8, 10\}\), trung bình là:
\[\text{Trung bình} = \frac{2 + 4 + 6 + 8 + 10}{5} = \frac{30}{5} = 6\]
2. **Trung vị (Median):**
- **Định nghĩa:** Trung vị là giá trị ở giữa của tập dữ liệu sau khi được sắp xếp theo thứ tự tăng dần hoặc giảm dần.
- **Quy tắc:** Nếu số lượng giá trị là lẻ, trung vị là giá trị ở giữa; nếu số lượng giá trị là chẵn, trung vị là trung bình của hai giá trị ở giữa.
*Ví dụ:* Cho tập dữ liệu \(Y = \{3, 1, 7, 2, 8\}\), trung vị là 3 sau khi sắp xếp theo thứ tự tăng dần: \([1, 2, 3, 7, 8]\).
**So sánh:**
- Trung bình nhạy bén hơn đối với các giá trị lớn hoặc nhỏ đặc biệt trong tập dữ liệu vì nó sử dụng tất cả các giá trị.
- Trung vị ít bị ảnh hưởng bởi các giá trị ngoại lệ vì nó chỉ phụ thuộc vào vị trí giữa của dãy số.
- Trung bình có thể không là một giá trị trong tập dữ liệu, trong khi trung vị luôn là một giá trị trong tập dữ liệu.
Dưới đây là một ví dụ minh họa:
Tập dữ liệu: \(Z = \{10, 15, 20, 25, 100\}\)
- Trung bình: \(\frac{10 + 15 + 20 + 25 + 100}{5} = \frac{170}{5} = 34\)
- Trung vị: Sau khi sắp xếp tăng dần \([10, 15, 20, 25, 100]\), trung vị là 20.