Nguyễn Văn Tuấn
GS Nguyễn Văn Tuấn |
Đó
là nhận định của Bộ Y tế về con số hơn 6200 người bị nhập viện vì ẩu đả nhau
trong 9 ngày nghỉ Tết (1). Chưa nói đến ngôn ngữ chính trị (vốn rất dở), chỉ cần
xem qua dữ liệu tôi thấy đây là một nhận định rất sai. Không thể xem hàng ngàn
trường hợp đánh nhau đến nhập viện là bình thường được. Trong cái note này tôi
sẽ chỉ ra rằng đó là một “hiện tượng” bất bình thường bằng cách dùng chính con
số của của Bộ Y tế.
Cách
mà Bộ Y tế lí giải con số đó là “bình thường” có thể xem là một cách ngụy biện
thống kê. Họ lí giải như sau: "Nếu
chia cụ thể con số gần 100 trường hợp trong 9 ngày thì trung bình mỗi
ngày mỗi địa phương chỉ xảy ra khoảng 11 trường hợp nhập viện vì đánh
nhau. Con số này không có gì bất thường" (1).
Có
cái gì đó buồn cười trong lí giải trên! Con số 11 trên là họ lấy 6207 trường hợp
ẩu đả chia cho 63 [tỉnh thành], rồi chia cho 9 ngày [thời gian nghỉ Tết]. Tức
là mỗi tỉnh chỉ có 11 ca nhập viện mỗi ngày. Có lẽ các bạn tự hỏi sao họ không
chia cho 24 giờ để con số trung bình chỉ còn 0.46, tức là mỗi giờ [trong thời
gian nghỉ Tết] ở mỗi tỉnh thành chỉ có 0.46 người nhập viện vì đánh nhau! Muốn
làm cho sự kiện lớn thì tính trên mỗi ngày cho cả nước; muốn làm cho sự kiện nhỏ
thì chia cho số giờ, thậm chí phút! Cách minh họa đó cho thấy “nói dóc bằng thống
kê” nó trơ trẽn và vô duyên như thế nào. Thật ra đó là một ngụy biện mà giới
khoa học gọi là “fallacy of average”, khi nào có dịp tôi sẽ quay lại khái niệm
này. Nhưng cách dùng con số thống kê của Bộ Y tế làm tôi nhớ đến câu nói nổi tiếng của Nhà thơ Andrew Lang "Some individuals use statistics as a drunk man uses lamp posts - for support rather than for illumination"
(tạm dịch "Vài người dùng con số thống kê như là một gã say rượu dùng
cái đèn đường -- họ dùng để tìm điểm tựa hơn là để soi sáng vấn đề).
Quay
lại nhận xét “bình thường”, câu hỏi đặt
ra là thế nào là bình thường? Xin chú
ý chữ “bình thường” tôi để trong ngoặc kép (bởi vì theo chuẩn mực đạo đức, đánh
nhau đến nhập viện là không bình thường). Cách hợp lí nhất là so sánh số ca nhập
viện trung bình mỗi ngày trong thời gian nghỉ Tết với thời gian ngoài Tết.
Tính
trung bình mỗi ngày trong thời gian nghỉ Tết vừa qua có ~690 người nhập viện vì
đánh nhau. Nhưng chúng ta không biết trong thời gian ngoài Tết, có bao nhiêu ca
nhập viện mỗi ngày vì đánh nhau. Do đó, tôi nghĩ đến 2 cách để so sánh: thứ nhất
là so số ca nhập viện vì ẩu đả với số ca tai nạn giao thông ngày thường. Thứ
hai là so sánh với cùng thời gian những ngày nghỉ Tết các năm trước. Hai so
sánh này sẽ giúp chúng ta có một nhận xét đúng đắn và có bằng chứng hơn.
So với số ca tai nạn giao thông
Tuy
nhiên, chúng ta biết rằng trong năm 2013 có 32266 người bị thương tích vì tai nạn
giao thông (2). Tính trung bình mỗi ngày có 88 người bị thương vì tai nạn giao
thông. Nếu tính cả 9805 người chết vì tai nạn giao thông, thì mỗi ngày có 115
người bị thương và tử vong do tai nạn giao thông.
Nhưng
trong thời gian nghỉ Tết, mỗi ngày có đến 690 người nhập viện vì ẩu đả nhau.
Như vậy, tính trung bình tỉ suất nhập viện vì ẩu đả trong ngày Tết tăng gấp 6 lần
so với tỉ suất thương vong vì tai nạn giao thông. Xin nhắc lại: cao gấp 6 lần.
Có thể xem sự chênh lệch đó là “bình thường” không? Tôi nghĩ chỉ có người có
suy nghĩ bất bình thường mới nói đó là “bình thường”.
So với kì nghỉ Tết năm 2012 và 2013
Một
cách khác để đánh giá bình thường hay không là so sánh tỉ suất năm 2014 với các
năm trước. Bài báo trên Vietnamnet cho biết số ca nhập viện vì đánh nhau trong
ngày Tết qua các năm như sau:
Năm
2014: 6702 ca
Năm 2013: 4737 ca
Năm 2012: 3995 ca
Năm 2013: 4737 ca
Năm 2012: 3995 ca
Như
vậy, so với năm 2012, số ca ẩu đả và nhập viện năm 2014 tăng đến 55%! Rõ ràng
có sự gia tăng về số ca ẩu đả đến nỗi phải nhập viện. Nhưng so sánh đó chưa
công bằng vì chúng ta phải tính đến dân số, mà dân số thì tăng trưởng mỗi năm.
Dân số của VN qua 2012-2014 là như sau:
Năm
2014: 92.55 triệu người
Năm 2013: 89.71 triệu người
Năm 2012: 88.77 triệu người
Năm 2013: 89.71 triệu người
Năm 2012: 88.77 triệu người
Vấn
đề đặt ra là sự gia tăng số ca nhập viện là do dao động thống kê hay là do yếu
tố nào khác? Chúng ta phải kiểm định giả thuyết đàng hoàng. Gọi tỉ suất nhập viện
vì ẩu đả trong thời gian nghỉ Tết năm 2012, 2013 và 2014 lần lượt là L12, L13,
và L14. Dùng số liệu trên, chúng ta có thể ước tính L(t) cho từng năm như sau:
Năm
2014: L14 = 6702 / (92.55*9) = 8.046 trên 1 triệu;
Năm 2013: L13 = 4737 / (89.71*9) = 5.867 trên 1 triệu;
Năm 2012: L12 = 3995 / (88.77*9) = 5.000 trên 1 triệu;
Năm 2013: L13 = 4737 / (89.71*9) = 5.867 trên 1 triệu;
Năm 2012: L12 = 3995 / (88.77*9) = 5.000 trên 1 triệu;
Nếu
phát biểu của Bộ Y tế là đúng (tức “bình thường”) thì chúng ta kì vọng rằng L14
= L13 = L12, hoặc có khác nhau chút ít do dao động thống kê. Nhưng kết quả tính
toán trên cho thấy hình như giả thuyết này không đúng. Tuy nhiên, vẫn chưa thể
kết luận được rằng L14 khác với L13 hay L12, vì chúng ta chưa xem xét đến yếu tố
dao động ngẫu nhiên qua các năm.
Chúng
ta cần phải tính xác suất dữ liệu xảy ra nếu L14=L13 là bao nhiêu. Nói cách
khác, gọi dữ liệu là D, và giả thuyết bình thường là H0: L14=L13, chúng ta cần
tính P(D | H0). Nếu xác suất này là thấp, thì chúng ta có thể bác bỏ giả thuyết
“bình thường”, và kết luận rằng sự gia tăng số ca nhập viện trong dịp Tết vừa
qua là không “bình thường”.
Nhưng
làm sao tính xác suất đó? Phương pháp thống kê đơn giản nhất và thích hợp nhất
để so sánh 2 tỉ suất là phương pháp kiểm định Poisson (3). Giả định rằng tỉ suất
L14, L13 và L12 tuân theo luật phân bố Poisson. Theo luật phân bố Poisson,
phương sai của số ca nhập viện cũng chính là L. Điều này dẫn đến một phương
pháp kiểm định giả thuyết rất đơn giản, dựa trên khác biệt giữa 2 thời gian.
Dùng ngôn ngữ R, tôi tính được xác suất như sau:
So
sánh tỉ suất năm 2014 và 2013:
>
poisson.test(c(6207, 4737), c(9*92.55, 9*89.71),
alternative=c("two.sided"))
P-value
< 2.2e-16
rate ratio: 1.27 (95 percent confidence interval: 1.22, 1.32)
rate ratio: 1.27 (95 percent confidence interval: 1.22, 1.32)
Nói
cách khác, tỉ suất nhập viện vì đánh nhau năm 2014 cao hơn năm 2013 là 27%, và
khoảng tin cậy 95% dao động từ 22% đến 32%. Trị số P rất nhỏ (2.2e-16).
Tương
tự, so sánh tỉ suất năm 2014 và 2012:
>
poisson.test(c(6207, 3995), c(9*92.55, 9*88.77),
alternative=c("two.sided"))
P-value
< 2.2e-16
rate ratio: 1.49 (95 percent confidence interval: 1.43, 1.55)
rate ratio: 1.49 (95 percent confidence interval: 1.43, 1.55)
Tỉ
suất nhập viện vì đánh nhau năm 2014 cao hơn năm 2012 đến 1,49 lần, và khoảng
tin cậy 95% dao động từ 1.43 đến 1.55 lần. Một lần nữa, trị số P cũng rất thấp.
Nói
tóm lại, nếu giả thuyết “bình thường” là đúng thì xác suất mà chúng ta quan sát
tỉ suất năm 2014 so với các năm trước là rất rất thấp. Nói cách khác, số liệu
thực tế cho thấy sự khác biệt về tỉ suất số ca nhập viện vì ẩu đả nhau trong thời
gian 2012-2014 là không phải do yếu tố dao động thống kê, mà có sự khác biệt thật
sự. Do đó, giả thuyết “bình thường” bị loại bỏ.
Để kết
luận, xét trên 2 tiêu chí (so sánh theo thời gian và so sánh với số ca tai nạn
giao thông) đều cho thấy số ca nhập viện vì ẩu đả nhau trong thời gian nghỉ Tết
vừa qua là quá cao. Trong 3 năm liên tiếp, số ca nhập viện vì ẩu đả liên tục
gia tăng. Do đó, nhận định “6.200 người
nhập viện vì đánh nhau là bình thường” chẳng những rất sai lầm mà còn rất …
bất bình thường. Một Bộ chuyên lo quản lí sức khỏe của một nước mà có thể thốt
lên rằng 6000 ca nhập viện vì ẩu đả là "bình thường" thì quả thật người
dân cũng có lí do để quan tâm đến cảm xúc (empathy) của Bộ đó. Có lẽ Gs Trần Ngọc
Thêm nói đúng, “Bởi vì hiện nay, theo cảm nhận của nhiều người có kinh nghiệm,
sự sa đọa của những phẩm chất con người, của văn hóa đã xuống chạm đáy rồi,” nên một sự kiện kinh hoàng đối với thế giới thì lại bình thường
ở VN.
====
(3)
Gọi biến phản ảnh số ca nhập viện là X, và x là số ca nhập viện, luật phân bố
Poisson phát biểu rằng P(X = x) = e^(-m)*m^x / x! Có thể dùng rpois(n, lambda)
trong R để mô phỏng số ca nhập viện rất dễ dàng.
0 Nhận xét