Một bạn đọc gởi một bài báo ở Hungary với cái tít rất giật gân (dịch): ‘Hàng trăm người chết sau khi được tiêm vaccine coronavirus ở Hungary’ (1), và nói rằng có vài bạn dùng số liệu này để biện minh cho vaccine Nga và Tàu. Trong cái note ngắn này tôi muốn nói rằng những so sánh như vậy là rất vô nghĩa.
Bài báo trên cung cấp vài dữ liệu quan trọng về tử vong sau khi tiêm vaccine ở Hung. Trong thời gian từ 26/12/2020 đến 20/4/2021 (tức khoảng 5 tháng), Hung đã tiêm vaccine cho 1.4 triệu người. Hung dùng vaccine khắp nơi: Nga, Tàu, Mĩ, Đức, Anh.
Cũng trong thời gian đó, họ ghi nhận 5714 người đã được tiêm đủ 2 liều nhưng vẫn bị nhiễm virus Vũ Hán sau đó. Trong số này, có 273 người qua đời sau khi được tiêm vaccine và nhiễm virus, tức tỉ lệ tử vong là 4.8%. Nên nhớ đây là những ca nhiễm đột phá (breakthrough infection).
Con số 273 tử vong có quá quan tâm không? Câu trả lời là KHÔNG. Bởi vì mỗi tuần ở Hungary (trước khi dịch xảy ra) có hơn 2000 người chết. So sánh như vậy để thấy vaccine là rất an toàn.
Nhưng họ còn đếm số người được tiêm vaccine & tái nhiễm và số người chết cho từng loại vaccine như sau:
• Sputnik: 2 người chết trên 201 ca (tức 1%)
• Sinopharm: 78 chết trên 1,744 ca (4.5%)
• Moderna: 12 chết trên 108 ca (11%)
• Pfizer/BioNTech: 175 chết trên 3,048 ca (5.7%)
• AstraZeneca: 6 chết trên 613 ca (1%)
Có sự khác biệt có ý nghĩa thống kê giữa các vaccine không? Chỉ cần một vài thao tác đơn giản [2], các bạn sẽ có trị số P < 0.0000001. Các bạn sẽ nói: ah ha! sự khác biệt có ý nghĩa thống kê, những khác biệt này mang tính hệ thống.
Vì mang tính hệ thống, thử nhìn lại số liệu trên xem vaccine nào là ‘ngon lành’ nhứt? Có lẽ các bạn sẽ nghĩ vaccine của Tây phương (Moderna, Đức) có vẻ ‘dỏm’ quá, vì tỉ lệ tử vong khá cao (11% cho Moderna và gần 6% cho Pfizer), cao hơn hai vaccine của Nga (tỉ lệ tử vong 1%) và Tàu (4.5%).
Nhưng không ai so sánh thô như vậy.
Lí do thứ nhứt là chúng ta không biết tuổi của những người được tiêm giữa các nhóm vaccine. Chúng ta cũng không biết những bệnh đi kèm trong mỗi nhóm vaccine. Tuổi và bệnh đi kèm là hai yếu tố quan trọng liên quan đến nguy cơ tử vong. Quả thật, bài báo cho biết vaccine Pfizer được dùng cho nhân viên y tế và người già cả & yếu, nên chúng ta không ngạc nhiên khi thấy nguy cơ tử vong ở nhóm này khá cao.
Lí do thứ hai là thời gian. Như bài báo có chỉ ra rằng giới chức y tế Hung cho biết thời gian tiêm chủng và theo dõi giữa các nhóm vaccine rất khác nhau. Mà, nguy cơ tử vong thì có liên quan đến thời gian theo dõi. Trong khi thiếu dữ liệu về thời gian, chúng ta không thể nào diễn giải các tỉ lệ trên được (vì nó chẳng có ý nghĩa gì).
Lí do thứ ba là có thể đây là hiện tượng ‘indication bias’, hiểu theo nghĩa người có nguy cơ cao chọn (hay được chỉ định) tiêm vaccine phương Tây, còn người khoẻ mạnh thì [tình nguyện] chọn vaccine Nga và Tàu. Nếu sự thiên lệch này xảy ra, thì các con số trên có thể chỉ là hệ quả của indication bias, chớ không phản ảnh sự khác biệt mang tính hệ thống giữa các nhóm vaccine.
Lí do thư tư liên quan đến thống kê: đó là con số tử vong và con số người bị nhiễm đột phá rất khác biệt giữa các vaccine. Như có thể thấy trong dữ liệu trên, nhóm Spunik chỉ có 2 người chết, nhưng chỉ có số người được tiêm vaccine này thì rất ít. Ngược lại, nhóm Pfizer được tiêm nhiều nhứt và không ngạc nhiên là số ca tử vong cũng cao. Những khác biệt đó làm cho những so sánh thống kê không còn ý nghĩa thật nữa.
Tóm lại, con số về tử vong sau khi tiêm vaccine ở Hungary không cho phép chúng ta so sánh hiệu quả hay rủi ro giữa các vaccine, bởi vì đây là dữ liệu quan sát, chớ không phải là dữ liệu từ một nghiên cứu có kiểm soát. Vì là dữ liệu quan sát, nó không có những yếu tố quan trọng liên quan đến tử vong (như tuổi, tiền sử bệnh lí), nó có thể ‘biased’ vì thời gian và chỉ định, và nó không cân đối. Tất cả những khiếm khuyết đó làm cho bất cứ so sánh nào và bất cứ phân tích thống kê nào cũng trở nên vô nghĩa.
Ấy vậy mà bạn đọc trên cho biết một số người, thậm chí người trong ngành y, dùng bài báo đó để biện minh nên dùng vaccine của Nga và Tàu. Tôi nghĩ nếu điều đó xảy ra thì cách biện minh như vậy hoàn toàn không thuyết phục và phi khoa học. Không ai khuyến cáo dựa vào dữ liệu ngẫu nhiên như thế; người ta phải dựa vào chứng cớ từ nghiên cứu RCT.
Viết đến đây làm tôi nhớ đến câu nói nổi tiếng: “những con số thống kê như bộ đồ bikini: những gì nó phô trương ra thì rất thú vị, nhưng những gì nó che đậy thì mới quan trọng” (statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital).
______
[1] https://dailynewshungary.com/hundreds-have-died-in…
[2] R codes:
vaccine = c(“Sputnik”, “Sinopharm”, “Moderna”, “Pfizer”, “AZ”)
n = c(201, 1744, 108, 3048, 613)
deaths = c(2, 78, 12, 175, 6)
prop.test(deaths, n)
pdeath = deaths/n
df = data.frame(vaccine, n, deaths, pdeath)
library(ggplot2)
ggplot(data=df, aes(x=vaccine, y=pdeath, fill=vaccine)) + geom_bar(stat=”identity”) + theme(legend.position=”none”)
[3] https://www.ksh.hu/stadat_files/nep/en/nep0065.html