Ngọc Vân
(VNTB) – Với những câu hỏi nhạy cảm như “ông/bà/anh/chị có ủng hộ ĐCSVN hay không?”, điều khó nhất là làm sao để người được hỏi trả lời trung thực.
Trong bài trước, tôi đã chia sẻ với bạn đọc về một số lỗi có thể xảy ra khi khảo sát ý kiến. Trong bài này, tôi xin chia sẻ về một số yếu tố cần chú ý trong việc lên kế hoạch lấy mẫu cho việc khảo sát ý kiến.
Tại sao phải lấy mẫu? Giả sử bạn làm nhân viên kiểm tra chất lượng cam mua tại một nhà vườn tại Vĩnh Long cho một siêu thị lớn tại Sài Gòn và muốn kiểm tra để chắc chắn rằng tỷ lệ quả không bị dập đạt yêu cầu tối thiểu mà siêu thị và nhà vườn đã thỏa thuận với nhau. Bạn không thể chỉ kiểm tra một quả vì không phải quả nào cũng dập. Nếu đa số các quả cam trong lô không dập mà bạn lựa trúng quả hư chắc nhà vườn sẽ không đồng ý với kết quả kiểm tra của bạn.
Ngược lại, nếu bạn lựa trúng quả không dập trong khi tỷ lệ quả dập trên thực tế, nếu kiểm tra 100%, trong lô hàng cao hơn mức cho phép thì kết quả kiểm tra của bạn cũng sai. Tương tự, khi lấy ý kiến của công chúng, bạn không thể hỏi ý kiến của một người vì nhiều khả năng các cá nhân có ý kiến khác nhau về cùng một vấn đề. Bạn không thể kiểm tra tất cả các quả cam vì sẽ làm như vậy sẽ mất rất nhiều công sức. Do đó, bạn phải lấy mẫu đại diện. Tương tự vậy, khi khảo sát ý kiến một công chúng trong một quốc gia hay một cộng đồng, bạn cũng phải lấy mẫu để giới hạn chi phí khảo sát.
Để mẫu bạn lấy đại diện cho lô hàng, bạn cần lấy ngẫu nhiên một lượng mẫu, tùy theo số lượng cam trong lô hàng. Lô hàng càng lớn, lượng mẫu lấy phải càng lớn. Người ta lấy mẫu ngẫu nhiên để mọi quả cam, dù dập hay không, có cơ hội lọt vào số mẫu bạn lấy như nhau (xác suất được chọn bằng nhau). Khi đó, mẫu bạn lấy sẽ có chất lượng gần với chất lượng thực của lô hàng. Vì vậy, người ta gọi mẫu này là mẫu đại diện.
Lấy bao nhiêu mẫu là đủ? Câu trả lời phụ thuộc vào một số yếu tố. Đầu tiên là giới hạn sai số. Ví dụ, bạn có thể đọc thấy một đoạn như sau trong một bài báo: tỷ lệ cử tri Hoa Kỳ hài lòng với Tổng Thống Biden là 42% với giới hạn sai số là 3%. Điều này có nghĩa là tỷ lệ ủng hộ thực sự hầu như chắc chắn (với xác suất 95%) nằm trong khoảng 39% đến 45%.
Với cùng một lượng cá thể trong cùng một quần thể, ví dụ như tập hợp những người trưởng thành là công dân Việt Nam, số lượng mẫu lấy càng lớn, giới hạn sai số càng nhỏ vì con số này tỷ lệ nghịch với cỡ mẫu. Cụ thể, giới hạn sai số gần bằng 1/căn bậc hai của cỡ mẫu (1). Như vậy, nếu bạn muốn biết tỷ lệ ủng hộ Đảng Cộng Sản Việt Nam với mức sai số khoảng 4%, bạn cần khảo sát ý kiến của 600 người. Ví dụ, bạn có thể hỏi: ông/bà/anh/chị có ủng hộ ĐCSVN không? Nếu bạn muốn mức sai số là 3%, số mẫu phải là 1100 người.
Ngoài việc lấy mẫu ngẫu nhiên và chọn cỡ mẫu đủ lớn, bạn còn cần chú ý tới một số yếu tố khác trong việc khảo sát ý kiến công chúng. Thay vì tiến hành lấy mẫu ngẫu nhiên một cách đơn giản – bỏ 100 triệu quả cầu, mỗi quả đại diện cho một người Việt Nam vào một quả cầu rồi quay – bạn có thể nên xem xét việc lấy mẫu ngẫu nhiên có phân tầng. Ví dụ, bạn có thể chia họ ra thành nhiều nhóm, theo độ tuổi, giới tính, vùng miền. Sau đó, bạn lấy mẫu ngẫu nhiên tại mỗi vùng với số lượng mẫu tại mỗi vùng tùy thuộc vào dân số của nó. Làm như vậy, bạn có thể khảo sát được ý kiến của những nhóm tuổi khác nhau vì người lớn tuổi nói chung có thể có ý kiến khác thanh niên. Tương tự, người dân ở các vùng khác nhau cũng có thể có ý kiến khác nhau; người thành thị có thể có ý kiến khác người ở nông thôn, người miền Nam, nói chung, có thể có ý kiến khác người miền Bắc.
Với những câu hỏi nhạy cảm như “ông/bà/anh/chị có ủng hộ ĐCSVN hay không?”, điều khó nhất là làm sao để người được hỏi trả lời trung thực. Thật vậy, người được hỏi có thể nghi ngờ người khảo sát là người của chính quyền. Do đó, một số người trong số họ có thể sợ và không trả lời trung thực. Dù không sợ, họ có thể cho rằng trả lời trung thực cũng chẳng được gì, mà còn có thể gặp rắc rối.
Trên đây là một số điểm căn bản nhất cần xem xét khi khảo sát ý kiến công chúng được trình bày để nhằm cảnh báo các nhà hoạt động xã hội. Nói một cách khác, nên suy xét cẩn thận trước khi tin vào kết quả của các cuộc “khảo sát bỏ túi.” Nếu bạn muốn khảo sát một cách nghiêm túc, hãy tham khảo ý kiến của những nhà chuyên môn.
Để kết thúc bài viết, mời bạn đọc trả lời câu hỏi trắc nghiệm kiến thức sau:
Mỗi học sinh trong sô 50 ở trường có một mã số học sinh. Các nhân viên tư vấn dùng máy tính để tạo ra các mã số này và 50 sinh viên này được yêu cầu tham gia một cuộc khảo sát ý kiến (2).
Câu hỏi: Đây là dạng lấy mẫu gì?
A: Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
B: Lấy mẫu ngẫu nhiên phân tầng (Stratified random sampling)
Bạn nào muốn biết câu trả lời đúng xin gửi câu hỏi cho chúng tôi trên bằng các comment trên Trang Facebook của chúng tôi, ngay dưới bài này. Cảm ơn bạn đọc viếng thăm trang nhà của chúng tôi.
___________________
Tài liệu tham khảo
https://en.wikipedia.org/wiki/Margin_of_error#Standard_deviation_and_standard_error
Types of sampling methods | Statistics (article) | Khan Academy
1 comment
Trí thức nhà mềnh hay lấy mẫu ở bàn nhậu với bạn bè, nên đa số đều có cùng ý kiến với mình . Những ai còn lại … Thế mà tao tưởng mày là bạn tao . Có thể gọi là định hướng trí thức xã hội chủ nghĩa .