มาตรการสมาคม
กการวัดความสัมพันธ์วัดปริมาณความแรงหรือขนาดของความสัมพันธ์ทางสถิติระหว่างการสัมผัสและผลลัพธ์ บางครั้งเรียกว่ามาตรการสมาคมมาตรการผลกระทบเพราะหากการได้รับสัมผัสมีความสัมพันธ์เชิงสาเหตุกับผลลัพธ์ด้านสุขภาพ มาตรการจะวัดปริมาณผลกระทบของการสัมผัสต่อความน่าจะเป็นที่ผลลัพธ์ด้านสุขภาพจะเกิดขึ้น
การวัดความสัมพันธ์ที่ใช้กันมากที่สุดในระบาดวิทยาภาคสนามคืออัตราส่วนทั้งหมด ได้แก่ RR, OR, อัตราส่วนความชุก (PR) และความชุกของ OR (POR) อัตราส่วนเหล่านี้ถือได้ว่าเป็นการเปรียบเทียบที่สังเกตได้กับที่คาดไว้ นั่นคือ จำนวนโรคที่สังเกตได้ในกลุ่มบุคคลที่สัมผัส เทียบกับจำนวนโรคที่คาดหวัง (หรือพื้นฐาน) ในกลุ่มบุคคลที่ไม่ได้รับสัมผัส มาตรการดังกล่าวแสดงให้เห็นอย่างชัดเจนว่าปริมาณของโรคในกลุ่มสัมผัสจะใกล้เคียง มากกว่า หรือต่ำกว่า (และมากน้อยเพียงใด) ปริมาณของโรคในกลุ่มที่ตรวจวัดพื้นฐาน
- ค่าของการวัดความสัมพันธ์แต่ละครั้งจะเท่ากับ 1.0 เมื่อปริมาณของโรคเท่ากันในกลุ่มที่สัมผัสและที่ไม่ได้รับสัมผัส
- การวัดค่านี้มีค่ามากกว่า 1.0 เมื่อปริมาณโรคในกลุ่มสัมผัสมีมากกว่ากลุ่มที่ไม่ได้รับสัมผัส ซึ่งสอดคล้องกับผลที่เป็นอันตราย
- การวัดมีค่าน้อยกว่า 1.0 เมื่อปริมาณโรคในกลุ่มสัมผัสน้อยกว่ากลุ่มที่ไม่ได้รับสัมผัส เนื่องจากเมื่อการสัมผัสป้องกันการเกิดโรค (เช่น การฉีดวัคซีน)
มีการใช้มาตรการเชื่อมโยงที่แตกต่างกันกับการศึกษาประเภทต่างๆ มาตรการที่ใช้กันมากที่สุดในการศึกษาตามรุ่นย้อนหลังของการสืบสวนการระบาดโดยทั่วไปคือร.รซึ่งเป็นเพียงอัตราส่วนของอัตราการโจมตี สำหรับการศึกษาเฉพาะกรณีส่วนใหญ่ เนื่องจากไม่สามารถคำนวณอัตราการโจมตีได้ การวัดที่เลือกคือหรือ.
การศึกษาแบบภาคตัดขวางหรือการสำรวจมักจะวัดความชุก (กรณีที่มีอยู่) มากกว่าอุบัติการณ์ (กรณีใหม่) ของภาวะสุขภาพ มาตรการความชุกของการเชื่อมโยงคล้ายคลึงกับ RR และ OR—theประชาสัมพันธ์และโดยตามลำดับ—มีการใช้กันทั่วไป
อัตราส่วนความเสี่ยง (ความเสี่ยงสัมพัทธ์)
RR ซึ่งเป็นหน่วยวัดที่ต้องการสำหรับการศึกษาตามรุ่น คำนวณจากอัตราการโจมตี (ความเสี่ยง) ในกลุ่มที่สัมผัส หารด้วยอัตราการโจมตี (ความเสี่ยง) ในกลุ่มที่ไม่ได้รับสัมผัส การใช้สัญลักษณ์ในเอกสารประกอบคำบรรยาย 8.3
RR=ความเสี่ยงถูกเปิดเผย/เสี่ยงไม่ได้เปิดเผย= (ก/ฮ1) / (c/H0)
จากตารางที่ 8.2อัตราการโจมตี (เช่น ความเสี่ยง) ในการเกิดโรคทิวลารีเมียจากคอหอยในผู้ที่ดื่มน้ำประปาในงานเลี้ยงคือ 26.6% อัตราการโจมตี (เช่น ความเสี่ยง) สำหรับผู้ที่ไม่ดื่มน้ำประปาคือ 10.6% ดังนั้น RR จึงคำนวณได้เป็น 0.266/ 0.106 = 2.5 กล่าวคือ ผู้ที่ดื่มน้ำประปามีโอกาสป่วยมากกว่าผู้ที่ไม่ดื่มน้ำประปา 2.5 เท่า (1).
อัตราส่วนราคาต่อรอง
OR คือการวัดความสัมพันธ์ที่ต้องการสำหรับข้อมูลการควบคุมเคส ตามหลักการแล้ว คำนวณเป็นอัตราต่อรองของการสัมผัสในกลุ่มผู้ป่วยที่เป็นเคส หารด้วยโอกาสของการสัมผัสในกลุ่มควบคุม อย่างไรก็ตาม ในทางปฏิบัติ จะคำนวณเป็นอัตราส่วนผลิตภัณฑ์ข้าม การใช้สัญลักษณ์ในเอกสารประกอบคำบรรยาย 8.3
หรือ = โฆษณา/BC
ข้อมูลตัวอย่างในเอกสารประกอบคำบรรยาย 8.4 มาจากการศึกษาเฉพาะกรณีเกี่ยวกับภาวะไตวายเฉียบพลันในปานามาเมื่อปี พ.ศ. 2549 (3) เนื่องจากข้อมูลจากการศึกษาแบบมีกรณีควบคุม จึงไม่สามารถคำนวณอัตราการโจมตี (ความเสี่ยง) และ RR ได้ ค่า OR ซึ่งคำนวณเป็น 37 × 110/ (29 × 4) = 35.1 นั้นมีค่าสูงเป็นพิเศษ ซึ่งบ่งชี้ถึงความสัมพันธ์ที่ชัดเจนระหว่างการรับประทานยาแก้ไอเหลวกับภาวะไตวายเฉียบพลัน
น่าสับสน
การสับสนคือการบิดเบือนของความสัมพันธ์ระหว่างการสัมผัสและผลลัพธ์โดยผลของปัจจัยที่สาม (aผู้สับสน). ปัจจัยที่สามอาจเป็นตัวสับสนหากเป็นเช่นนั้น
- เกี่ยวข้องกับผลลัพธ์ที่เป็นอิสระจากการสัมผัส นั่นคือ จะต้องเป็นปัจจัยเสี่ยงที่เป็นอิสระ และ,
- เกี่ยวข้องกับการสัมผัสแต่ไม่ได้เป็นผลตามมา
พิจารณาการศึกษาตามรุ่นเชิงสมมุติย้อนหลังเกี่ยวกับการเสียชีวิตของพนักงานฝ่ายการผลิตที่ระบุว่าคนงานที่เกี่ยวข้องกับกระบวนการผลิตมีแนวโน้มที่จะเสียชีวิตในช่วงระยะเวลาติดตามผลมากกว่าพนักงานออฟฟิศและพนักงานขายในอุตสาหกรรมเดียวกัน
- การเพิ่มขึ้นของอัตราการตายแบบสะท้อนกลับอาจเกิดจากการสัมผัสหนึ่งหรือหลายครั้งในระหว่างกระบวนการผลิต
- อย่างไรก็ตาม หากอายุเฉลี่ยของคนงานในโรงงานคือ 15 ปีมากกว่าคนงานคนอื่นๆ อัตราการตายก็คาดว่าจะสูงขึ้นอย่างสมเหตุสมผลในหมู่คนงานที่มีอายุมากกว่า
- ในสถานการณ์นั้น อายุน่าจะเป็นตัวสับสนที่อาจเป็นสาเหตุของการเสียชีวิตที่เพิ่มขึ้นอย่างน้อยที่สุด (โปรดทราบว่าอายุเป็นไปตามเกณฑ์สองข้อที่อธิบายไว้ก่อนหน้านี้ อายุที่เพิ่มขึ้นสัมพันธ์กับอัตราการเสียชีวิตที่เพิ่มขึ้น โดยไม่คำนึงถึงอาชีพ และในอุตสาหกรรมนั้น อายุสัมพันธ์กับงาน โดยเฉพาะพนักงานฝ่ายการผลิตมีอายุมากกว่าพนักงานออฟฟิศ)
น่าเสียดายที่การสับสนเป็นเรื่องปกติ ขั้นตอนแรกในการจัดการกับความสับสนคือการมองหามัน หากมีการระบุสิ่งที่น่าสับสน ขั้นตอนที่สองคือการควบคุมหรือปรับผลกระทบที่บิดเบือนโดยใช้วิธีการทางสถิติที่มีอยู่
กำลังมองหาสิ่งที่น่าสับสน
วิธีการที่ใช้กันทั่วไปในการค้นหาสิ่งที่สับสนคือการแบ่งชั้นความสัมพันธ์ระหว่างการสัมผัสและผลลัพธ์ที่น่าสนใจตามตัวแปรที่สามที่สงสัยว่าเป็นตัวรบกวน
- ในการแบ่งชั้น (ดูหัวข้อก่อนหน้า) ให้สร้างตารางแยกกันแบบสองต่อสองสำหรับแต่ละหมวดหมู่หรือชั้นของผู้ต้องสงสัย และพิจารณาสิ่งต่อไปนี้เมื่อประเมินผู้ต้องสงสัย:
- เนื่องจากหนึ่งในสองเกณฑ์สำหรับตัวแปรรบกวนคือควรเชื่อมโยงกับผลลัพธ์ รายชื่อปัจจัยรบกวนที่อาจเกิดขึ้นควรรวมปัจจัยเสี่ยงที่ทราบสำหรับโรคด้วย รายการควรมีตัวแปรที่ตรงกันด้วย เนื่องจากอายุมักเป็นตัวสร้างความสับสน จึงควรพิจารณาว่าอาจเป็นตัวสร้างความสับสนในชุดข้อมูลใดๆ
- สำหรับแต่ละชั้น ให้คำนวณการวัดการเชื่อมโยงเฉพาะชั้น หากตัวแปรการแบ่งชั้นเป็นเพศ จะมีเพียงผู้หญิงเท่านั้นที่จะอยู่ในชั้นหนึ่งและผู้ชายเท่านั้นที่อยู่ในอีกชั้นหนึ่ง การเชื่อมโยงระหว่างการสัมผัสและผลลัพธ์จะคำนวณแยกกันสำหรับผู้หญิงและผู้ชาย เพศไม่สามารถเป็นปัญหากวนใจในชั้นเหล่านี้ได้อีกต่อไป เพราะผู้หญิงถูกเปรียบเทียบกับผู้หญิง และผู้ชายก็ถูกเปรียบเทียบกับผู้ชาย
OR เป็นการวัดความสัมพันธ์ที่มีประโยชน์ เนื่องจากให้ค่าประมาณความสัมพันธ์ระหว่างการสัมผัสและโรคจากข้อมูลกลุ่มควบคุมเมื่อไม่สามารถคำนวณ RR ได้ นอกจากนี้ เมื่อผลลัพธ์ค่อนข้างไม่ปกติในหมู่ประชากร (เช่น <5%) OR จากการศึกษาแบบมีกรณีควบคุมจะประมาณค่า RR ที่จะได้มาจากการศึกษาตามรุ่นที่ได้รับการดำเนินการ อย่างไรก็ตาม เมื่อผลลัพธ์เป็นเรื่องธรรมดามากขึ้น OR จะประเมินค่า RR สูงเกินไป
อัตราส่วนความชุกและอัตราส่วนอัตราต่อรองความชุก
การศึกษาแบบภาคตัดขวางหรือการสำรวจมักจะวัดความชุกมากกว่าอุบัติการณ์ของภาวะสุขภาพ (เช่น สถานะการฉีดวัคซีน) หรือสภาวะ (เช่น ความดันโลหิตสูง) ในประชากร มาตรการความชุกของการเชื่อมโยงที่คล้ายคลึงกับ RR และ OR คือตามลำดับประชาสัมพันธ์และโดย.
PR คำนวณจากความชุกระหว่างกลุ่มดัชนีหารด้วยความชุกระหว่างกลุ่มเปรียบเทียบ การใช้สัญลักษณ์ในเอกสารประกอบคำบรรยาย 8.3,
PR = ความชุกดัชนี/ความชุกการเปรียบเทียบ= (ก/ฮ1) / (c/H0)
POR ถูกคำนวณเหมือนกับ OR
สำหรับ = โฆษณา/bc
ในการศึกษาความชุกของการติดเชื้อ HIV ในกลุ่มผู้ใช้โคเคนแคร็กเทียบกับไม่เคยใช้ พบว่าผู้ใช้ปัจจุบัน 165 รายจาก 780 รายติดเชื้อ HIV (ความชุก = 21.2%) เทียบกับ 40 รายจาก 464 รายที่ไม่เคยใช้ (ความชุก = 8.6%) (4) PR และ POR ใกล้เคียงกัน (2.5 และ 2.8 ตามลำดับ) แต่ PR อธิบายได้ง่ายกว่า
เอกสารประกอบคำบรรยาย 8.4
อัตราต่อรอง = 35.1; ช่วงความเชื่อมั่น 95% = (11.6–106.4); ไคสแควร์ (ไม่แก้ไข) = 65.6 (p<0.001)
แหล่งที่มา:ดัดแปลงมาจากอ้างอิง 3.
มาตรการผลกระทบด้านสาธารณสุข
กการวัดผลกระทบด้านสาธารณสุขวางการเชื่อมโยงระหว่างการสัมผัส-โรคในมุมมองด้านสาธารณสุข มาตรการวัดผลกระทบสะท้อนให้เห็นถึงการมีส่วนร่วมที่ชัดเจนของการสัมผัสกับผลลัพธ์ด้านสุขภาพในหมู่ประชากร ตัวอย่างเช่น สำหรับการสัมผัสที่เกี่ยวข้องกับความเสี่ยงที่เพิ่มขึ้นสำหรับโรค (เช่น การสูบบุหรี่และมะเร็งปอด)เปอร์เซ็นต์ความเสี่ยงที่เกี่ยวข้องแสดงถึงปริมาณมะเร็งปอดในกลุ่มผู้สูบบุหรี่ที่สูบบุหรี่ ซึ่งยังถือได้ว่าเป็นการลดภาระโรคที่คาดหวังหากสามารถกำจัดการสัมผัสออกหรือไม่เคยมีอยู่เลย
สำหรับการสัมผัสที่เกี่ยวข้องกับความเสี่ยงที่ลดลงสำหรับโรค (เช่น การฉีดวัคซีน) ให้เศษส่วนที่ป้องกันได้แสดงถึงการลดลงของปริมาณโรคที่สังเกตได้เนื่องมาจากระดับการสัมผัสในปัจจุบันของประชากร โปรดทราบว่าข้อกำหนดเนื่องมาจากและป้องกันสื่อได้มากกว่าการเชื่อมโยงทางสถิติเท่านั้น สิ่งเหล่านี้บ่งบอกถึงความสัมพันธ์ระหว่างเหตุและผลโดยตรงระหว่างการสัมผัสและโรค ดังนั้นควรนำเสนอมาตรการเหล่านี้หลังจากการอนุมานสาเหตุอย่างรอบคอบแล้วเท่านั้น
เปอร์เซ็นต์ความเสี่ยงที่เกี่ยวข้อง
เปอร์เซ็นต์ความเสี่ยงที่เกี่ยวข้อง (สัดส่วนหรือสัดส่วนระหว่างผู้ที่สัมผัส เศษส่วนสาเหตุ) คือสัดส่วนของผู้ป่วยในกลุ่มสัมผัสซึ่งสันนิษฐานว่าเนื่องมาจากการสัมผัส มาตรการนี้สันนิษฐานว่าระดับความเสี่ยงในกลุ่มที่ไม่ได้รับเชื้อ (ซึ่งถือว่ามีความเสี่ยงพื้นฐานหรือภูมิหลังสำหรับโรค) ใช้กับกลุ่มที่สัมผัสด้วย ดังนั้นเฉพาะส่วนเกินความเสี่ยงควรเป็นผลมาจากการสัมผัส เปอร์เซ็นต์ความเสี่ยงที่ระบุสามารถคำนวณได้โดยใช้สูตรเทียบเท่าทางพีชคณิตอย่างใดอย่างหนึ่งต่อไปนี้:
เปอร์เซ็นต์ความเสี่ยงที่ระบุแหล่งที่มา = (riskถูกเปิดเผย/ เสี่ยงไม่ได้เปิดเผย) / เสี่ยงถูกเปิดเผย= (RR–1) / RR
ในกรณีศึกษาแบบควบคุม หาก OR เป็นการประมาณค่า RR ที่สมเหตุสมผล เปอร์เซ็นต์ความเสี่ยงที่เกี่ยวข้องสามารถคำนวณได้จาก OR
เปอร์เซ็นต์ความเสี่ยงที่ระบุแหล่งที่มา = (OR–1) / OR
ในสภาวะที่มีการระบาด สามารถใช้เปอร์เซ็นต์ความเสี่ยงที่ระบุแหล่งที่มาเพื่อวัดปริมาณภาระโรคที่สามารถกำหนดให้กับการสัมผัสโดยเฉพาะได้
เศษส่วนที่ป้องกันได้ในกลุ่มที่ได้รับเชื้อ (ประสิทธิภาพของวัคซีน)
เศษส่วนที่ป้องกันในกลุ่มสัมผัสสามารถคำนวณได้เมื่อ RR หรือ OR น้อยกว่า 1.0 มาตรการนี้เป็นสัดส่วนของกรณีที่อาจเกิดขึ้นซึ่งป้องกันได้โดยการสัมผัสที่เป็นประโยชน์ (เช่น มุ้งที่ป้องกันยุงกัดในเวลากลางคืน และผลที่ตามมาคือโรคมาลาเรีย) นอกจากนี้ยังถือได้ว่าเป็นสัดส่วนของผู้ป่วยรายใหม่ที่จะเกิดขึ้นหากไม่มีการสัมผัสที่เป็นประโยชน์ ในทางพีชคณิต เศษส่วนที่ได้รับการป้องกันในกลุ่มประชากรที่สัมผัสจะเหมือนกับประสิทธิภาพของวัคซีน
สัดส่วนที่ป้องกันได้ในกลุ่มที่ได้รับสัมผัส = ประสิทธิภาพของวัคซีน = (ความเสี่ยงถูกเปิดเผย/ เสี่ยงไม่ได้เปิดเผย) /= ความเสี่ยงไม่ได้เปิดเผย= 1 อาร์อาร์
เอกสารประกอบคำบรรยาย 8.5แสดงข้อมูลจากการระบาดของโรคอีสุกอีใส (อีสุกอีใส) ที่โรงเรียนประถมศึกษาในรัฐเนแบรสกา เมื่อปี 2547 (5). ความเสี่ยงต่อการเกิด varicella คือ 13.6% ในเด็กที่ได้รับวัคซีน และ 66.7% ในเด็กที่ไม่ได้รับการฉีดวัคซีน ประสิทธิภาพของวัคซีนจากข้อมูลเหล่านี้คำนวณเป็น (0.667 – 0.130)/ 0.667 = 0.805 หรือ 80.5% ประสิทธิภาพวัคซีน 80.5% นี้บ่งชี้ว่าการฉีดวัคซีนป้องกันได้ประมาณ 80% ของกรณีที่จะเกิดขึ้นกับเด็กที่ได้รับวัคซีนหากไม่ได้รับการฉีดวัคซีน
เอกสารประกอบคำบรรยาย 8.5
อัตราส่วนความเสี่ยง = 13.0/ 66.7 = 0.195; ประสิทธิภาพวัคซีน = (66.7 − 13.0)/ 66.7 = 80.5%
แหล่งที่มา:ดัดแปลงมาจากอ้างอิง 5.
การทดสอบนัยสำคัญทางสถิติ
การทดสอบที่มีนัยสำคัญทางสถิติถูกนำมาใช้เพื่อพิจารณาว่าผลลัพธ์ที่สังเกตได้น่าจะเกิดขึ้นโดยบังเอิญเพียงอย่างเดียวหากการสัมผัสไม่เกี่ยวข้องกับผลลัพธ์ด้านสุขภาพ ส่วนนี้จะอธิบายปัจจัยสำคัญที่ต้องพิจารณาเมื่อใช้การทดสอบทางสถิติกับข้อมูลจากตารางแบบสองต่อสอง
- การทดสอบทางสถิติเริ่มต้นด้วยสมมติฐานว่า ในกลุ่มประชากรต้นทาง การได้รับสัมผัสไม่เกี่ยวข้องกับโรค สมมติฐานนี้เรียกว่าสมมติฐานว่าง. ที่สมมติฐานทางเลือกซึ่งจะถูกนำมาใช้หากสมมติฐานว่างพิสูจน์ได้ว่าไม่น่าเชื่อ นั่นคือการเปิดเผยนั้นเป็นเกี่ยวข้องกับโรค
- จากนั้น คำนวณการวัดการเชื่อมโยง (เช่น RR หรือ OR)
- จากนั้นเลือกและคำนวณการทดสอบนัยสำคัญทางสถิติ (เช่น ไคสแควร์) Epi Info และโปรแกรมคอมพิวเตอร์อื่นๆ จะทำการทดสอบเหล่านี้โดยอัตโนมัติ การทดสอบให้ความน่าจะเป็นในการค้นหาการเชื่อมโยงที่แข็งแกร่งเท่ากับหรือแข็งแกร่งกว่าการเชื่อมโยงที่สังเกตได้ว่าสมมติฐานว่างเป็นจริงหรือไม่ ความน่าจะเป็นนี้เรียกว่าค่าพี.
- ที่มีขนาดเล็กพีค่าหมายความว่าคุณไม่น่าจะสังเกตเห็นการเชื่อมโยงดังกล่าวหากสมมติฐานว่างเป็นจริง กล่าวอีกนัยหนึ่งมีขนาดเล็กพีค่าบ่งชี้ว่าสมมติฐานว่างนั้นไม่น่าเชื่อ เมื่อพิจารณาจากข้อมูลที่มีอยู่
- ถ้านี้พีค่ามีขนาดเล็กกว่าจุดตัดที่กำหนดไว้ล่วงหน้าเรียกว่าอัลฟ่า(ปกติคือ 0.05 หรือ 5%) คุณละทิ้ง (ปฏิเสธ) สมมติฐานว่าง แล้วหันไปใช้สมมติฐานทางเลือกแทน สมาคมจึงได้กล่าวไปแล้วว่ามีนัยสำคัญทางสถิติ.
- ถ้าพีค่ามากกว่าจุดตัด (เช่นพีค่า >0.06) อย่าปฏิเสธสมมติฐานว่าง การเชื่อมโยงที่ชัดเจนอาจเป็นโอกาสในการค้นพบ
- ในการตัดสินใจเกี่ยวกับสมมติฐานว่าง คุณอาจทำข้อผิดพลาดประเภทใดประเภทหนึ่งจากสองประเภท
- ในพิมพ์ผิด(หรือเรียกอีกอย่างว่าข้อผิดพลาดอัลฟ่า) สมมติฐานว่างจะถูกปฏิเสธเมื่อเป็นจริง
- ในข้อผิดพลาดประเภท II(หรือเรียกอีกอย่างว่าข้อผิดพลาดเบต้า) สมมติฐานว่างจะไม่ถูกปฏิเสธ ทั้งที่ในความเป็นจริงมันเป็นเท็จ
การทดสอบและการตีความข้อมูลในตารางสองต่อสอง
สำหรับข้อมูลในตารางแบบสองต่อสอง Epi Info รายงานผลลัพธ์จากการทดสอบที่แตกต่างกันสองแบบ ได้แก่ การทดสอบไคสแควร์และการทดสอบที่แน่นอนของฟิชเชอร์ โดยแต่ละรายการมีความแตกต่างกัน (เอกสารประกอบคำบรรยาย 8.2). การทดสอบเหล่านี้ไม่เฉพาะเจาะจงสำหรับการวัดความสัมพันธ์ใดๆ โดยเฉพาะ สามารถใช้แบบทดสอบเดียวกันได้ไม่ว่าคุณจะสนใจ RR, OR หรือเปอร์เซ็นต์ความเสี่ยงที่เกี่ยวข้องก็ตาม
- จะใช้การทดสอบใด?
- หากค่าที่คาดหวังในเซลล์ใดๆ น้อยกว่า 5การทดสอบที่แน่นอนของฟิชเชอร์เป็นมาตรฐานที่ยอมรับกันทั่วไป เมื่อค่าที่คาดหวังในเซลล์ใดๆ น้อยกว่า 5 (ข้อควรจำ: ค่าที่คาดหวังสำหรับเซลล์ใดๆ สามารถกำหนดได้โดยการคูณผลรวมของแถวด้วยผลรวมของคอลัมน์แล้วหารด้วยผลรวมของตาราง)
- ถ้าค่าที่คาดหวังทั้งหมดในตารางแบบสองต่อสองคือ 5 หรือมากกว่าเลือกหนึ่งในการทดสอบไคสแควร์ โชคดีที่สำหรับการวิเคราะห์ส่วนใหญ่ สูตรไคสแควร์ทั้งสามสูตรมีให้พีค่าที่ใกล้เคียงกันเพียงพอที่จะตัดสินใจแบบเดียวกันเกี่ยวกับสมมติฐานว่างจากทั้งสามข้อ อย่างไรก็ตาม เมื่อสูตรที่ต่างกันชี้ไปที่การตัดสินใจที่แตกต่างกัน (โดยปกติเมื่อทั้งสามพีค่าประมาณ 0.05) ต้องใช้วิจารณญาณทางระบาดวิทยา นักระบาดวิทยาภาคสนามบางคนชอบสูตรที่แก้ไขโดยเยตส์ เนื่องจากมีแนวโน้มที่จะทำให้เกิดข้อผิดพลาดประเภทที่ 1 น้อยที่สุด (แต่มีแนวโน้มที่จะทำให้เกิดข้อผิดพลาดประเภทที่ 2 มากที่สุด) คนอื่นยอมรับว่าการแก้ไขของเยตส์มักจะชดเชยมากเกินไป ดังนั้นพวกเขาจึงชอบสูตรที่ไม่ได้รับการแก้ไข นักระบาดวิทยาที่ทำการวิเคราะห์แบบแบ่งชั้นบ่อยครั้งจะคุ้นเคยกับการใช้สูตร Mantel-Haenszel ดังนั้นพวกเขาจึงมักจะใช้สูตรนี้แม้กระทั่งกับตารางแบบสองต่อสองแบบธรรมดาก็ตาม
- การวัดความสัมพันธ์เทียบกับการทดสอบนัยสำคัญ.
- มาตรการสมาคมการวัดความสัมพันธ์ (เช่น RR และ OR) สะท้อนถึงความเข้มแข็งของความสัมพันธ์ระหว่างการสัมผัสและโรค มาตรการเหล่านี้มักจะไม่ขึ้นอยู่กับขนาดของการศึกษา และถือได้ว่าเป็นการคาดเดาระดับความสัมพันธ์ที่แท้จริงของประชากรต้นทางได้ดีที่สุด อย่างไรก็ตาม มาตรการดังกล่าวไม่ได้บ่งชี้ถึงความน่าเชื่อถือ (เช่น จะต้องเชื่อมั่นมากน้อยเพียงใด)
- การทดสอบความสำคัญในทางตรงกันข้าม การทดสอบนัยสำคัญให้ข้อบ่งชี้ว่ามีความเป็นไปได้เพียงใดที่ความสัมพันธ์ที่สังเกตได้นั้นเป็นผลมาจากโอกาส แม้ว่าสถิติการทดสอบไคสแควร์จะได้รับอิทธิพลทั้งจากขนาดของการเชื่อมโยงและขนาดการศึกษา แต่ก็ไม่ได้แยกแยะการมีส่วนร่วมของแต่ละรายการ ดังนั้น การวัดความสัมพันธ์และการทดสอบนัยสำคัญ (หรือ CI ดูช่วงความเชื่อมั่นสำหรับการวัดความสัมพันธ์) จึงให้ข้อมูลเสริม
- การตีความผลการทดสอบทางสถิติ ไม่สำคัญไม่ได้แปลว่าไม่มีการเชื่อมโยงเสมอไป มาตรการสมาคม (RR หรือ OR) บ่งบอกถึงทิศทางและความเข้มแข็งของสมาคม การทดสอบทางสถิติบ่งชี้ว่ามีความเป็นไปได้เพียงใดที่ความสัมพันธ์ที่สังเกตได้อาจเกิดขึ้นโดยบังเอิญเพียงอย่างเดียว การไม่มีนัยสำคัญอาจไม่สะท้อนถึงความเกี่ยวข้องกันระหว่างประชากรต้นทาง แต่ก็อาจสะท้อนถึงขนาดการศึกษาที่เล็กเกินไปที่จะตรวจพบความสัมพันธ์ที่แท้จริงระหว่างประชากรต้นทาง
- บทบาทของนัยสำคัญทางสถิตินัยสำคัญทางสถิติไม่ได้บ่งชี้ถึงความสัมพันธ์ระหว่างเหตุและผล การเชื่อมโยงที่สังเกตได้อาจแสดงถึงการเชื่อมโยงเชิงสาเหตุอย่างแท้จริง แต่ก็อาจเป็นผลมาจากโอกาส ความลำเอียงในการเลือก ความลำเอียงของข้อมูล การสับสน หรือแหล่งที่มาของข้อผิดพลาดอื่นๆ ในการออกแบบ การดำเนินการ หรือการวิเคราะห์ของการศึกษา การทดสอบทางสถิติเกี่ยวข้องเฉพาะกับบทบาทของโอกาสในการอธิบายความสัมพันธ์ที่สังเกตได้ และนัยสำคัญทางสถิติบ่งชี้เพียงว่าโอกาสนั้นไม่น่าเป็นไปได้ แม้ว่าจะไม่ใช่คำอธิบายที่เป็นไปไม่ได้ก็ตาม จำเป็นต้องมีการตัดสินทางระบาดวิทยาเมื่อพิจารณาเกณฑ์เหล่านี้และเกณฑ์อื่นๆ สำหรับการอนุมานสาเหตุ (เช่น ความสอดคล้องของผลการวิจัยกับผลจากการศึกษาอื่นๆ ความสัมพันธ์ชั่วคราวระหว่างการสัมผัสและโรค หรือความน่าเชื่อถือทางชีววิทยา)
- ผลกระทบด้านสาธารณสุขที่มีนัยสำคัญทางสถิติท้ายที่สุด นัยสำคัญทางสถิติไม่ได้หมายถึงนัยสำคัญด้านสาธารณสุขเสมอไป จากการศึกษาจำนวนมาก ความสัมพันธ์ที่อ่อนแอกับการสาธารณสุขหรือความเกี่ยวข้องทางคลินิกเพียงเล็กน้อยอาจมีนัยสำคัญทางสถิติ โดยทั่วไป หากการศึกษามีขนาดเล็ก ความสัมพันธ์ด้านสาธารณสุขหรือความสำคัญทางคลินิกอาจไม่บรรลุถึงนัยสำคัญทางสถิติ
ช่วงความเชื่อมั่นสำหรับมาตรการสมาคม
วารสารทางการแพทย์และสาธารณสุขหลายแห่งกำหนดให้สมาคมต้องอธิบายด้วยมาตรการสมาคมและ CI แทนพีค่าหรือการทดสอบทางสถิติอื่นๆ การวัดความสัมพันธ์ เช่น RR หรือ OR จะให้ค่าเดียว (การประมาณการแบบจุด) ที่จะระบุความสัมพันธ์ระหว่างการสัมผัสและผลลัพธ์ด้านสุขภาพได้ดีที่สุด CI ให้การประมาณช่วงหรือช่วงของค่าที่รับทราบความไม่แน่นอนของการประมาณค่าจุดจำนวนจุดเดียว โดยเฉพาะอย่างยิ่งค่าที่อิงตามกลุ่มตัวอย่างประชากร
ช่วงความเชื่อมั่น 95%
นักสถิติกำหนด CI 95% เป็นช่วงเวลาที่เมื่อมีการสุ่มตัวอย่างซ้ำของประชากรต้นทาง จะรวมหรือครอบคลุมมูลค่าการเชื่อมโยงที่แท้จริง 95% ของเวลา แนวคิดทางระบาดวิทยาของ CI 95% คือการรวมช่วงของค่าที่สอดคล้องกับข้อมูลในการศึกษา (6).
ความสัมพันธ์ระหว่างการทดสอบไคสแควร์และช่วงความเชื่อมั่น
การทดสอบไคสแควร์และ CI มีความสัมพันธ์กันอย่างใกล้ชิด การทดสอบไคสแควร์ใช้ข้อมูลที่สังเกตได้เพื่อกำหนดความน่าจะเป็น (พีค่า) ภายใต้สมมติฐานว่าง และอีกคนหนึ่งปฏิเสธสมมติฐานว่างหากความน่าจะเป็นน้อยกว่าอัลฟา (เช่น 0.05) CI ใช้ค่าความน่าจะเป็นที่เลือกไว้ล่วงหน้า อัลฟา (เช่น 0.05) เพื่อกำหนดขีดจำกัดของช่วงเวลา (1 − อัลฟา = 0.95) และค่าหนึ่งจะปฏิเสธสมมติฐานว่างหากช่วงนั้นไม่รวมค่าการเชื่อมโยงที่เป็นโมฆะ ทั้งสองอย่างบ่งบอกถึงความแม่นยำของการเชื่อมโยงที่สังเกตได้ ทั้งสองได้รับอิทธิพลจากขนาดของสมาคมและขนาดของกลุ่มการศึกษา แม้ว่าทั้งสองจะวัดความแม่นยำ แต่ก็ไม่ได้กล่าวถึงความถูกต้อง (ไม่มีอคติ)
การตีความช่วงความเชื่อมั่น
- ความหมายของช่วงความเชื่อมั่น. CI ถือได้ว่าเป็นช่วงของค่าที่สอดคล้องกับข้อมูลในการศึกษา สมมติว่าการศึกษาที่ดำเนินการในท้องถิ่นให้ค่า RR เท่ากับ 4.0 สำหรับความสัมพันธ์ระหว่างการใช้ยาทางหลอดเลือดดำกับโรค X; CI 95% อยู่ระหว่าง 3.0 ถึง 5.3 จากการศึกษาดังกล่าว ค่าประมาณที่ดีที่สุดของความสัมพันธ์ระหว่างการใช้ยาทางหลอดเลือดดำกับโรค X ในประชากรทั่วไปคือ 4.0 แต่ข้อมูลมีความสอดคล้องกับค่าตั้งแต่ 3.0 ถึง 5.3 การศึกษาความสัมพันธ์เดียวกันที่ดำเนินการที่อื่นที่ให้ผล RR 3.2 หรือ 5.2 จะถือว่าเข้ากันได้ แต่การศึกษาที่ให้ผล RR 1.2 หรือ 6.2 จะไม่ถือว่าเข้ากัน ตอนนี้ให้พิจารณาการศึกษาอื่นที่ให้ผล RR 1.0, CI จาก 0.9 ถึง 1.1 และพีค่า = 0.9 แทนที่จะตีความผลลัพธ์เหล่านี้ว่าไม่มีนัยสำคัญและไม่ให้ข้อมูล คุณสามารถสรุปได้ว่าการสัมผัสไม่ได้เพิ่มหรือลดความเสี่ยงต่อโรค ข้อความดังกล่าวสามารถให้ความมั่นใจได้หากการเปิดเผยดังกล่าวเป็นเรื่องที่น่ากังวลต่อสาธารณชนที่เป็นกังวล ดังนั้นค่าที่รวมอยู่ใน CI และค่าที่ CI ยกเว้นจึงให้ข้อมูลที่สำคัญ
- ความกว้างของช่วงความเชื่อมั่นความกว้างของ CI (นั่นคือ ค่าที่รวมไว้) สะท้อนถึงความแม่นยำซึ่งการศึกษาสามารถระบุการเชื่อมโยงได้ CI แบบกว้างสะท้อนถึงความแปรปรวนหรือความไม่แม่นยำจำนวนมาก CI ที่แคบสะท้อนถึงความแปรปรวนน้อยลงและมีความแม่นยำสูงกว่า โดยปกติแล้ว ยิ่งจำนวนวิชาหรือการสังเกตในการศึกษามีมากขึ้น ความแม่นยำก็จะมากขึ้น และค่า CI ก็จะยิ่งแคบลงเท่านั้น
- ความสัมพันธ์ของช่วงความเชื่อมั่นกับสมมติฐานว่างเนื่องจาก CI สะท้อนถึงช่วงของค่าที่สอดคล้องกับข้อมูลในการศึกษา CI จึงสามารถใช้แทนการทดสอบทางสถิติได้ (เช่น เพื่อพิจารณาว่าข้อมูลสอดคล้องกับสมมติฐานว่างหรือไม่) ข้อควรจำ: สมมติฐานว่างระบุว่า RR หรือ OR เท่ากับ 1.0; ดังนั้น CI ที่มี 1.0 จึงเข้ากันได้กับสมมติฐานว่าง นี่เทียบเท่ากับการสรุปว่าสมมติฐานว่างไม่สามารถปฏิเสธได้ ในทางตรงกันข้าม CI ที่ไม่รวม 1.0 บ่งชี้ว่าควรปฏิเสธสมมติฐานว่างเนื่องจากไม่สอดคล้องกับผลการศึกษา ดังนั้น CI จึงสามารถใช้เป็นการทดสอบตัวแทนที่มีนัยสำคัญทางสถิติได้
ช่วงความเชื่อมั่นในสภาวะการระบาดของโรคที่เกิดจากอาหาร
ในบริบทของการระบาดที่เกิดจากอาหาร เป้าหมายคือเพื่อระบุอาหารหรือยานพาหนะอื่นๆ ที่ก่อให้เกิดการเจ็บป่วย ในการตั้งค่านี้ จะมีการคำนวณการวัดความสัมพันธ์ (เช่น RR หรือ OR) เพื่อระบุอาหารหรือวัสดุสิ้นเปลืองอื่น ๆ ที่มีค่าสูงที่อาจก่อให้เกิดการระบาด โดยปกติแล้ว ผู้วิจัยจะไม่สนใจว่า RR สำหรับรายการอาหารเฉพาะเจาะจงคือ 5.7 หรือ 9.3 เพียงแต่ว่า RR นั้นสูงและไม่น่าจะเกิดจากความบังเอิญ ดังนั้น จึงควรประเมินรายการอาหารนั้นเพิ่มเติม เพื่อจุดประสงค์นั้น การประมาณจุด (RR หรือ OR) บวก aพีค่าเพียงพอและ CI ก็ไม่จำเป็น