الفصل الثالث

البحث عن أسباب المرض

العوامل المسببة للمرض والتعرض لها

إننا نستخدم كلمة «سبب» كثيرًا في أحاديثنا اليومية. يبدو المفهوم بسيطًا من الناحية البديهية، غير أنه ملغز من الناحية المنطقية وقد تعرض لجدل متواصل منذ عهد الفلاسفة الإغريق — وتحديدًا أرسطو — الذين بدءوا يضعون تعريفًا له في القرن الخامس قبل الميلاد. وأسباب المرض ليست استثناءً من تلك الصعوبة. فعندما يصاب عدة أشخاص بنزلات معوية عقب مرور ساعات قليلة من تناولهم وجبة عشاء بأحد الأندية، فما السبب؟ هل هي وجبة العشاء التي من دونها ما كان من الممكن أن تحدث المشكلات المعوية؟ هل هي حلوى التيراميسو، باعتبار أن من تناولوها هم فقط من أصيبوا بالنزلة؟ هل هي البكتيريا العنقودية الذهبية التي — مثلما أوضحت الفحوص المعملية لاحقًا — وجدت طريقها إلى حلوى التيراميسو نتيجة خلل في إجراءات النظافة بالمطبخ؟ هل هو السم الذي أنتجته البكتيريا التي تهاجم خلايا بطانة الأمعاء؟ هل هو الجزء النشط بيولوجيًّا من جزيء السم الذي يتحد مع بعض جزيئات الغشاء الخلوي؟ قد يغوينا اعتبار ذلك السبب الأخير هو السبب النهائي، ومن ثم يكون هذا هو السبب «الحقيقي»، غير أن فهمنا للعالم سرعان ما سينهار إذا كانت العلاقات بين الجزيئات وحدها هي التي تعتبر سببًا لكل شيء. على سبيل المثال، قد يكون من المستحيل وصف وتحليل دوران الدم من زاوية الجزيئات الفردية. فقط عندما تتحد الجزيئات كي تنتج تكوينات أكثر تعقيدًا مثل خلايا الدم والشرايين والأوردة وعضلة القلب، تبرز خصائص جديدة تسمح بتفسير عمل الجهاز الدوري. في حقيقة الأمر، في مثالنا هنا، من الممكن اعتبار كل عامل — بدءًا من العشاء نفسه وحتى الجزء النشط من الجزيء وذلك عند مستوى مختلف من الملاحظة والتفصيل — سببًا. فبدون «أيٍّ» منها ما كان ممكنًا أن يصاب الأفراد بالنزلة المعوية. بصفة عامة، يمكننا اعتبار السبب هو ذاك العامل الذي لولا تأثيره، ما كان من الممكن أن يحدث الأمر، سواء أكان سلبيًّا كالمرض أو إيجابيًّا كالوقاية منه.

معظم العمل البحثي لعالِم الأوبئة يتمثل في محاولة تحديد «العوامل التي لولاها» ما يكون لأحد الأمراض أن يحدث أو لا يحدث. ومن زاوية القياسات الفعلية للمرض التي تناولناها في الفصل الثاني، فإن معنى ذلك تحديد العوامل — أيًّا كانت طبيعتها: اجتماعية، بيولوجية، كيميائية، فيزيائية — التي يتضح أن وجودها مرتبط على الدوام بارتفاع أو انخفاض في معدل الإصابة بمرض ما أو معدل خطر حدوثه. وهناك العشرات من العوامل المرشَّحة لهذا الدور، بدءًا من الضغوط العصبية في العمل وحتى الجينات الموروثة، ومن الأطعمة الدهنية حتى ممارسة الرياضة، ومن العقاقير حتى ملوثات الهواء. يمكن استخدام اسم عام لكل تلك الأشياء هو «العامل» أو حسب اللغة التي يستخدمها علماء الأوبئة «التعرُّض»، وهو تعبير محايد يبتعد بنا عن التحيز لما إذا كان سيتضح في النهاية أن هذا العامل هو سبب المرض أم لا.

المقارنة بين معدلات الإصابة ومعدلات خطر الإصابة مع تقليل الانحيازات

تبدأ الرحلة البحثية الطويلة عادة، والتي تهدف إلى إثبات أن عاملًا ما هو سبب أحد الأمراض، بإجراء مقارنة بين معدلات الإصابة أو معدل خطر الإصابة لدى مجموعات مختلفة من الناس. فارتفاع معدل الإصابة بمرض السكر من النوع الثاني لدى مجموعة من أصحاب الوزن الزائد خضعت للملاحظة على مدى سنوات عدة عما هو عليه لدى أصحاب الوزن الطبيعي؛ يشير إلى أن الوزن الزائد ربما كان من بين محددات الإصابة بمرض السكر. وقبل أن يصبح من الممكن تحويل هذا الافتراض إلى حقيقة عليها أدلة مؤكدة، يحتاج الأمر إلى استيفاء شرطين؛ أولًا: بيان وجود ارتباط بين التعرض — أي الوزن الزائد — ومعدل الإصابة بمرض السكر، وهو الموضوع الذي يتناوله هذا الفصل، وثانيًا: تفسير هذا الارتباط على أنه ذو طبيعة سببية، وهو ما سنناقشه في الفصل الرابع.

من الممكن أن يختلف أصحاب الوزن الزائد عن أصحاب الوزن الطبيعي في العديد من الأوجه: الجنس، والعمر، والنظام الغذائي، ومقدار ممارسة الرياضة، ومن الممكن أن يكون أيٌّ من تلك الأوجه — وليس زيادة الوزن في حد ذاتها — هو المسئول عن ارتفاع معدل الإصابة بمرض السكر. وكخطوة أولى للتعامل مع تلك المشكلة، يمكننا استبعاد بعض العوامل الدخيلة المحتملة عن طريق قصر دراستنا على أصحاب الوزن الطبيعي والزائد الذين ينتمون فقط إلى أحد الجنسين وإلى فئة عمرية معينة، ولتكن مثلًا الذكور الذين تتراوح أعمارهم بين ٤٠ و٥٩ عامًا في مدينة الزهور. زيادة الوزن تعني زيادة مؤشر كتلة الجسم عن ٢٥. إن مؤشر كتلة الجسم يقيس الوزن بالنسبة إلى الطول (وهو يُحسب بقسمة الوزن على مربع الطول)؛ ويعتبر مؤشر كتلة الجسم الذي يقع في نطاق يتراوح بين ١٩ و٢٥ طبيعيًّا. أما أولئك الذين يتجاوز المؤشر لديهم ٢٥، فإنهم يُعتبرون من أصحاب الوزن الزائد، وفي نطاق تلك الفئة يُصنف من يتجاوز مؤشرهم ٣٠ على أنهم مصابون بالسمنة. وسرعان ما يصل أسلوب استبعاد العوامل الدخيلة المحتملة عن طرق قصر الدراسة على بعض الفئات من الناس دون غيرها إلى حدوده القصوى. فالمزيد من تحديد الدراسة بقصرها مثلًا على الأشخاص الخاملين الذين يتناولون نوعًا معينًا من الغذاء لن يقلل للغاية من عدد الأفراد المتاحين للبحث فحسب، بل الأسوأ من ذلك أنه قد يجعل نتائج الدراسة غير قابلة للتطبيق على المجتمع السكاني بشكل عام. أما الوسيلة الأفضل، وهي في واقع الأمر كذلك الأكثر شيوعًا في الاستخدام، فإنها تتمثل في الحصول على معلومات عن عوامل معينة مثل الغذاء وممارسة الرياضة لكل فرد خاضع للدراسة وتسجيل تلك المعلومات، بحيث يكون في استطاعتنا وقت تحليل البيانات إجراء مقارنة بين أصحاب الوزن الطبيعي والزائد ليس إجمالًا، وإنما أولًا في نطاق المجموعات الفرعية (أو ما نسميها «الطبقات») التي تتبع النمط الغذائي نفسه وتمارس المستوى نفسه من الرياضة، ثم إيجازها في مقارنة كلية «مضبوطة» بعد تحريرها من تأثير تلك العوامل.

ووفق تصميم الدراسة الذي ذكرته لتوي، فقد وقع الاختيار على مجموعة أتراب مكونة من ٣٠٠٠ متطوع من الذكور الذين تتراوح أعمارهم بين ٤٠ و٥٩ عامًا من غير المصابين بمرض السكر والذين يقيمون بمدينة الزهور، وخضعوا للمتابعة مدة عام واحد، مع تسجيل حالات الإصابة الجديدة بمرض السكر من النوع الثاني. وعند اختيار المجموعة، تبين أن ١٩٨٠ فردًا منهم هم من أصحاب الوزن الطبيعي، في حين أن ١٠٢٠ فردًا كانوا يعانون من زيادة في الوزن. وخلال فترة المتابعة على مدى عام كامل، سُجِّلت ١٥ حالة جديدة من الإصابة بالمرض، ووقعت ٤٥ حالة وفاة (لأي سبب كان) في المجموعة الأولى، و٢٣ حالة إصابة بالسكر و٤٩ حالة وفاة في المجموعة الثانية.

نتائج ملاحظة مجموعة أتراب من ٣٠٠٠ رجل في مدينة الزهور على مدى عام.
الوزن/العمر العدد النسبة المئوية عدد الوفيات عدد حالات الإصابة شخص-سنة معدل الإصابة
وزن طبيعي
٤٠–٤٩ ١١٧٣ ٥٩٪ ٢٠ ٦ ١١٦٠ ٥٫٢
٥٠–٥٩ ٨٠٧ ٤١٪ ٢٥ ٩ ٧٩٠ ١١٫٤
٤٠–٥٩ ١٩٨٠ ١٠٠٪ ٤٥ ١٥ ١٩٥٠ ٧٫٧
وزن زائد
٤٠–٤٩ ١٩٨ ١٩٪ ٨ ٢ ١٩٣ ١٠٫٤
٥٠–٥٩ ٨٢٢ ٨١٪ ٤١ ٢١ ٧٩١ ٢٦٫٥
٤٠–٥٩ ١٠٢٠ ١٠٠٪ ٤٩ ٢٣ ٩٨٤ ٢٣٫٤

اشتق معامل (شخص-يوم) من افتراض أن الأفراد الذين يتعرضون للوفاة أو الإصابة بالسكر للمرة الأولى ظلوا معرضين لخطر وقوع هذين الحدثين لهم مدة نصف عام من الملاحظة في المتوسط؛ ومن ثم، فإن معامل شخص-يوم لمن يتمتعون بوزن طبيعي وتتراوح أعمارهم بين ٤٠ و٤٩ يُحسب على النحو التالي: ١١٧٣ − (٢٠ + ٦)/٢ = ١١٦٠، ويُحسب معامل شخص-سنة لباقي المجموعات بذات الطريقة.

من بين الأفراد ذوي الوزن الطبيعي، وقعت الحالات الخمس عشرة للإصابة بالسكر من بين ١٩٥٠ شخصًا-سنة معرضين لخطر الإصابة بالمرض، وهو معدل إصابة يبلغ ٧٫٧ لكل ١٠٠٠ شخص-يوم. أما في الأفراد ذوي الوزن الزائد، فقد وقعت الحالات الثلاثة والعشرون من بين ٩٨٤ شخصًا-يوم، وهو معدل إصابة يبلغ ٢٣٫٤ لكل ألف شخص-يوم. غير أنه من المربك أن ندرك أن اختيار الرجال الذين تتراوح أعمارهم بين ٤٠ و٥٩ دون غيرهم، ودون أن نضم جميع الذكور البالغين، لم يكن كافيًا لاستبعاد التأثير المحتمل لعامل السن. فالنسبة المئوية للفئة الأكبر سنًّا، الذين تتراوح أعمارهم بين ٥٠ و٥٩ عامًا، من أصحاب الوزن الزائد تبلغ في واقع الأمر حوالي ضعف (٨١٪) النسبة المئوية لأصحاب الوزن الطبيعي (٤١٪)، وربما كان هذا هو السبب الحقيقي لارتفاع معدل ظهور حالات جديدة من الإصابة بالسكر؛ حيث إنه من المعلوم جيدًا أن معدل الإصابة بهذا المرض يرتفع كلما تقدم العمر بالإنسان. وحتى نستبعد تأثير السن، نحن بحاجة للمقارنة بين المعدلين لدى مجموعتين لديهما التركيبة العمرية نفسها، وأبسط وسيلة لذلك أن تكون ٥٠٪ من كل مجموعة ممن تتراوح أعمارهم بين ٤٠ و٤٩ عامًا واﻟ ٥٠٪ الأخرى ممن تتراوح أعمارهم بين ٥٠ و٥٩ عامًا. فلو تم تطبيق تلك النسب المئوية «المعيارية»؛ أي الثابتة، فإن المعدلين ٥٫٢ و١١٫٤ للمجموعتين العمريتين الفرعيتين بين أصحاب الوزن الطبيعي ستكون لكليهما أهمية متساوية (أو إذا شئنا التعبير بطريقة فنية، لديهما «الوزن» نفسه) ويكون متوسط معدلهما إذن هو (٥٫٢ + ١١٫٤)/٢ = ٨٫٣. وبالمثل، لدى أصحاب الوزن الزائد، يكون متوسط المعدل (١٠٫٤ + ٢٦٫٥)/٢ = ١٨٫٥. هذان المعدلان «مضبوطان عمريًّا» عن طريق إجراء معايرة: إنهما لا يزالان مختلفين (١٨٫٥ − ٨٫٣ = ١٠٫٢)، لكن من الناحية المادية الفارق أقل من المعدلين الإجماليين، أو العامَّين، (٢٣٫٤ − ٨٫٣ = ١٥٫١).

بعد استبعاد تأثير العمر، يظل هناك اختلاف ربما يعكس تأثير الوزن، أو — وهو ما يبعث على الضيق — تأثير عوامل أخرى من المحتمل أن تتدخل مثل مقدار ما يمارسه الفرد من رياضة أو نوع الغذاء الذي يتناوله. الحقيقة أن ما يجري عمله بصفة عامة في الدراسات الوبائية هو ضبط المعدلات ليس فقط بعزل عامل واحد مثل العمر وإنما جميع العوامل الدخيلة — وتسمى العوامل المشتتة أو العوامل المشوشة — والمعلوم أنها قادرة على إحداث تباين في المعدلات. وتتوافر في الوقت الراهن مجموعة من الوسائل الإحصائية، الأكثر تعقيدًا بكثير من وسيلة المعايرة البسيطة التي ذكرناها لتونا، وذلك في حزم برمجيات لتنفيذ عملية الضبط التلقائي للعوامل المشوشة المتعددة. تظهر أكثر هذه الوسائل استخدامًا في الأبحاث العلمية تحت أسماء مثل: «انحدار كوكس» (أو «انحدار المخاطرة النسبية») و«انحدار بواسون» لضبط المعدلات و«الانحدار اللوجيستي» لضبط معدلات الخطر. وليس للانحدار أي علاقة بالتدهور، ولكنه مصطلح عام يطلق على مجموعة كبيرة من الطرق الإحصائية التي تحلل اعتماد أحد المتغيرات — وليكن معدل الإصابة بمرض ما على سبيل المثال — على متغيرات أخرى عديدة مثل الجنس، والعمر، والغذاء وغير ذلك. (اشتُقَّ الاسم من أحد الاستخدامات الأولى للطريقة. فعند دراسة العلاقة بين أطوال الآباء والأبناء، وُجِد أن أبناء الآباء الأطول من المتوسط كانوا أكثر ميلًا في المتوسط إلى أن يكونوا أقل طولًا من آبائهم؛ أي إن قاماتهم مالت إلى «الانحدار» نحو المتوسط، وحدث الانحدار نفسه من أبناء الآباء الأقصر طولًا من المتوسط.)

وتهدف عملية الضبط الخاصة بعزل العوامل المشوشة إلى استبعاد الخطأ الذي من الممكن أن ينشأ نتيجة لإرجاع وجود اختلاف في المعدلات لعامل واحد، مثل زيادة الوزن، في حين أنه ربما يكون في الحقيقة نتيجة واحد أو أكثر من العوامل الأخرى «العوامل المشوشة». إلا أن هذا مصدر واحد فقط من مصادر الخطأ المحتملة، أما المصدران الرئيسيان الآخران فينشآن من اختيار الأفراد الذين ستشملهم الدراسة ومن الطرق المتبعة في ملاحظتهم. فكما رأينا، تكونت مجموعة أتراب مدينة الزهور من ٣٠٠٠ متطوع من الذكور. فإذا كان أصحاب الوزن الزائد (لا الوزن الطبيعي) المنتمون لطبقات اجتماعية اقتصادية دنيا قد تطوعوا للخضوع إلى الملاحظة في الدراسة بأعداد أكثر من أصحاب الوزن الزائد المنتمين لطبقات اجتماعية اقتصادية أعلى، فإن المعدل المرتفع للإصابة بمرض السكر بين أصحاب الوزن الزائد ربما يعكس تأثير اتِّباع أنظمة غذائية أقل من الناحية الصحية بدلًا من السمنة. يمكن أن يمر «انحياز الانتقاء» هذا مرور الكرام دون أن يلاحظه أحد، وقد يؤدي إلى تفسير خاطئ لنتائج الدراسة إذا لم يتم جمع معلومات عن الظروف الاجتماعية والاقتصادية — وهو أمر ليس سهلًا — لجميع المشاركين. على الجانب الآخر، قد يَظهر «انحياز الملاحظة» على سبيل المثال إذا خضع أصحاب الوزن الزائد للملاحظة الدقيقة بسبب حالتهم، بشكل أكبر مما يجري مع أصحاب الوزن الطبيعي. ولربما كان هذا هو ما رجح أكثر اكتشاف حالات جديدة من الإصابة بمرض السكر بين أصحاب الوزن الزائد أكثر منه لدى أصحاب الوزن الطبيعي. باختصار، توجد ثلاثة مصادر محتملة للأخطاء التي يمكن أن توجد في أية دراسة قائمة على الملاحظة في علم الأوبئة؛ أولًا: انحياز ناشئ عن عوامل مشوشة لم تخضع للضبط أو ضُبطت بصورة غير ملائمة (من خلال وسائل التعديل)، ثانيًا: انحياز ناشئ عن انتقاء الأفراد، ثالثًا: انحياز ناتج عن ملاحظة الأفراد وجمع المعلومات. الانحياز كلمة مرادفة للخطأ المنهجي أو الثابت، وهو الأهم والأكثر صعوبة في تحييده، أو على الأقل وضعه في الحسبان في الدراسات القائمة على الملاحظة. علاوةً على ذلك، هناك دائمًا أخطاء تحدث بالمصادفة.

استبعاد المصادفات

فيما يتعلق بمجموعة أتراب مدينة الزهور، قال لنا الباحثون إنه لا توجد عوامل مشوشة غير العمر وإنه لا توجد انحيازات متعلقة بانتقاء الأفراد أو بالملاحظة، ومن ثم فقد ظل الوزن الزائد وحده المرشح للارتباط المُلاحظ بمعدلات الإصابة بمرض السكر. ولكن كيف يمكن للمرء أن يكون على يقين منطقي من أن الفارق بين معدلي الإصابة المضبوطين عمريًّا (١٨٫٥ و٨٫٣) لم ينشأ بمحض الصدفة؟ عند النظر إلى جدول النتائج، نلاحظ أنه في الفئة العمرية من ٥٠–٥٩، كان رقم معامل شخص-يوم بين كلٍّ من أصحاب الوزن الطبيعي وأصحاب الوزن الزائد كبيرًا للغاية وكان واحدًا تقريبًا (٧٩٠ و٧٩١). يمكننا الاستفادة من هذا والزعم أنه إذا لم يكن للوزن التأثير الذي كنا نتوقعه، ونظرًا لأن رقم معامل شخص-يوم واحد، فإن عدد الحالات الجديدة للإصابة بالسكر من الممكن أيضًا أن يكون واحدًا في كلٍّ من المجموعتين أصحاب الوزن الطبيعي والوزن الزائد في الفئة العمرية من ٥٠–٥٩. لكن هناك ٩ حالات بين أصحاب الوزن الطبيعي و٢١ حالة بين أصحاب الوزن الزائد، وهو فارق كبير حقًّا فيما يتعلق بتوقع رقم متساوٍ (٢١ + ٩)/٢ = ١٥. إلا أن الفوارق الكبيرة نفسها يمكن أن تحدث أيضًا بالمصادفة البحتة، والسؤال الآن هو: ما مدى تكرار حدوث ذلك؟ يمكننا أن نحاكي دراستنا عن مرض السكر محاكاة كاملة بقذف عملة معدنية في الهواء ثلاثين مرة، وملاحظة عدد المرات التي تسقط فيها على وجه الصورة وعلى وجه الكتابة، مع إعادة تكرار التجربة مرات عدة. نتوقع أنه سيكون هناك عدد متساوٍ من مرات السقوط على كلٍّ من الوجهين (أي ١٥ مرة لكليهما) في كل تجربة، مثلما يجب أن يكون هناك عدد متساوٍ من حالات الإصابة بالسكر (١٥) بين كلٍّ من أصحاب الوزن الطبيعي والزائد. إن الابتعاد عن هذا التوقع في التجارب المتتالية، التي تتكون كلٌّ منها من ٣٠ رمية عملة، يخبرنا بمدى احتمال أو عدم احتمال حدوث انحراف بالمصادفة بذلك الحجم المشاهد في الدراسة (٢١ و٩). وفيما يلي نتائج سلسلة صغيرة من ٢٠ تجربة قمت بها أنا شخصيًّا، قبل أن يصيبني التعب:

صورة كتابة صورة كتابة صورة كتابة صورة كتابة
١١ ١٩ ١٤ ١٦ ١١ ١٩ ١٥ ١٥
١٥ ١٥ ١٤ ١٦ ١١ ١٩ ١٧ ١٣
١٣ ١٧ ١٦ ١٤ ١٢ ١٨ ٧ ٢٣
١١ ١٩ ١٣ ١٧ ١٨ ١٢ ١٤ ١٦
١١ ١٩ ١٤ ١٦ ١٦ ١٤ ١٥ ١٥

تجربة واحدة من بين عشرين تجربة (٥٪) أعطت نتيجة ٧ إلى ٢٣ (مميزة بخط عريض)، وهو انحراف تصادفي عن التوقع الأكبر من ذلك الذي لوحظ في البيانات الخاصة بمرض السكر (وهو ٢١ إلى ٩). ففي ١٩ من بين ٢٠ تجربة (٩٥٪)، كان الانحراف أقل من ٢١ إلى ٩. ونسبة ٩٥٪ ليست بالطبع ١٠٠٪، لكنها قريبة منها إلى حد معقول، وعلى هذا الأساس، ومع ما لاحظناه في دراستنا (التي تحاكي تمامًا تجارب قذف العملة)؛ أي ٢١ حالة إصابة بالسكر بين أصحاب الوزن الزائد و٩ حالات بين أصحاب الوزن الطبيعي، يمكننا الآن رفض الفرضية التي تقول إنه لا يوجد فارق حقيقي في المعدلات. أو بالمصطلحات الإحصائية، فإننا أجرينا «اختبار دلالة» على الفارق في المعدلات ونحن جاهزون للقول إن «الفارق الملاحَظ له دلالة إحصائية عند مستوى ٥٪». ويعني هذا ضمنًا أننا لو استمررنا على هذا النحو في مناسبات مشابهة، فاحتمال أن نخطئ سيكون بنسبة ٥٪. للأسف، لا يمكن لأحد أن يعلم إن كانت تلك واحدة من المرات الخمس التي يمكن أن نصل بها «منطقيًّا» إلى استنتاج خاطئ أم لا!

اختبارات الدلالة وحدود الثقة

إجراء تجارب العملة المعدنية أداة مفيدة للتوضيح العملي لأساس أي اختبار دلالة، غير أن الحسابات الدقيقة يمكن أن تُجرى يوميًّا على أساس نظرية الاحتمالات، بل وهي بالفعل كذلك. وفي حالة وجود حدثين يقعان بالتبادل ويحول أحدهما دون وقوع الآخر، مثل وجهَيِ الصورة والكتابة، أو الذكر والأنثى، أو ميت وحي، فإن توزيع الاحتمال ذي الحدين يسمح بإجراء حسابات دقيقة لعدد مرات وقوع حدث له احتمال حدوث في عدد محاولات مقدارها ؛ على سبيل المثال، كم عدد المرات التي سترزق فيها أسرة بطفلين ( = ٢) يكون عدد الأولاد فيها صفرًا وعدد البنات ٢؟ وكم مرة سيكون هناك ولد واحد وبنت واحدة؟ وكم مرة سيكون عدد الأولاد فيها ٢ وعدد البنات صفرًا؟ إننا نفترض (ربما لا يكون هذا هو ما يحدث تحديدًا في الواقع) أن الولادات المتتابعة مستقلة من حيث تحديد جنس المولود، وأن الاحتمالية لميلاد ولد تبلغ ١ / ٢، وهي الاحتمالية نفسها لميلاد بنت؛ ومن ثم، فإن احتمالية أن يكون عدد البنات في الأسرة ٢ وعدد الأولاد صفرًا هي ١ / ٢ × ١ / ٢ = ١ / ٤ أو ٠٫٢٥، وهي ذاتها احتمالية أن يولد للأسرة ولدان فقط دون بنات. علاوةً على ذلك، فإن احتمالية أيٍّ من المجموعات التي يكون بها ولد واحد وبنت واحدة سوف تكون ١ / ٢ × ١ / ٢ = ١ / ٤؛ حيث إن هناك مجموعتين لاحتمال إنجاب الأسرة ولدًا واحدًا وبنتًا واحدة وهما أن ترزق الأسرة بالولد أولًا ثم البنت ثانيًا، أو العكس، فإن إجمالي احتماليهما سيكون ٢ × ١ / ٤ = ١ / ٢ أو ٠٫٥. إن الأشكال الثلاثة المحتملة للنسل هنا تغطي جميع الاحتمالات، ومن ثم يجب أن يكون مجموع احتمالاتها واحدًا صحيحًا، وهذا هو ما حدث بالفعل: ٠٫٢٥ + ٠٫٥ + ٠٫٢٥ = ١. وبصورة مشابهة، يمكن اشتقاق الاحتمالات للتوزيعات ذات الحدين بقيم أخرى من و .
في الشكل ٣-١، يقيس ارتفاع الأعمدة احتمال العثور على ٠، ١، ٢، ٣، … ٣٠ حالة تجتمع فيها زيادة وزن والإصابة بالسكر من بين عدد حالات = ٣٠، عندما تكون قيمة الاحتمالية لحالة ما ذات وزن طبيعي أو زائد تساوي ١ / ٢ (أو ٠٫٥). وتم وضع القيم العددية للاحتمالات على المحور الرأسي ومجموع قيمها يساوي واحدًا صحيحًا؛ أي يقينًا تامًّا؛ إذ إن النتائج الثلاثين على اختلافها تستنفد جميع الاحتمالات الممكنة. ومجموع احتمالات (الأعمدة) في الذيل الأيمن للتوزيع لعدد ٢١ أو أكثر من حالات الإصابة بالسكر من أصحاب الوزن الزائد يبلغ ٠٫٠٢١ أو ٢٫١٪، والمجموع المقابل بالذيل الأيسر، والمقابل لعدد ٩ حالات إصابة بالسكري أو أقل من أصحاب الوزن الزائد؛ يبلغ هو أيضًا ٢٫١٪. ومجموعهما يبلغ ٤٫٢٪، وهو ما يؤكد نتيجة سلسلتنا المصغرة من تجارب أوجه الصور والكتابة في العملة. هناك احتمال مقداره ٤٫٢٪؛ أي أقل من ٥٪، أنه بموجب الفرضية التي تسمى «الفرضية العدمية أو الصفرية» — أي عدم وجود فارق في معدل الإصابة بالسكر بين الأشخاص أصحاب الوزن الطبيعي وأصحاب الوزن الزائد — تتم ملاحظة نتيجة متطرفة بذات قدر وجود ٢١ حالة وزن زائد أو أكثر. وكان من الممكن التوصل إلى الاستنتاج نفسه لو أننا — بدلًا من التركيز فقط على أناس يقعون ضمن الفئة العمرية ٥٠–٥٩ — كنا أجرينا اختبارنا الخاص بالدلالة الإحصائية على المعدلين المضبوطين عمريًّا وهما ١٨٫٥ و٨٫٣ اللذين يوجزان تجربة مجموعة الأتراب بأكملها البالغة ٣٠٠٠ رجل؛ فالفارق بينهما ١٠٫٢ — وهو الأكثر صلة بالاختبار — له دلالة إحصائية أيضًا مع احتمالية تبلغ أقل من ٥٪.
fig6
شكل ٣-١: التوزيع الثنائي الحد عندما تكون = ٠٫٥ و = ٣٠.

بالرغم من الشهرة الكبيرة التي تحظى بها اختبارات الدلالة في العلوم بصفة عامة وفي علم الأوبئة بصفة خاصة، فإن هناك أسلوبًا أكثر إفادة، ومن ثم أكثر تفضيلًا للتوصل إلى النتيجة نفسها. إن الفارق البالغ ١٠٫٢، والمشتق من عينة سكانية ذات حجم كبير وإن كان محدودًا (٣٠٠٠ شخص)، يعكس الجمع بين الفارق «الحقيقي» وإن كان مجهولًا في مجتمع سكاني مثالي ذي حجم لامتناهٍ والتأرجح الذي يقع بالمصادفة النابع من حقيقة أنه من وسط ذلك المجتمع السكاني المثالي قمنا بدراسة عينة متناهية الحجم من ٣٠٠٠ شخص. لو جاز لنا أن نكرر دراستنا هذه على عينة أخرى مكونة من ٣٠٠٠ شخص لا يمكن تمييزها عن العينة الأولى، لحصلنا عندئذٍ على فارق مختلف قليلًا عن ١٠٫٢ وسوف يحدث الشيء نفسه من جديد مع أي عينة تالية. مرة أخرى، نقول إن التوزيع الاحتمالي ذا الحدين يسمح باستكشاف نطاق قيم الفارق بحيث يكون هناك احتمال بنسبة ٩٥٪ (أو إذا كان المرء يفضل، ٩٠٪ أو ٩٩٪) لاحتواء الفارق الحقيقي المجهول ضمنه. في حالتنا هذه، كانت هذه القيم ٢ و١٨٫٣، وهو نطاق متسع للغاية. ويمكننا الإيجاز بالقول إن «تقدير النقطة» للفارق الحقيقي المجهول هو ١٠٫٢، ﺑ «حدود ثقة تبلغ ٩٥٪» (أو «فترة ثقة ٩٥٪») للرقمين ٢ و١٨٫٣. بعبارة أبسط، تعبر فترة الثقة عن نطاق من القيم يمكن أن يضم بداخله الفارق الحقيقي بقدر معين من الاحتمالية. لو لم يكن هناك فارق حقيقي، لَضَمَّ النطاق القيمة صفرًا؛ أي كانت القيم ستتراوح بين −٣٫٢ و١١٫٥. وفترة الثقة أكثر إفادة بكثير من اختبار الدلالة الإحصائية، ومن ثم هي أسلوب أفضل كثيرًا لتقييم دور الصدفة. فهي لا تكتفي بأن تخبرنا، مثلها مثل اختبار الدلالة، بأن الفارق من غير المحتمل أن يكون قد نشأ بالصدفة (إذا كانت الفرضية العدمية صحيحة)، بل تقدم معلومات عن نطاق القيم الممكنة لذلك الفارق. ولمَّا كان النطاق لا يوفر يقينًا وإنما يحدد فقط احتمالية بأن الفارق الحقيقي يقع بداخله، فإنه ربما يخطئ مثله في ذلك مثل اختبار الدلالة. إن حساب حدود ثقة بنسبة ٩٥٪ وذكر أن الفارق الحقيقي يقع بينها يكون خطأ في ٥٪ من الحالات، غير أنه لا يمكن لأحد أن يعرف إن كانت دراستنا حول مرض السكر واحدة من تلك الحالات أم لا.

figure
شكل : مهلًا! لا يمكن لأحد أن يقول إن كانت النتيجة الخطأ تقع في دراستك أو في دراسة شخص آخر. ورجاءً انتبه أكثر لمصادر الخطأ بخلاف الصدفة.1

ويمكن تبني مستويات أعلى من الثقة، على سبيل المثال، ٩٩٪ أو ٩٩٫٩٪، بما يستتبع أن تكون هناك مخاطرة باحتمال الخطأ بنسبة ١٪ أو ٠٫١٪ فقط، غير أن الثمن المدفوع للوصول إلى درجة أعلى من الثقة هو أن يتسع النطاق الذي يمكن القول إن الفارق واقع ضمنه.

المعاملات وطرق تقديرها

لتحقيق الغرض العام المتمثل في التوصل لاستدلالات مبنية على البيانات التي جُمعت في دراسة وبائية، يمكن النظر إلى كلٍّ من معدلات الإصابة، ومعدلات الخطر، والفوارق في المعدلات أو المخاطر والمتوسطات وما إلى ذلك باعتبارها «معاملات» تميز أي مجتمع مثالي، فكل معامل له قيمة «حقيقية» وإن كانت غير معلومة. وتتيح البيانات العملية لنا عمل «تقديرات» لتلك المعاملات وتقييم مقدار تأثرها — عن طريق حدود الثقة — بتأرجحات المصادفات. ولكل تقدير للمعاملات هامشه الخاص به من الشك الذي يُعبَّر عنه من خلال حدود الثقة. لكن اختبارات الدلالة على العكس من ذلك مخصصة أكثر لأنواع مختلفة تُجرى من التحليل الإحصائي، وهي توجد في الأبحاث العلمية في صورة اختبارات مثل اختبار كاي-تربيع، واختبار تي، واختبار إف، وغيرها.

بعد أن استبعدنا الانحيازات والمصادفة في تحليلنا لدراسة مرض السكر بمدينة الزهور، يمكننا أن نستنتج أنه في نطاق دراستنا هناك فارق حقيقي في الإصابة بمرض السكر بين أصحاب الوزن الطبيعي وأصحاب الوزن الزائد؛ أو بعبارة أخرى، هناك ارتباط بين الوزن الزائد وحدوث الإصابة بمرض السكر (هناك شيء من الالتفاف هنا؛ فما فعلناه في الواقع أننا رفضنا الفرضية بعدم وجود فارق، وهو أمر في الواقع العملي يعادل ولكنه ليس مطابقًا منطقيًّا لأن نقول إننا نسلم بوجود فارق حقيقي). ويبقى أن نُؤوِّل طبيعة هذا الارتباط: هل هو ارتباط سببي؟ أي هل الوزن الزائد عامل محدد للإصابة بمرض السكر؟

هوامش

(1) © Irving Geis, adapted from Darrell Huff and Irving Geis, How to Take a Chance (Penguin Books, 1965).

جميع الحقوق محفوظة لمؤسسة هنداوي © ٢٠٢٢