الأخبار التكنولوجية والاستعراضات والنصائح!

تحليل البقاء باستخدام دروس بايثون – كيف وماذا ومتى ولماذا | بواسطة نحو فريق التحرير AI

ستساعدك المقالة التالية: تحليل البقاء باستخدام دروس بايثون – كيف وماذا ومتى ولماذا | بواسطة نحو فريق التحرير AI

Kaplan-Meier Estimator (بدون أي مجموعات)

1) استيراد المكتبات المطلوبة:

الشكل 9: استيراد الباندا ، و numpty ، و matplotlib.pyplot ، و lifelines.

2) اقرأ مجموعة البيانات:

الشكل 10: قراءة مجموعة البيانات.

3) اطبع الأعمدة في مجموعة البيانات الخاصة بنا:

الشكل 11: طباعة أعمدة البيانات.

4) احصل على معلومات إضافية حول مجموعة البيانات:

يعطينا معلومات حول نوع بيانات الأعمدة مع عداد القيمة الخالية. نحتاج إلى إزالة الصفوف ذات القيمة الفارغة لبعض طرق تحليل البقاء.

الشكل 12: معلومات إضافية حول مجموعة البيانات الخاصة بنا.

5) احصل على معلومات إحصائية حول مجموعة البيانات:

يعطينا بعض المعلومات الإحصائية مثل العدد الإجمالي للصفوف ، والمتوسط ​​، والانحراف المعياري ، والحد الأدنى للقيمة ، والمئين الخامس والعشرين ، والمئين الخمسين ، والنسبة المئوية الخامسة والسبعين ، والقيمة القصوى لكل عمود.

الشكل 13: الحصول على معلومات إحصائية حول مجموعة البيانات الخاصة بنا.

6) اكتشف توزيع الجنس باستخدام الرسم البياني:

يعطينا هذا فكرة عامة عن كيفية توزيع بياناتنا. في الرسم البياني التالي ، يمكننا أن نرى أن حوالي 139 قيمة لها حالة 1 ، وحوالي 90 قيمة لها حالة 2 ، مما يعني أن هناك 139 ذكرًا وحوالي 90 أنثى في مجموعة البيانات الخاصة بنا.

الشكل 14: رسم الرسم البياني لجنس المريض.

7) أنشئ كائنًا لـ Kaplan-Meier-Fitter:

الشكل 15: إنشاء كائن لـ Kaplan-Meier-Fitter.

8) تنظيم البيانات:

الآن نحن بحاجة إلى تنظيم بياناتنا. سنضيف عمودًا جديدًا في مجموعة البيانات لدينا يسمى “ميت”. يقوم بتخزين البيانات حول ما إذا كان الشخص الذي هو جزء من تجربتنا ميتًا أو على قيد الحياة (بناءً على قيمة الحالة). إذا كانت قيمة الحالة لدينا هي 1 ، فهذا يعني أن هذا الشخص على قيد الحياة ، وإذا كانت قيمة الحالة لدينا هي 2 ، فهذا يعني أن الشخص قد مات. إنها خطوة حاسمة لما يتعين علينا القيام به في الخطوة التالية حيث سنقوم بتخزين بياناتنا في أعمدة تسمى المراقبة والمراقبة. حيث تخزن البيانات المرصودة قيمة الموتى في جدول زمني محدد ، وتخزن البيانات الخاضعة للرقابة قيمة الأشخاص أو الأشخاص الأحياء الذين لن نتحرى عنهم.

الشكل 16: تنظيم بياناتنا.

9) تركيب بياناتنا في كائن:

هدفنا هنا هو معرفة عدد الأيام التي نجا فيها المريض قبل وفاته. سيكون الحدث الذي يهمنا هو “الموت” ، والذي يتم تخزينه في عمود “الموتى”. الحجة الأولى التي يتطلبها هو الجدول الزمني لتجربتنا.

الشكل 17: ملاءمة قيم المعلمات في كائننا.

10) إنشاء جدول الحدث:

واحدة من أكثر الطرق أهمية لكائن kmf هي “event_table”. يعطينا معلومات مختلفة لتحليل بقاءنا. دعونا نلقي نظرة عليها عمودًا بعمود.

الشكل 18: طباعة جدول الحدث.

أ) event_at: يخزن قيمة الجدول الزمني لمجموعة البيانات الخاصة بنا. أي ، متى تمت ملاحظة المريض في تجربتنا أو متى أجريت التجربة. يمكن أن تكون عدة دقائق وأيام وشهور وسنوات وغيرها. في حالتنا ، سيكون لعدة أيام. يخزن قيمة أيام البقاء على قيد الحياة للموضوعات.

ب) at_risk: يخزن عدد المرضى الحاليين تحت الملاحظة. في البداية ، سيكون العدد الإجمالي للمرضى الذين سنراقبهم في تجربتنا. إذا تمت إضافة مرضى جدد في وقت معين ، فعلينا زيادة قيمتهم وفقًا لذلك. لذلك:

الشكل 19: صيغة متغير at_risk.

ج) المدخل: يخزن قيمة المرضى الجدد في جدول زمني معين. من الممكن أنه أثناء إجراء التجارب ، يتم أيضًا تشخيص مرضى آخرين بالمرض. لحساب ذلك ، لدينا عمود المدخل.

د) الخاضعة للرقابة: هدفنا النهائي هو إيجاد احتمالية بقاء المريض. في نهاية التجربة ، إذا كان الشخص لا يزال على قيد الحياة ، فسنضيفه إلى فئة الخاضعة للرقابة. لقد ناقشنا بالفعل أنواع الرقابة.

ه) لاحظ: يخزن قيمة عدد الأشخاص الذين ماتوا أثناء التجربة. من منظور واسع ، هؤلاء هم الأشخاص الذين قابلوا الحدث الذي يثير اهتمامنا.

و) تمت إزالته: يخزن قيم المرضى التي لم تعد جزءًا من تجربتنا. إذا مات شخص أو خضع للرقابة ، فإنه يقع في هذه الفئة. باختصار ، إنها إضافة للبيانات في فئة المراقبة والرقابة.

الشكل 20: تمت إزالة صيغة المتغير.

11) حساب احتمال البقاء على قيد الحياة للجداول الزمنية الفردية:

دعونا نرى أولاً معادلة حساب بقاء شخص معين في وقت معين.

الشكل 21: حساب احتمالية البقاء على قيد الحياة للجداول الزمنية الفردية.

أ) احتمال البقاء عند t = 0 فقط:

الشكل 22: حساب احتمال البقاء على قيد الحياة لـ t = 0.
الشكل 23: حساب احتمالية البقاء على قيد الحياة لفترة زمنية معينة و t = 0.

ب) احتمال البقاء على قيد الحياة عند t = 5 فقط:

الشكل 24: احتمال البقاء على قيد الحياة لـ t = 5.
الشكل 25: حساب احتمالية البقاء على قيد الحياة لفترة زمنية معينة.

ج) احتمال البقاء عند t = 11 فقط:

الشكل 26: احتمال البقاء عند t = 11.
الشكل 27: حساب احتمالية البقاء على قيد الحياة لفترة معينة.

الآن ما وجدناه هنا هو الاحتمال لوقت محدد. ما نريده هو الاحتمالية طوال الوقت للمريض. أي احتمال بقاء المريض على قيد الحياة في جميع جولات التجربة.

باختصار ، نريد إيجاد احتمالية بقاء الشخص على قيد الحياة طوال الوقت الذي عاشه بعد التشخيص. ما وجدناه للتو هو احتمال تجربة معينة فقط.

لنأخذ مثالًا مباشرًا لفهم مفهوم الاحتمال الشرطي. على سبيل المثال ، لدينا إجمالي 15 كرة في صندوق غير شفاف. من بين 15 كرة ، لدينا سبع كرات سوداء وخمس كرات حمراء وثلاث كرات خضراء. هنا مشهد مصور لذلك.

الشكل 28: مثال على شكل الكرة.

أ) احتمال اختيار كرة حمراء:

الشكل 29: احتمال اختيار كرة حمراء.

ب) احتمال اختيار الكرة الحمراء الثانية:

نظرًا لأننا أزلنا كرة كانت حمراء ، فإن إجمالي عدد الكرات الحمراء التي لدينا هو 4 ، وإجمالي عدد الكرات التي لدينا هو 14.

الشكل 30: احتمال اختيار الكرة الحمراء الثانية.

إذا كان سؤالنا هو إيجاد احتمال أن تكون كلتا الكرتين حمراء ، فسنضربها ، وهذا بالضبط ما سنفعله في تحليل البقاء. نعلم أن المريض قد نجا من الفترة الزمنية الأولى ، ونريد معرفة احتمالية بقائه على قيد الحياة في الفترة الزمنية الثانية نظرًا لأنه نجا من الفترة الزمنية الأولى. نقطتي هنا هي أننا لا نريد إيجاد احتمال الفترة الزمنية الثانية فقط. نريد الاحتمال الكلي لبقائه على قيد الحياة طوال الفترة.

في مثالنا ، احتمالية أن تكون كلتا الكرتين حمراء كما يلي:

الشكل 31: حساب احتمال أن تكون كلتا الكرتين حمراء.

في تحليل البقاء ، يمكننا كتابة الصيغة على النحو التالي:

الشكل 32: حساب S (n).

12) إيجاد احتمالية البقاء على قيد الحياة:

نريد إيجاد احتمالية بقاء المريض على قيد الحياة خلال كل الجدول الزمني حتى الآن. الآن نحن بحاجة إلى إيجاد احتمال البقاء الفعلي للمريض.

أ) احتمال البقاء على قيد الحياة لـ t = 0:

الشكل 33: حساب احتمال البقاء على قيد الحياة لـ t = 0.
الشكل 34: حساب احتمال البقاء الفعلي في وقت معين.

ب) احتمال البقاء على قيد الحياة لـ t = 5:

الشكل 35: حساب احتمال البقاء على قيد الحياة لـ t = 5.
الشكل 36:

ج) احتمال البقاء على قيد الحياة لـ t = 11:

الشكل 37: حساب احتمال البقاء على قيد الحياة لـ t = 11.
الشكل 38: حساب احتمال البقاء الفعلي في وقت معين.

13) توقع الاحتمال:

الآن تقوم وظيفة التنبؤ الخاصة بجسم kmf بكل هذا العمل نيابةً عنا. ومع ذلك ، فمن الممارسات الجيدة دائمًا معرفة المنطق الكامن وراء ذلك.

الشكل 39: عرض قيم الاحتمالية بالطريقة السهلة.

14) إيجاد احتمال البقاء على قيد الحياة لمجموعة من الجدول الزمني:

الشكل 40: توقع احتمالية البقاء على قيد الحياة لمجموعة من القيم.

15) احصل على احتمالية البقاء على قيد الحياة للجدول الزمني بأكمله:

الشكل 41: الحصول على احتمالية البقاء على قيد الحياة للجدول الزمني بأكمله.

احتمالية البقاء على قيد الحياة لمريض في الجدول الزمني 0 هي 1. استيعاب أفكارنا ، ثم نجمع أن احتمال وفاة الشخص في اليوم الأول من التشخيص يقترب من الصفر. لذلك يمكننا القول أن احتمال البقاء على قيد الحياة مرتفع مثل ممكن. مع زيادة الجدول الزمني ، تقل احتمالية بقاء المريض.

16) ارسم الرسم البياني:

الشكل 42: رسم احتمالية البقاء على قيد الحياة.

17) متوسط ​​عدد أيام البقاء على قيد الحياة:

إنه يوفر عدد الأيام التي نجا فيها ، في المتوسط ​​، 50 ٪ من المرضى.

الشكل 43: عرض متوسط ​​عدد الأيام.

من الكود أعلاه ، يمكننا القول أنه في المتوسط ​​، عاش الشخص 310 يومًا بعد يوم التشخيص.

18) احتمال البقاء مع فترة الثقة:

الشكل 44: تقدير احتمالية البقاء على قيد الحياة بفاصل ثقة.

19) رسم بياني لاحتمال البقاء على قيد الحياة بفاصل الثقة:

الشكل 45: رسم دالة البقاء على قيد الحياة بفاصل ثقة.

الآن كل المعلومات التي لدينا هي من أجل بقاء الشخص. الآن سنرى ما هو احتمال وفاة الشخص في جدول زمني محدد. لاحظ هنا أن الاحتمال الأعلى للبقاء على قيد الحياة مناسب للشخص ، لكن الكثافة التراكمية الأعلى (احتمال وفاة الشخص) ليست جيدة!

20) احتمال وفاة شخص:

الشكل 46: احتمال وفاة شخص.

هنا تتعرض قيمة المقام للخطر في الصف السابق.

معادلة الكثافة التراكمية:

الشكل 47: معادلة الكثافة التراكمية.

أ) احتمال وفاة شخص عند t = 0:

الشكل 48: احتمال وفاة شخص عند t = 0.

ب) احتمال وفاة شخص عند t = 5:

الشكل 49: احتمال وفاة شخص عند t = 5.

ج) احتمال وفاة شخص عند t = 11:

الشكل 50: احتمال وفاة شخص عند t = 11.

أوجد الكثافة التراكمية:

د) الكثافة التراكمية عند t = 0:

الشكل 51: حساب الكثافة التراكمية عند t = 0.

هـ) الكثافة التراكمية عند t = 5:

الشكل 52: حساب الكثافة التراكمية عند t = 5.

و) الكثافة التراكمية عند t = 11:

الشكل 53: احسب الكثافة التراكمية عند t = 11.
الشكل 54: عرض احتمالية موت أحد الأشخاص.

21) ارسم الرسم البياني للكثافة التراكمية:

الشكل 55: رسم الكثافة التراكمية.

لاحظ ذلك ، حيث أن عدد أيام البقاء على قيد الحياة يزيد من احتمال زيادة وفاة الشخص.

22) الكثافة التراكمية مع فاصل الثقة:

الشكل 56: احسب الكثافة التراكمية بفاصل ثقة.

23) رسم بياني للكثافة التراكمية بفاصل ثقة:

الشكل 57: رسم الكثافة التراكمية بفاصل ثقة.

24) احصل على الكثافة التراكمية ليوم معين:

الشكل 58: أوجد الكثافة التراكمية في وقت محدد.

25) متوسط ​​وقت الحدث:

يمكننا الحصول على مقدار الوقت المتبقي من متوسط ​​وقت البقاء.

الشكل 59: حساب متوسط ​​الوقت الشرطي لحدث مثير للاهتمام.

26) رسم بياني لمتوسط ​​وقت الحدث:

الشكل 60: رسم الرسم البياني لمتوسط ​​وقت الحدث.