الأخبار التكنولوجية والاستعراضات والنصائح!

بناء وتحسين تصاميم الكتل الكاملة العشوائية باستخدام SAS – نحو الذكاء الاصطناعي

ستساعدك المقالة التالية: بناء وتحسين تصاميم الكتل الكاملة العشوائية باستخدام SAS – نحو الذكاء الاصطناعي

نُشر في الأصل على نحو AI ، الشركة الرائدة في العالم في مجال الذكاء الاصطناعي والأخبار التقنية والإعلام. إذا كنت تقوم ببناء منتج أو خدمة متعلقة بالذكاء الاصطناعي ، فنحن ندعوك للتفكير في أن تصبح راعيًا للذكاء الاصطناعي. في نحو الذكاء الاصطناعي ، نساعد في توسيع نطاق الشركات الناشئة في مجال الذكاء الاصطناعي والتكنولوجيا. دعنا نساعدك على إطلاق التكنولوجيا الخاصة بك للجماهير.

إحصائيات

في علوم الحيوان ، التصميم الأكثر استخدامًا هو تصميم الكتلة العشوائية الكاملة (RCBD). يمكن مقارنة هذا التصميم بالتصميم الطبقي العشوائي المستخدم غالبًا في علوم الحياة. تكمن براعتها في استخدام تصميم تجربة لتشمل التباين من أجل استبعاد التباين. هذا صحيح. نقوم بتضمين التباين في تصميمنا للتأكد من قدرتنا على التحكم فيه ، لذلك عندما يحين الوقت لتحليل البيانات يمكننا استبعادها. لقد كتبت عن التوزيع العشوائي والحظر في منشور تمهيدي سابق. في هذا المنشور ، سوف أتعمق أكثر في RCBD.

RCBD هو مزيج من اللبنات الأساسية والعشوائية. حقا لا يوجد شيء آخر لها.

الآن ، دعنا نقول أن خنازيرنا ليست كلها من نفس الألوان. إذا قمنا فقط بترتيب الخنازير بشكل عشوائي ، فسيكون لدينا توزيع غير متساوٍ للون داخل علاجاتنا. يمكن أن يكون لون الخنزير متغيرًا نحتاج إلى التعامل معه في تحليلنا. على الرغم من أن هذا أمر جيد حقًا ، إلا أنه من الأكثر كفاءة وفعالية التعامل مع شخص محتمل في مرحلة التصميم.

التصميم العشوائي الكامل هو تصميم بأعداد كبيرة. يفترض أنه ، من خلال التوزيع العشوائي من السكان ، ستكون العينات التي تمثل كل معاملة متساوية في جميع الخصائص ، باستثناء المعاملة → ستكون المقارنة نقية. في علم الحيوان ، نادرًا ما يكون هذا هو الحال لأننا لا نستطيع تنفيذ الأرقام اللازمة للوصول إلى هذا المستوى من النقاء. ومع ذلك ، لدينا بديلان:

  1. قم بتضمين اللون كمتغير مشترك في النموذج
  2. قم بتضمين اللون في التصميم ← تصميم بلوك كامل عشوائي

سنعرض الآن كيف يعمل تصميم RCBD عمليًا. أولاً ، نقوم بإنشاء الكتل ، وننشئ عددًا من الكتل يساوي عدد الألوان. في كثير من الأحيان ، هذه العلاقة واحد لواحد غير ممكنة وتحتاج إلى إنشاء كتل تحتوي على القليل جدًا من التباين داخل الكتلة والكثير من التباينات بين الكتلة.

أ تصميم بلوك كامل عشوائي يعني في الواقع واحد تكرار لكل علاج * مجموعة كتلة. سيؤدي هذا إلى المثال أدناه.

نتيجة للحجب ، أصبح لكل علاج الآن توزيع مماثل فيما يتعلق بعامل الحجب → لون. هنا ، تمثل الكتلة لون الخنازير ، ومن خلال الحجب تأكدنا من أن كل معاملة تحتوي على خنزير واحد على الأقل من كل لون. ومع ذلك ، نادرًا ما يكون لدينا مثل هذه المستويات المحددة مسبقًا لعامل الحجب. بالإضافة إلى ذلك ، للحصول على تقدير جيد للتباين المنسوب بواسطة عامل المنع ، نحتاج إلى أكثر من مستويين من كل كتلة ، والتي قد يكون من الصعب تحقيقها

باختصار ، أمتأنق جشامل بيضمن تصميم القفل ما يلي:

  1. يتم اختيار المعالجات العشوائية بشكل عشوائي داخل كتلة
  2. جميع العلاجات في كتلة واحدة
  3. يوجد تكرار واحد لكل كتلة * معالجة
  4. كل كتلة هي تجربة مصغرة نظرًا لأننا نقارن العلاجات داخل كل كتلة.

بشكل عام ، يعتبر RCBD أكثر كفاءة من التصميم العشوائي الكامل (CRD) لأن الوحدات داخل الكتل أكثر تشابهًا (متجانسة) من الوحدات بين الكتل (غير المتجانسة). ومن ثم ، بعد حساب اختلاف الكتلة ، يصبح الخطأ التجريبي أصغر

يوضح الرسم البياني أعلاه أن التباين في كل معاملة قد تم تقسيمه إلى كتل. كل كتلة عبارة عن تجربة صغيرة مع اختلاف العلاج الخاص بها والتباين المحدد. يزيد هذا التصميم من نسبة الإشارة إلى الضوضاء حيث تتشابه اختلافات المعالجة عبر الكتل

السؤال الأكبر الذي يتبادر إلى الذهن هو متى يكون الحظر مفيدًا بالفعل. كما قد تكون خمنت ، تعتمد فائدتها على قدرتها على التقاط التباين. كلما زاد التباين ، كان ذلك أفضل.

يدور الحظر حول شرح التباين الذي أنشأته. إذا لم تلتقط الكتل الخاصة بك التباين ، فمن غير المجدي تصميم دراسة محظورة ويمكن أن تكون ضارة بقوتك. لتحديد ما إذا كان الحظر مفيدًا ، عليك أن تسأل نفسك:

  1. ما هي حصيلة اهتمامي الرئيسية؟
  2. هل هناك مصادر اختلاف من شأنها أن تقلل نسبة الإشارة إلى الضوضاء الخاصة بي
  3. ما حجم هذا الانخفاض؟
  4. هل سيساعدني تصميم الكتلة العشوائية في الحد من الانخفاض؟
  5. هل سيساعدني تصميم الكتلة العشوائية في زيادة نسبة الإشارة إلى الضوضاء؟

في التصميم الأمثل للكتل العشوائية الكاملة ، لديك:

  1. التجانس داخل الكتلة
  2. عدم التجانس عبر الكتل

إذا كانت الكتل كبيرة جدًا ، أو كان هناك عدد قليل جدًا من الكتل ، فستكون الكتل متغيرة جدًا وبالتالي لن تتمكن من التقاط التباين وحذفه بكفاءة

كلما زاد التباين الذي يمكن أن تلتقطه بنية الحظر ، قل عدد الكتل التي تحتاجها لالتقاط التباين “الحقيقي” في دراسة واحدة. كما هو الحال مع حجم العينة ، من الأفضل أن يكون لديك كتل أكثر من عدد أقل. في النهاية ، يعتمد ذلك على قدرة الكتل على إنشاء تباين بين الكتل.

الآن ، ماذا لو صممت RCBD لكنك قمت بتحليله على أنه CRD؟ من خلال القيام بذلك ، فإنك تفشل في التقاط التباين المنسوب بواسطة الكتلة. سيذهب هذا التباين في سلة المهملات – خطأ تجريبي – وسوف تقلل نسبة الإشارة إلى الضوضاء ← تأثير العلاج / الخطأ التجريبي. بالإضافة إلى ذلك ، ستزيد من فرصتك في العثور على خطأ من النوع الثاني نظرًا لوجود خطأ تجريبي أقل صدقًا مما يشير إليه النموذج

الحظر يشبه التوقيع على ملف عقدبمجرد دخولك ، تكون في هذه الكتل وتعتبر أداة مفيدة – وغالبًا ما تكون ضرورية – اعتمادًا على هدف البحث الخاص بك. كما هو الحال مع كل شيء في التصميم ، يجب تصميم الكتل بشكل صحيح ومراعاتها في النموذج الإحصائي. على سبيل المثال ، إذا لم يكن من المتوقع حدوث تفاعل بين متغير النتيجة ووزن الجسم الأولي للحيوان ، فقد يؤدي التصميم العشوائي الكامل المهمة على ما يرام. هنا ، وزن الجسم الأولي هو كمية ويمكن استخدامه كمتغير مشترك

يعمل الحظر بشكل أفضل إذا كان يمثل السكان الحقيقيين. ومع ذلك ، إذا كان لديك اهتمام أكبر بجزء معين من السكان ، أو كنت تتوقع المزيد من التباين في جزء معين ، فقد يكون من المفيد تضمين المزيد من الكتل من هذا الجزء

الآن ، ماذا لو بدأت المزيد من الدراسات مع حيوانات من نفس المجموعة في بعض الأحيان تبدأ تجارب متعددة مع حيوانات من نفس المجموعة. يمكن أن يكون لتخصيص الحيوانات للتجارب المختلفة تأثير كبير على النتيجة. في معظم الحالات ، يكون الحل ممكنًا لجميع التجارب المتأثرة. ومع ذلك ، ليس هذا هو الحال دائمًا ، وهو ما يمكن رؤيته في الرسم البياني أدناه. هنا ، تم استخدام كومة حيوانية واحدة كبيرة لتغذية دراستين منفصلتين. أثر تخصيص دراسة الأداء على تخصيص دراسة التفضيل.

يتم تخصيص جميع الخنازير الصغيرة ، ولكن الأصغر جدًا ، بشكل عشوائي للدراسات. كلتا الدراستين تمثيلية. ومع ذلك ، فإن دراسة الأداء بشكل خاص أقل دقة. عدد التكرارات هو نفسه ، لكن التباين يزيد. سيكون لذلك تأثير سلبي على قوة الدراسة.

الآن ، ناقشنا عدة مرات أهمية استخدام استراتيجية حظر صحيحة. يجب أن تكون الكتل قادرة على التقاط التباين بطريقة يتم فيها تكبير التباين بين الكتلة على حساب التباين داخل الكتلة. طريقة إعداد الكتل تضر بهذا.

أدناه ترى استراتيجية منع فعلية على اليسار ، باستخدام وزن الجسم في اليوم صفر كمعامل منع. على اليمين ، ترى استراتيجية حظر محاكاة ، باستخدام توزيع وزن الجسم في اليوم صفر للإبلاغ عن الحجم وبالتالي عدد الكتل. لا يتطلب الأمر تبصرًا كبيرًا للتأكد من الدراسة التي ستثبت أنها تتمتع باستراتيجية حظر أفضل.

يمكن بسهولة إنشاء تصميم بلوك كامل عشوائي وتحسينه باستخدام حقيقة العملية. أدناه ، ترى 2³ عامل كامل عبر أربع كتل تؤدي إلى 32 وحدة تجريبية. خطة العملية يمكن بالطبع استيعاب هنا أيضًا.

بعد ذلك ، هناك دائمًا طريقة خطوة البيانات لبناء مجموعات بيانات متداخلة. في SAS ، هذا هو لعب الأطفال.

أخيرًا وليس آخرًا ، يمكننا استخدام PROC OPTEX لبناء RCBD.

الآن ، لنبدأ في تحليل تصميم RCBD. أدناه ترونني أحاول تضمين تفاعل منع * علاج. تذكر أن RCBD له تكرار واحد لكل علاج * تفاعل كتلة مما يعني أن تضمين كتلة العلاج * لا يترك أي معلومات لتحديد التباين المتبقي. كما ترى بوضوح.

إذا كنت ترغب في تحليل التفاعل بين العلاج والحصار ، فأنت بحاجة إلى تكرار العلاج داخل كتلة. ومع ذلك ، فإن هذا سيجعل الكتل أكبر مما قد يؤدي إلى تجانس أقل داخل الكتلة ، وبالتالي تقليل التجانس

ومن ثم ، فإن تصميم الكتلة العشوائية الكاملة يعد تصميمًا رائعًا إذا:

  1. هناك تباين كافٍ لالتقاطه بالحظر
  2. يتم إعداد الكتل بطريقة تكون متجانسة داخلها وغير متجانسة بينها.

إذا كان لديك العديد من العلاجات ، فقد يكون من الصعب جدًا الحصول على كتل متجانسة ، كما ترون في الشريط الملون هنا.

ومن ثم ، هذا هو المكان الذي يوجد فيه ملف تصميم كتل عشوائي غير مكتمل (RIBD) يمكن أن يكون ذا قيمة كبيرة لأنه يحافظ على تجانس الكتل من خلال عدم وجود جميع العلاجات في كل كتلة. يمكن التمييز بين أ متوازن و متوازن جزئيا تصميم.

يحتوي RIBD على أربع خصائص رئيسية:

  1. يتم تكرار كل مستوى معالجة بالتساوي
  2. لا يظهر كل علاج في كل كتلة
  3. يظهر كل علاج نفس العدد من المرات على الكتل
  4. كل زوج من العلاجات يظهر في كتلة بنفس عدد المرات

لإنشاء مثل هذا التصميم ، تحتاج إلى معالجة ماكرو SAS مضمن ثم استخدامه PROC OPTEX.

بالطبع ، على الرغم من أن تصميم الكتلة غير المكتمل متوازن ، إلا أنه لا يضاهي RCBD. ومع ذلك ، إذا لم يكن لديك مساحة لاستيعاب حجم العينة الضروري لـ RCBD ، أفترض أن RIBD هو أفضل طريقة للذهاب.

نظرًا لأن لدينا تصميم كتلة غير مكتمل متوازن تمامًا ، فمن غير المنطقي إلى حد ما أنه يمكننا أيضًا إنشاء تصميمات كتل غير كاملة متوازنة جزئيًا. هنا:

  1. كل علاج لا تظهر في كل كتلة
  2. كل علاج لا تظهر نفس عدد المرات على الكتل
  3. كل زوج من العلاجات لا تظهر في كتلة نفس عدد المرات

لنفترض أن لدي ستة علاجات ، وأربع مجموعات ، وثلاث علاجات لكل كتلة ، وأنا مهتم في الغالب بمقارنة 1 مقابل 2 ، و 1 مقابل 4 ، و 2 مقابل 4. وستكون البداية البسيطة باستخدام خطة العملية.

أدناه ، ترى مثالًا لتصميم RCBD باستخدام خطوات متعددة من PROC FACTEX لبناء تداخل للمكونات الثابتة والعشوائية ، بدءًا من الكتلة ، وإضافة العلاج ، ثم إضافة الجنس كعوامل.

يمكن للمرء أيضًا أن يطلب بسهولة من SAS تحويل العامل الكامل إلى RCBD ، والذي يمكنك رؤية مثالين لهما أدناه.

باختصار ، هناك سببان رئيسيان لحجب الدراسة: (1) عملي ، و (2) إحصائي.

أسباب عملية للحظر

  1. لا يمكن أن تظل الظروف ثابتة في الدراسة.
  2. يقسم التجربة إلى تجارب مصغرة مع حيوانات متجانسة.
  3. التجربة أكثر قابلية للإدارة.

أسباب إحصائية للحظر

  1. التحكم في التباين عن طريق إنشاء التباين الذي تم إنشاؤه والمحاسبة عليه.
  2. إلغاء التباين من كتلة إلى أخرى
  3. تقدير الفروق العلاجية أفضل → الخطأ المعياري فقط بسبب خطأ تجريبي

تم نشر تصميمات قوالب البناء العشوائية الكاملة وتحسينها باستخدام SAS في الأصل في Towards AI on Medium ، حيث يواصل الأشخاص المحادثة من خلال تسليط الضوء على هذه القصة والرد عليها.

تم النشر عبر نحو الذكاء الاصطناعي