ستساعدك المقالة التالية: البيانات الضخمة والحدود الجديدة لـ Google Analytics
ربما لاحظ الكثير منكم وجود رقعة شطرنج صغيرة في زاوية شاشات Google Analytics. لقد ظهر هذا الرمز الدقيق إلى حد ما أكثر فأكثر في الأشهر القليلة الماضية، وهو مؤشر على الإجراءات التي تتخذها Google لاستخدام عينات البيانات لتقارير Analytics. في البداية، ظهر فقط على الشاشات التي تم تشغيل الشرائح المتقدمة فيها، ولكنه بدأ مؤخرًا في الظهور حتى على التقارير وطرق عرض البيانات ذات أحجام العينات المنخفضة. ومما يثير القلق المتزايد حقيقة أن المواقع التي تتمتع بحركة مرور أكبر تضطر إلى استخدام وضع أخذ العينات لأي تقرير، وتكون الدقة الافتراضية متوازنة في المنتصف بين “معالجة أسرع” و”دقة أعلى”. على موقع ويب به عدد كبير من الزيارات باستخدام عدة أشهر من البيانات، يمكن لشريحة مخصصة، حتى إعداد “الدقة العالية”، أن تنتج تقارير بيانات تعتمد على أقل من 25% من حركة المرور الفعلية.
عندما تعني البيانات الضخمة الاختصارات
ما لدينا هنا هو مشكلة البيانات الضخمة. تمتلك Google كمية لا تصدق من البيانات التي تم جمعها بشكل إجمالي من خلال مواقع Analytics في جميع أنحاء العالم، ومن المفهوم أن الحمل على مراكز البيانات الخاصة بها هائل. من أجل توفير طاقة المعالجة وتقليل أوقات التحميل، يمكن استخدام أخذ عينات البيانات في التقارير. من الناحية النظرية، لا ينبغي أن يؤدي استخدام أخذ العينات إلى تقليل الدقة، لأن البيانات يجب أن تكون ذات دلالة إحصائية وضمن احتمالية قياس الدقة. إذا كانت لديك مشكلة مع نماذج التقارير، فيمكنك دفع ستة أرقام مقابل التحليلات على مستوى المؤسسة، ولكن معظم الشركات ببساطة لا تستطيع تحمل تكلفة التحليلات المتميزة.
احذروا رقعة الشطرنج
على الرغم من أنه من الناحية النظرية يجب أن تكون التقارير التي تعتمد على عينات دقيقة من الناحية الإحصائية مثل التقارير غير المستندة إلى عينات في Google Analytics، إلا أنه يجب علينا التشكيك في هذا الافتراض قبل الوثوق به. في التقارير الواقعية، يوجد في الواقع نطاق واسع من الاختلافات من تحديث صفحة إلى أخرى أثناء عرض التقرير العادي. هذا المستوى من الاختلاف غير مقبول من وجهة نظر المساءلة، حيث أن مديري إعلانات الدفع لكل نقرة والتسويق والتجارة الإلكترونية يحتاجون إلى بيانات دقيقة لاتخاذ القرارات الرئيسية للحملات والاستراتيجيات التسويقية.
دعونا نلقي نظرة على مثال العالم الحقيقي أدناه. في هذا التقرير، تتم مقارنة نطاقين زمنيين ويتم تطبيق شريحة مخصصة لإزالة الحملات الإعلانية لقائمة المنتجات. تزيد حركة المرور لكل نطاق زمني عن 460.000 زيارة.
أخذ العينات الافتراضية
في العرض الأول للتقرير، تم تطبيق معدل أخذ عينات البيانات بشكل افتراضي، والذي اعتمد التقرير على 21.59% من الزيارات. Note أن هذا هو إجمالي الزيارات المجمعة لكلا النطاقين الزمنيين. يحسب التقرير أن معدل التحويل قد سقط 4.01% على أساس شهري، من 3.36% إلى 3.23%. Note كما أن هدف “إدراج رسائل البريد الإلكتروني” ارتفع بنسبة 3.10% على أساس شهري.
أخذ العينات المعدلة
انظر الآن إلى هذا التقرير، حيث اخترنا الإعداد الأبعد على “أعلى دقة” لأخذ العينات. ولا يزال يقوم بأخذ عينات من البيانات، ولكنه يقدم لنا تقريرًا يستند إلى 41.54% من إجمالي الزيارات، وهو ما يقرب من ضعف حجم العينة الافتراضي. لاحظ الآن أن معدل التحويل في الواقع وَردَة 9.05% بدلاً من 4.01%. يُظهر هدف “إدراج رسائل البريد الإلكتروني” الآن زيادة بنسبة 22.43% شهريًا، وهو ما يختلف تمامًا عن نسبة 3.10% المذكورة سابقًا.
هذه مجرد واحدة من العديد من المقارنات، ولكنها توضح الفرق الجذري الذي يمكن أن يحدثه أخذ عينات البيانات في تقارير Analytics. كلما زاد عدد زوار موقع الويب الخاص بك، زاد عدد مرات أخذ العينات. في المثال أعلاه، حتى تحديد الحد الأقصى من الدقة لم يسفر عن نتيجة مع تضمين جميع الزيارات. في مواقع الويب ذات الزيارات الأقل، قد يكون لأخذ العينات تأثير ضئيل.
الاستنتاجات
يجب على جميع مستخدمي Google Analytics توخي الحذر بشأن إعدادات أخذ العينات عند عرض التقرير. سيتم أخذ العينات في كثير من الأحيان لمواقع الويب ذات الزيارات الكبيرة وعندما تطلب المزيد من البيانات في التقرير. قد تلاحظ أن أخذ العينات سيكون بنسبة 100% في تقرير لمدة شهر من البيانات، بينما يمكن أخذ عينات بنسبة 60% لعرض لمدة ستة أشهر. تحتاج الوكالات إلى تثقيف عملائها حول الاختلافات والتناقضات المحتملة، ويحتاج المسوقون الداخليون إلى تثقيف الموظفين الآخرين. قد يكون أخذ العينات بمثابة دفعة كبيرة للمواقع ذات الحجم الكبير للترقية إلى Premium Analytics، ولكن طالما تم فهم أخذ العينات وأخذ المخاطر المحتملة في الاعتبار، فمن المرجح أن تظل التحليلات المجانية هي المعيار لمواقع الويب.