لطالما كانت الإحصاءات جزءًا لا يتجزأ من الحياة. يواجهه الناس في كل مكان. استنادًا إلى الإحصائيات ، يتم استخلاص استنتاجات حول أماكن انتشار الأمراض وما هو أكثر شيوعًا في منطقة معينة أو بين شريحة معينة من السكان. حتى بناء البرامج السياسية للمرشحين للهيئات الحكومية يعتمد على البيانات الإحصائية. يتم استخدامها أيضًا من قبل سلاسل البيع بالتجزئة عند شراء البضائع ، ويتم إرشاد الشركات المصنعة بهذه البيانات في عروضها.
تلعب الإحصائيات دورًا مهمًا في حياة المجتمع وتؤثر على كل فرد من أفراده ، حتى في الأشياء الصغيرة. على سبيل المثال ، إذا كان معظم الناس ، وفقًا للإحصاءات ، يفضلون الألوان الداكنة في الملابس في مدينة أو منطقة معينة ، فسيكون من الصعب للغاية العثور على معطف واق من المطر أصفر لامع مع طباعة الأزهار في المنافذ المحلية. لكن ما هي الكمياتهل تضيف هذه البيانات ليكون لها مثل هذا التأثير؟ على سبيل المثال ، ما هي "ذات دلالة إحصائية"؟ ما المقصود بالضبط بهذا التعريف؟
ما هذا؟
تتكون الإحصائيات كعلم من مزيج من كميات ومفاهيم مختلفة. أحدها هو مفهوم "الأهمية الإحصائية". هذا هو اسم قيمة المتغيرات ، واحتمال ظهور مؤشرات أخرى لا يكاد يذكر.
على سبيل المثال ، يرتدي 9 من كل 10 أشخاص أحذية مطاطية على أقدامهم أثناء نزهة صباحية للفطر في غابة الخريف بعد ليلة ممطرة. احتمال أن يرتدي 8 منهم حذاء بدون كعب لا يكاد يذكر. وهكذا ، في هذا المثال بالذات ، الرقم 9 هو ما يسمى "الدلالة الإحصائية".
وفقًا لذلك ، إذا قمنا بتطوير المثال العملي المعطى بشكل أكبر ، فإن متاجر الأحذية تشتري الأحذية المطاطية بنهاية موسم الصيف بكميات أكبر مما كانت عليه في أوقات أخرى من العام. وبالتالي ، فإن حجم القيمة الإحصائية له تأثير على الحياة العادية.
بالطبع ، في الحسابات المعقدة ، على سبيل المثال ، عند التنبؤ بانتشار الفيروسات ، يتم أخذ عدد كبير من المتغيرات في الاعتبار. لكن جوهر تحديد مؤشر مهم للبيانات الإحصائية متشابه ، بغض النظر عن تعقيد الحسابات وعدد القيم المتغيرة.
كيف يتم حسابها؟
تستخدم عند حساب قيمة مؤشر "الأهمية الإحصائية" للمعادلة. أي أنه يمكن القول أنه في هذه الحالة كل شيء تقرره الرياضيات.أبسط خيار حساب هو سلسلة من العمليات الحسابية ، حيث يتم تضمين المعلمات التالية:
- نوعان من النتائج التي تم الحصول عليها من الاستطلاعات أو دراسة البيانات الموضوعية ، مثل كمية المشتريات ، المشار إليها بواسطة أ و ب ؛
- مؤشر حجم العينة لكلتا المجموعتين - n ؛
- قيمة حصة العينة المجمعة - p ؛
- خطأ معياري - SE.
الخطوة التالية هي تحديد درجة الاختبار الإجمالية - t ، تتم مقارنة قيمتها مع الرقم 1.96. 1.96 هي متوسط القيمة ، وتنقل نطاقًا بنسبة 95 ٪ ، وفقًا لوظيفة توزيع t للطالب.
السؤال الذي يطرح نفسه غالبًا ما هو الفرق بين قيم n و p. من السهل توضيح هذا الفارق الدقيق بمثال. لنفترض أنه تم حساب الدلالة الإحصائية للولاء لأي منتج أو علامة تجارية للرجال والنساء.
في هذه الحالة يتبع الحروف ما يلي:
- n - عدد المستجيبين ؛
- p - عدد الراضين عن المنتج
سيتم تحديد عدد النساء اللواتي تمت مقابلتهن في هذه الحالة على أنه n1. تبعا لذلك ، الرجال - n2. نفس القيمة سيكون لها الأرقام "1" و "2" من الرمز ص.
تصبح مقارنة درجات الاختبار بمتوسط جداول بيانات الطالب ما يسمى "الدلالة الإحصائية".
ما هو المقصود بالتحقق؟
يمكن دائمًا التحقق من نتائج أي حساب رياضي ، ويتم تدريس هذا للأطفال في المدرسة الابتدائية. من المنطقي أن نفترضأنه نظرًا لأن الإحصائيات يتم تحديدها باستخدام سلسلة الحسابات ، يتم فحصها.
ومع ذلك ، فإن اختبار الدلالة الإحصائية ليس مجرد رياضيات. تتعامل الإحصائيات مع عدد كبير من المتغيرات والاحتمالات المختلفة ، والتي ليست دائمًا قابلة للحساب. أي ، إذا عدنا إلى مثال الأحذية المطاطية في بداية المقال ، فإن البناء المنطقي للبيانات الإحصائية التي سيعتمد عليها مشترو البضائع للمخازن يمكن أن يتعطل بسبب الطقس الجاف والحار ، وهو أمر غير معتاد في الخريف.. نتيجة لهذه الظاهرة ، سينخفض عدد الأشخاص الذين يشترون الأحذية المطاطية وستتكبد منافذ البيع خسائر. بالطبع ، المعادلة الرياضية غير قادرة على التنبؤ بشذوذ الطقس. هذه اللحظة تسمى "خطأ".
هذا مجرد احتمال حدوث مثل هذه الأخطاء ويأخذ في الاعتبار التحقق من مستوى الأهمية المحسوبة. يأخذ في الاعتبار كلاً من المؤشرات المحسوبة ومستويات الأهمية المقبولة ، فضلاً عن الكميات التي يطلق عليها تقليديًا الفرضيات.
ما هو مستوى الأهمية؟
تم تضمين مفهوم "المستوى" في المعايير الرئيسية للدلالة الإحصائية. يتم استخدامه في الإحصاء التطبيقي والعملي. هذا نوع من القيمة يأخذ في الاعتبار احتمال حدوث انحرافات أو أخطاء محتملة.
يعتمد المستوى على تحديد الاختلافات في العينات الجاهزة ، ويسمح لك بإثبات أهميتها أو ، على العكس من ذلك ، العشوائية. هذا المفهوم ليس له معاني رقمية فحسب ، بل أيضًا تفسيراته الخاصة. يشرحونكيف تحتاج إلى فهم القيمة ، ويتم تحديد المستوى نفسه من خلال مقارنة النتيجة مع متوسط المؤشر ، وهذا يكشف عن درجة موثوقية الاختلافات.
وهكذا ، يمكننا تخيل مفهوم المستوى ببساطة - إنه مؤشر لخطأ مقبول أو محتمل أو خطأ في الاستنتاجات المستخلصة من البيانات الإحصائية التي تم الحصول عليها.
ما هي مستويات الأهمية المستخدمة؟
تعتمد الأهمية الإحصائية لمعاملات احتمالية الخطأ في الممارسة على ثلاثة مستويات أساسية.
المستوى الأول هو الحد الذي تكون فيه القيمة 5٪. أي أن احتمال الخطأ لا يتجاوز مستوى الأهمية 5٪. وهذا يعني أن الثقة في خلو الاستنتاجات التي تم التوصل إليها على أساس بيانات البحث الإحصائي لا تشوبها شائبة وعصمة هي 95٪.
المستوى الثاني هو عتبة 1٪. وفقًا لذلك ، يعني هذا الرقم أنه يمكن للمرء أن يسترشد بالبيانات التي تم الحصول عليها أثناء الحسابات الإحصائية بثقة 99 ٪.
المستوى الثالث - 0.1٪. بهذه القيمة ، فإن احتمال الخطأ يساوي كسرًا من النسبة المئوية ، أي يتم التخلص من الأخطاء عمليًا.
ما هي الفرضية في الإحصاء؟
الأخطاء كمفهوم تنقسم إلى مجالين ، يتعلقان بقبول أو رفض الفرضية الصفرية. الفرضية هي مفهوم يخفي وراءه ، وفقًا للتعريف ، مجموعة من نتائج الاستطلاع أو البيانات أو العبارات الأخرى. أي وصف التوزيع الاحتمالي لشيء متعلق بموضوع المحاسبة الإحصائية.
هناك فرضيتان في العمليات الحسابية البسيطة - صفر والبديل. الفرق بينهما هو أن الفرضية الصفرية تقوم على فكرة أنه لا توجد فروق جوهرية بين العينات المشاركة في تحديد الأهمية الإحصائية ، والبديل هو عكس ذلك تمامًا. أي أن الفرضية البديلة مبنية على وجود فرق كبير في هذه العينات.
ما هي الاخطاء؟
الأخطاء كمفهوم في الإحصاء تتناسب بشكل مباشر مع قبول هذه الفرضية أو تلك على أنها صحيحة. يمكن تقسيمها إلى اتجاهين أو نوعين:
- النوع الأول يرجع إلى قبول الفرضية الصفرية ، والتي تبين أنها غير صحيحة ؛
- second - بسبب اتباع البديل
النوع الأول من الخطأ يسمى الخطأ الإيجابي الخاطئ وهو شائع جدًا في جميع المجالات التي تستخدم فيها الإحصائيات. وعليه فإن الخطأ من النوع الثاني يسمى الخطأ السلبي الخاطئ.
لماذا نحتاج إلى الانحدار في الإحصاء؟
الأهمية الإحصائية للانحدار هي أنه بمساعدته يمكن تحديد مدى توافق نموذج التبعيات المختلفة المحسوبة على أساس البيانات مع الواقع ؛ يسمح لك بتحديد مدى كفاية أو نقص عوامل المحاسبة والاستنتاجات
يتم تحديد قيمة الانحدار من خلال مقارنة النتائج مع البيانات المدرجة في جداول فيشر. أو باستخدام تحليل التباين. مؤشرات الانحدار مهمة عندمادراسات وحسابات إحصائية معقدة تتضمن عددًا كبيرًا من المتغيرات والبيانات العشوائية والتغييرات المحتملة.