---
title:

Концепции на статистиката за лаици

date: 2026-01-22
draft: false
---

https://www.kdnuggets.com/7-statistical-concepts-every-data-scientist-should-master-and-why

Добра статия за концепциите на статистиката за лаици.

  • Статистическа значимост срещу практическа значимост: разликата между това, че резултатът е математически надежден и важен на практика. Например, лекарство намалява температурата с 0.01 градуса — статистически това може да е значимо при милион души, но практически е безполезно.
  • Изкривяване на извадката (sampling bias): когато данните лошо отразяват реалната ситуация и водят до грешни изводи. Например, анкета за страха от полети на летището — няма да чуете тези, които толкова се страхуват, че са си останали вкъщи.
  • Доверителни интервали (confidence intervals): вместо една цифра — диапазон, в който най-вероятно се намира истинската стойност. Например, навигаторът обещава пристигане в 18:00 ± 5 минути. Тези 10 минути са интервалът.
  • P-стойности (p-values): помагат да се оцени колко вероятно е наблюдаваният ефект да е възникнал случайно. Например, ако след нова диета сте отслабнали, а p-value е 0.05, това означава, че има 5% шанс да сте свалили тегло случайно, а не благодарение на диетата.
  • Типове грешки в тестовете (Type I и II): фалшиво положителни срещу фалшиво отрицателни изводи. Например, грешка от I род — алармата вие без крадци; грешка от II род — крадците са влезли, а тя мълчи.
  • Корелация срещу причинно-следствена връзка: две неща могат да бъдат свързани, но едното не е задължително причина за другото. Например, децата с голям крак пишат диктовки по-добре не заради обувките, а защото са по-големи.
  • Проклятието на размерността (curse of dimensionality): твърде много признаци могат да влошат резултатите на модела. Например, търсите подобни апартаменти за оценка на стойността. По един параметър (площ) е лесно да се намерят 10 подобни в база от 1000. Добавете етаж — вече са нужни 10 000 апартамента. Добавете район, година на строителство, материал на стените — и за надеждно сравнение ще са нужни милиони записи, които просто не съществуват.