L’écart type est la racine carrée positive de la variance. C’est l’une des méthodes de base de l’analyse statistique. L’écart-type est couramment abrégé en SD et désigné par le symbole « σ ». Il indique dans quelle mesure les valeurs de données sont écartées de la valeur moyenne. Si nous obtenons un faible écart-type, cela signifie que les valeurs ont tendance à être proches de la moyenne, tandis qu’un écart-type élevé nous indique que les valeurs sont éloignées de la valeur moyenne.
Nous avons des formules distinctes pour calculer l’écart-type des données groupées et non groupées. De plus, nous avons différentes formules d’écart-type pour calculer SD d’une variable aléatoire. Examinons toutes les formules en détail.
Qu’est-ce que l’écart-type?
L’écart-type est le degré de dispersion ou de répartition des points de données par rapport à leur moyenne, en statistique descriptive. Il indique comment les valeurs sont réparties dans l’échantillon de données et mesure la variation des points de données par rapport à la moyenne. L’écart-type d’un ensemble de données, d’un échantillon, d’une population statistique, d’une variable aléatoire ou d’une distribution de probabilité est la racine carrée de sa variance.
Comment calculer l’écart-type?
Lorsque nous avons n observations et que les observations sont \(x_1, x_2, …..x_n\), la moyenne de l’écart des valeurs par rapport à la moyenne est déterminée comme \(\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}\). Cependant, la somme des carrés des écarts par rapport à la moyenne ne semble pas être une mesure appropriée de la dispersion. Si la moyenne des carrés des différences par rapport à la moyenne est petite, cela indique que les observations \(x_i\) sont proches de la moyenne \(\bar x\). Cela correspond à un degré de dispersion inférieur. Si cette somme est grande, cela indique qu’il y a un degré de dispersion plus élevé des observations par rapport à la moyenne \(\bar x\). Ainsi, nous concluons que \(\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}\) est un indicateur raisonnable du degré de dispersion ou de la répartition.
La variance et l’écart-type
Nous prenons \(\dfrac{1}{n}\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}\) comme une mesure appropriée de la dispersion et cela s’appelle la variance(\(\sigma^{2}\)). La racine carrée positive de la variance est l’écart-type.
Formule de l’écart type
La propagation des données statistiques est mesurée par l’écart type. Le degré de dispersion est calculé par la méthode d’estimation de l’écart des points de données. Vous pouvez en savoir plus sur la dispersion dans les statistiques sommaires. Comme discuté, la variance de l’ensemble de données est la distance carrée moyenne entre la valeur moyenne et chaque valeur de données. Et l’écart type définit la dispersion des valeurs de données autour de la moyenne. Voici deux formules d’écart type qui sont utilisées pour trouver l’écart type des données d’échantillon et l’écart type de la population donnée.
Notez que les deux formules se ressemblent presque sauf pour le dénominateur qui est N dans le cas de l’écart type de population mais n-1 dans le cas de l’écart type d’échantillon. Lors du calcul de la moyenne d’échantillon, toutes les valeurs de données de la population ne sont pas prises en compte, de sorte que la moyenne d’échantillon est juste une estimation de la moyenne de la population, mais cela introduit une certaine incertitude ou un biais dans notre calcul d’écart type. Pour ajuster cela, le dénominateur de l’écart type d’échantillon est corrigé pour être n-1 au lieu de simplement n. Cela est connu sous le nom de correction de Bessel.
Formule pour calculer l’écart type
Il existe deux types d’ensembles de données: les populations et les échantillons. Une population est un groupe entier qui nous intéresse à étudier, tandis qu’un échantillon est un plus petit groupe d’individus prélevé dans la population. Les formules pour calculer les écarts types de la population et de l’échantillon diffèrent légèrement.

La formule d’écart type de la population est donnée par:
\(\sigma=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(X_{i}-\mu\right)^{2}}\)
Ici,
- σ = Symbole de l’écart type de la population
- μ = Moyenne de la population
- N = Nombre total d’observations
De même, la formule d’écart type d’échantillon est:
\(s=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}\)
Comment Calculer l’écart type?
Généralités
L’écart type est une mesure de la dispersion des valeurs d’un ensemble de données. Pour calculer l’écart type d’une population, voici les étapes à suivre:
Les étapes
- Trouvez la moyenne arithmétique des observations.
- Calculez les différences au carré entre les données et la moyenne.
- Calculez la moyenne des différences au carré. (Variance = somme des différences au carré ÷ nombre d’observations)
- Calculez la racine carrée de la variance. (Écart type = √Variance)
Il est important de noter que la formule de l’écart type pour un échantillon est légèrement différente de celle d’une population. Pour calculer l’écart type d’un échantillon, utilisez la formule :
La formule pour un échantillon
s = √[ Σ(xi – x̄)2 / (n-1) ]
où :
- s est le symbole de l’écart type d’un échantillon.
- x̄ est la moyenne arithmétique des observations.
- n est le nombre total d’observations dans l’échantillon.
En utilisant la formule appropriée, vous pouvez calculer l’écart type de vos données avec précision.
Écart type de données non regroupées
Méthodes pour calculer l’écart type
L’écart type mesure l’écart de données par rapport à leur moyenne ou position moyenne. Il existe trois méthodes pour trouver l’écart type:
- Méthode de la moyenne réelle
- Méthode de la moyenne supposée
- Méthode des écarts-types par pas
Méthode de la moyenne réelle
Dans cette méthode, nous calculons d’abord la moyenne des valeurs de données (\(\bar x\)) et calculons ensuite les écarts de chaque valeur de données par rapport à la moyenne. Ensuite, nous utilisons la formule d’écart type suivante par la méthode de la moyenne réelle :
σ = √(∑\((x-\bar x)\)2 /n), où n = nombre total d’observations.
Prenons les observations de données 3, 2, 5, 6. Ici, la moyenne de ces points de données est (3 + 2 + 5 + 6)/4 = 16/4 = 4.
La somme des différences carrées à partir de la moyenne = (4-3)2+(2-4)2 +(5-4)2 +(6-4)2 = 10
Variance = Différences carrées à partir de la moyenne / nombre de points de données = 10/4 = 2.5
Écart type = √2.5 = 1.58
Méthode de la moyenne supposée
Lorsque les valeurs x sont grandes, une valeur arbitraire (A) est choisie comme moyenne (comme le calcul de la moyenne est difficile dans ce cas). L’écart par rapport à cette moyenne supposée est calculé comme d = x – A. Ensuite, la formule d’écart type par méthode de la moyenne supposée est :
σ = √[(∑(d)2 /n) – (∑d/n)2]
Méthode des écarts-types par pas
L’écart type de données regroupées peut également être calculé par la « méthode des écarts-types par pas ». Dans cette méthode, une valeur de données arbitraire est également choisie comme moyenne supposée, A. Ensuite, nous calculons les écarts de toutes les valeurs de données en utilisant d = x – A. La prochaine étape consiste à calculer les écarts-types par pas (d’) en utilisant d’ = d/i où ‘i’ est un facteur commun à toutes les valeurs ‘d’ (choisissez n’importe quel facteur commun en cas de plusieurs facteurs). Maintenant, l’écart type de données non regroupées par méthode d’écarts-types par pas est trouvé en utilisant la formule :
σ = √[(∑(d’)2 /n) – (∑d’/n)2] × i, où ‘n’ est le nombre total de valeurs de données.
Écart-type des données discrètes par la méthode de la moyenne réelle
Pour n nombre d’observations, \(x_1, x_2, …..x_n\), et les fréquences correspondantes, \(f_1, f_2, f_3, …f_n\), l’écart-type est:
(\sigma=\sqrt{\frac{1}{n} \sum_{i=1}^{n}f_i \left(x_{i}-\bar x\right)^{2}}).
Ici,
n = fréquence totale = \(\sum_{i=1}^{n}f_i\)
\(\bar x\) = moyenne
Exemple:
Calculons l’écart-type pour les données données ci-dessous:
xi | 6 | 10 | 12 | 14 | 24 |
---|---|---|---|---|---|
fi | 2 | 3 | 4 | 5 | 4 |
Calculer la moyenne (\(\bar x\)): (6 × 2 + 10 × 3 + 12 × 4 + 14 × 5 + 24 × 4)/(2+3+4+5+4) = 14.22
xi | fi | fixi | xi – (\bar x) | (xi – (\bar x))2 | fi (xi – (\bar x))2 |
---|---|---|---|---|---|
6 | 2 | 12 | -8.22 | 67.5684 | 135.1368 |
10 | 3 | 24 | -4.22 | 17.8084 | 53.4252 |
12 | 4 | 40 | -2.22 | 4.9284 | 19.7136 |
Méthode de la déviation standard des données discrètes par la méthode de la moyenne supposée
Lorsque les valeurs des données sont très grandes, on choisit l’une des valeurs de données comme moyenne (et donc appelée moyenne supposée, A). Ensuite, l’écart de chaque valeur de données par rapport à la moyenne supposée est d = x – A. La formule de la déviation standard par la méthode de la moyenne supposée est alors :
σ = √[(∑(fd)2 /n) – (∑fd/n)2], où
- ‘f’ est la fréquence de la valeur de données correspondante x et
- ‘n’ est la fréquence totale.
Méthode de la déviation standard des données discrètes par la méthode de la déviation d’étape
La déviation standard des données groupées peut être calculée par une autre méthode appelée « méthode de la déviation d’étape ». Dans cette méthode également, nous supposons que certaines valeurs de données sont la moyenne (moyenne supposée, A) et calculons les écarts des valeurs de données en utilisant d = x – A. Dans cette méthode, nous trouvons également les déviations d’étape (d’) en utilisant d’ = d/i où i = tout nombre qui est un facteur commun de toutes les valeurs représentées par ‘d’ (il peut y avoir plusieurs facteurs, mais nous pouvons choisir n’importe lequel). Maintenant, la déviation standard par la méthode de la déviation d’étape est calculée par la formule :
σ = √[(∑(fd’)2 /n) – (∑fd’/n)2] × i, où
- ‘f’ est la fréquence des valeurs de données
- ‘n’ est la fréquence totale
- ‘i’ est un facteur commun de toutes les valeurs ‘d’, où d = x – A (A = moyenne supposée)
- d’ = d/i
Maintenant, l’écart-type peut être calculé en utilisant les formules de données groupées soit dans la méthode de la moyenne réelle, la méthode de la moyenne supposée ou la méthode des écarts de classe.
Écart-type des variables aléatoires
Mesure de la dispersion de la distribution de probabilité d’une variable aléatoire
La mesure de la dispersion de la distribution de probabilité d’une variable aléatoire détermine dans quelle mesure les valeurs diffèrent de la valeur attendue. C’est une fonction qui attribue une valeur numérique à chaque résultat dans un espace d’échantillonnage. Cela est représenté par X, Y ou Z, car il s’agit d’une fonction. Si X est une variable aléatoire, l’écart-type est déterminé en prenant la racine carrée de la somme du produit de la différence au carré entre la variable aléatoire, X, et la valeur attendue (𝜇 ou E(X)) et la valeur de probabilité associée à la variable aléatoire.
Formule de l’écart-type de la distribution de probabilité de X
L’écart-type de la distribution de probabilité de X, 𝜎 = (\sqrt{\Sigma\left[(x-\mu)^2 \cdot P(x)\right]})
Raccourci pour trouver l’écart-type des variables aléatoires
Le raccourci pour trouver l’écart-type des variables aléatoires est: 𝜎 = (\sqrt{E(X^2)-[E(X)]^2}) (ou) 𝜎 = (\sqrt{\Sigma\left[x^2 \cdot P(x)\right]-\mu^2})
Déviation standard d’une distribution de probabilité
La probabilité expérimentale consiste en de nombreux essais. Lorsque la différence entre la probabilité théorique d’un événement et sa fréquence relative se rapprochent, nous avons tendance à connaître le résultat moyen. Cette moyenne est connue sous le nom de valeur attendue de l’expérience, notée 𝜇.
En statistiques, la déviation standard est une mesure de la dispersion des données autour de leur moyenne. Elle indique à quel point les données sont écartées de leur valeur moyenne.
Déviation standard pour une distribution normale
Dans une distribution normale, la moyenne est zéro et la déviation standard est de 1. La déviation standard pour une distribution normale permet de déterminer la proportion de données qui se situent dans un certain intervalle autour de la moyenne.
Déviation standard pour une distribution binomiale
Dans une expérience binomiale, le nombre de succès est une variable aléatoire. Si une variable aléatoire suit une distribution binomiale, sa déviation standard est donnée par: 𝜎 = √npq, où 𝜇 = np, n est le nombre d’essais, p est la probabilité de succès et 1-p =q est la probabilité d’échec.
Déviation standard pour une distribution de Poisson
Dans une distribution de Poisson, la déviation standard est donnée par 𝜎 = √λt, où λ est le nombre moyen de succès dans un intervalle de temps t. La distribution de Poisson est souvent utilisée pour modéliser des événements rares et aléatoires.
Notes importantes sur la déviation standard
La racine carrée de la moyenne des différences au carré des observations de données par rapport à la moyenne est appelée la déviation standard. La déviation standard est la racine carrée positive de la variance. Elle est souvent utilisée pour comparer la dispersion des données de différentes distributions.
Formules d’écart type pour les données groupées
Données groupées discrètes
Les données groupées peuvent être discrètes ou continues. Voici les formules d’écart type pour les données groupées discrètes selon différentes méthodes. Si les données sont continues, les valeurs des données seront les points médians des intervalles de classe, et l’écart type peut être calculé en utilisant les mêmes formules que pour les données discrètes.
Méthode de la moyenne réelle
σ = √(∑\(f(x-\bar x)\)2 /n)
Méthode de la moyenne supposée
σ = √[(∑(fd)2 /n) – (∑fd/n)2]
Méthode d’écart de classe
σ = √[(∑(fd’)2 /n) – (∑fd’/n)2] × i
Pour comprendre en détail le processus de calcul de l’écart type, veuillez consulter la section ci-dessus.
Différence entre la formule d’écart type et la formule de variance
La variance est la moyenne des écarts au carré par rapport à la moyenne, tandis que l’écart type est la racine carrée de ce nombre. Les deux mesures reflètent la variabilité de la distribution, mais leurs unités diffèrent : l’écart type est exprimé dans les mêmes unités que les valeurs originales (par exemple, minutes ou mètres). La formule d’écart type d’échantillon est √[ Σ (xi – x̅)2/(n-1) ] et la formule de variance est σ2 = Σ (xi – x̅)2/(n-1).
La signification de moyenne-variance et écart type en statistiques
Variance
La variance est la somme des carrés des différences entre toutes les valeurs et la moyenne. Elle mesure la quantité de variation des données par rapport à la moyenne. La formule de variance est utilisée pour calculer cette mesure.
Ecart type
L’écart type est la racine carrée de la variance. C’est une mesure de l’ampleur de la variation des données par rapport à la moyenne. La formule d’écart type est √variance.
Lequel est mieux à utiliser entre la formule de variance et la formule d’écart type ?
Chacune a une utilisation différente. L’écart type est généralement plus utile pour décrire la variabilité des données, tandis que la variance est généralement plus utile mathématiquement. Par exemple, la somme de distributions non corrélées (variables aléatoires) a également une variance qui est la somme des variances de ces distributions.
Pourquoi utilisons-nous la formule d’écart type et la formule de variance ?
L’écart type permet d’évaluer à quel point un groupe de nombres est éloigné de la moyenne, en regardant la racine carrée de la variance. La variance mesure le degré moyen selon lequel chaque point diffère de la moyenne.
Vous êtes actuellement en train de consulter l’article: https://en.wikipedia.org/wiki/Standard_deviation
Source de référence : https://en.wikipedia.org/wiki/Standard_deviation