Signification statistique : définition, concept, signification, équations de régression et tests d'hypothèses

Table des matières:

Signification statistique : définition, concept, signification, équations de régression et tests d'hypothèses
Signification statistique : définition, concept, signification, équations de régression et tests d'hypothèses

Vidéo: Signification statistique : définition, concept, signification, équations de régression et tests d'hypothèses

Vidéo: Signification statistique : définition, concept, signification, équations de régression et tests d'hypothèses
Vidéo: Cours Statistique - Test d'Hypothèse 2024, Septembre
Anonim

Les statistiques font depuis longtemps partie intégrante de la vie. Les gens y sont confrontés partout. Sur la base de statistiques, des conclusions sont tirées sur où et quelles maladies sont courantes, ce qui est le plus demandé dans une région particulière ou parmi un certain segment de la population. Même la construction des programmes politiques des candidats aux organes gouvernementaux est basée sur des données statistiques. Ils sont également utilisés par les chaînes de distribution lors de l'achat de biens, et les fabricants sont guidés par ces données dans leurs propositions.

Les statistiques jouent un rôle important dans la vie de la société et affectent chacun de ses membres, même dans les petites choses. Par exemple, si selon les statistiques, la plupart des gens préfèrent les couleurs sombres dans les vêtements d'une ville ou d'une région particulière, il sera extrêmement difficile de trouver un imperméable jaune vif avec un imprimé floral dans les points de vente locaux. Mais quelles quantitésces données s'additionnent-elles pour avoir un tel impact ? Par exemple, qu'est-ce qui est « statistiquement significatif » ? Que signifie exactement cette définition ?

Qu'est-ce que c'est ?

La statistique en tant que science est composée d'une combinaison de quantités et de concepts différents. L'un d'eux est le concept de "signification statistique". C'est le nom de la valeur des variables, la probabilité d'apparition d'autres indicateurs dans laquelle est négligeable.

Calcul des indicateurs statistiques
Calcul des indicateurs statistiques

Par exemple, 9 personnes sur 10 enfilent des chaussures en caoutchouc lors d'une promenade matinale à la recherche de champignons dans la forêt d'automne après une nuit pluvieuse. La probabilité qu'à un moment donné 8 d'entre eux chaussent des mocassins en toile est négligeable. Ainsi, dans cet exemple particulier, le nombre 9 est ce qu'on appelle la "signification statistique".

En conséquence, si nous développons davantage l'exemple pratique donné, les magasins de chaussures achètent des bottes en caoutchouc à la fin de la saison estivale en plus grande quantité qu'à d'autres moments de l'année. Ainsi, l'ampleur de la valeur statistique a un impact sur la vie ordinaire.

Bien sûr, dans les calculs complexes, par exemple, lors de la prévision de la propagation des virus, un grand nombre de variables sont prises en compte. Mais l'essence même de la détermination d'un indicateur significatif de données statistiques est similaire, quelle que soit la complexité des calculs et le nombre de valeurs variables.

Comment est-il calculé ?

Utilisé lors du calcul de la valeur de l'indicateur de "significativité statistique" de l'équation. Autrement dit, on peut affirmer que dans ce cas, tout est décidé par les mathématiques. L'option de calcul la plus simple est une chaîne d'opérations mathématiques, dans laquelle les paramètres suivants sont impliqués:

  • deux types de résultats obtenus à partir d'enquêtes ou de l'étude de données objectives, comme le montant des achats, notés a et b;
  • indicateur de taille d'échantillon pour les deux groupes – n;
  • valeur de la part d'échantillon combinée - p;
  • erreur standard - SE.

L'étape suivante consiste à déterminer le score global du test - t, sa valeur est comparée au nombre 1,96. 1,96 est la valeur moyenne, véhiculant une plage de 95 %, selon la fonction de distribution t de Student.

Formule pour un calcul simple
Formule pour un calcul simple

La question se pose souvent de savoir quelle est la différence entre les valeurs de n et p. Cette nuance est facile à clarifier avec un exemple. Disons que la signification statistique de la fidélité à un produit ou à une marque d'hommes et de femmes est calculée.

Dans ce cas, les lettres seront suivies de ce qui suit:

  • n - nombre de répondants;
  • p - nombre de satisfaits du produit.

Le nombre de femmes interrogées dans ce cas sera désigné par n1. En conséquence, les hommes - n2. La même valeur aura les chiffres "1" et "2" du symbole p.

Comparer le résultat du test à la moyenne des feuilles de calcul de l'étudiant devient ce qu'on appelle la "signification statistique".

Qu'entend-on par vérification ?

Les résultats de tout calcul mathématique peuvent toujours être vérifiés, ceci est enseigné aux enfants à l'école primaire. Il est logique de supposerque puisque les statistiques sont déterminées à l'aide de la chaîne de calculs, elles sont vérifiées.

Cependant, tester la signification statistique n'est pas seulement mathématique. La statistique traite d'un grand nombre de variables et de diverses probabilités, qui sont loin d'être toujours calculables. Autrement dit, si nous revenons à l'exemple des chaussures en caoutchouc au début de l'article, la construction logique des données statistiques sur lesquelles les acheteurs de biens pour les magasins s'appuieront peut être perturbée par un temps sec et chaud, ce qui n'est pas typique de l'automne. En raison de ce phénomène, le nombre d'acheteurs de bottes en caoutchouc diminuera et les points de vente subiront des pertes. Bien sûr, une formule mathématique n'est pas capable de prévoir une anomalie météorologique. Ce moment s'appelle "l'erreur".

Outils de visualisation de données statistiques
Outils de visualisation de données statistiques

C'est juste la probabilité de telles erreurs et prend en compte la vérification du niveau de signification calculé. Elle prend en compte à la fois les indicateurs calculés et les seuils de signification acceptés, ainsi que les grandeurs appelées classiquement hypothèses.

Quel est le seuil de signification ?

La notion de « niveau » est incluse dans les principaux critères de signification statistique. Il est utilisé dans les statistiques appliquées et pratiques. Il s'agit d'une sorte de valeur qui prend en compte la probabilité d'éventuelles déviations ou erreurs.

Le niveau est basé sur l'identification des différences dans des échantillons prêts à l'emploi, il vous permet d'établir leur signification ou, au contraire, leur caractère aléatoire. Ce concept a non seulement des significations numériques, mais aussi leurs interprétations particulières. Ils expliquentcomment vous devez comprendre la valeur, et le niveau lui-même est déterminé en comparant le résultat avec l'indice moyen, cela révèle le degré de fiabilité des différences.

Discussion des statistiques
Discussion des statistiques

Ainsi, nous pouvons imaginer simplement le concept de niveau - c'est un indicateur d'une erreur ou d'une erreur acceptable et probable dans les conclusions tirées des données statistiques obtenues.

Quels niveaux de signification sont utilisés ?

La signification statistique des coefficients de probabilité d'erreur dans la pratique est basée sur trois niveaux de base.

Le premier niveau est le seuil auquel la valeur est de 5 %. C'est-à-dire que la probabilité d'erreur ne dépasse pas le seuil de signification de 5 %. Cela signifie que la confiance dans l'impeccabilité et l'infaillibilité des conclusions tirées sur la base des données de la recherche statistique est de 95 %.

Le deuxième niveau est le seuil de 1 %. En conséquence, ce chiffre signifie que l'on peut être guidé par les données obtenues lors des calculs statistiques avec une confiance de 99 %.

Troisième niveau - 0,1 %. Avec cette valeur, la probabilité d'erreur est égale à une fraction de pour cent, c'est-à-dire que les erreurs sont pratiquement éliminées.

Qu'est-ce qu'une hypothèse en statistique ?

Les erreurs en tant que concept sont divisées en deux domaines, concernant l'acceptation ou le rejet de l'hypothèse nulle. Une hypothèse est un concept derrière lequel, selon la définition, se cache un ensemble de résultats d'enquête, d'autres données ou d'énoncés. C'est-à-dire une description de la distribution de probabilité de quelque chose lié au sujet de la comptabilité statistique.

signification statistique de la régression
signification statistique de la régression

Il y a deux hypothèses dans les calculs simples - zéro et alternative. La différence entre eux est que l'hypothèse nulle est basée sur l'idée qu'il n'y a pas de différences fondamentales entre les échantillons impliqués dans la détermination de la signification statistique, et l'hypothèse alternative lui est complètement opposée. Autrement dit, l'hypothèse alternative est basée sur la présence d'une différence significative dans ces échantillons.

Quelles sont les erreurs ?

Les erreurs en tant que concept en statistique sont directement proportionnelles à l'acceptation de telle ou telle hypothèse comme vraie. Ils peuvent être divisés en deux directions ou types:

  • le premier type est dû à l'acceptation de l'hypothèse nulle, qui s'est avérée incorrecte;
  • seconde - causé en suivant l' alternative.
Affichage des graphiques statistiques
Affichage des graphiques statistiques

Le premier type d'erreur est appelé faux positif et est assez courant dans tous les domaines où les statistiques sont utilisées. En conséquence, l'erreur du deuxième type est appelée un faux négatif.

Pourquoi avons-nous besoin de régression dans les statistiques ?

La signification statistique de la régression est qu'avec son aide, il est possible d'établir dans quelle mesure le modèle de diverses dépendances calculé sur la base des données correspond à la réalité; vous permet d'identifier la suffisance ou l'absence de facteurs pour la comptabilisation et les conclusions.

La valeur de régression est déterminée en comparant les résultats avec les données répertoriées dans les tables de Fisher. Ou en utilisant l'analyse de la variance. Les indicateurs de régression sont importants lorsqueétudes et calculs statistiques complexes impliquant un grand nombre de variables, de données aléatoires et de changements probables.

Conseillé: