Introduction
Dans ce laboratoire, vous apprendrez à calculer l'écart type d'un ensemble de données en programmation C. Le laboratoire couvre trois étapes principales : le calcul de la moyenne de l'ensemble de données, la sommation des carrés des écarts par rapport à la moyenne pour calculer la variance, puis la prise de la racine carrée pour obtenir l'écart type. À la fin de ce laboratoire, vous aurez une bonne compréhension de ces concepts statistiques fondamentaux et de leur implémentation en C.
Le laboratoire fournit des instructions étape par étape et des exemples de code pour vous guider tout au long du processus. Vous commencerez par écrire un programme C pour calculer la moyenne d'un ensemble de données donné, puis étendrez le programme pour calculer la variance en sommant les carrés des écarts par rapport à la moyenne. Enfin, vous prendrez la racine carrée de la variance pour déterminer l'écart type et afficherez le résultat.
Calculer la moyenne de l'ensemble de données
Dans cette étape, vous apprendrez à calculer la moyenne d'un ensemble de données en programmation C. La moyenne est une mesure statistique fondamentale qui représente la valeur moyenne d'un ensemble de nombres.
Tout d'abord, créons un programme C pour calculer la moyenne d'un ensemble de données. Ouvrez un nouveau fichier avec nano :
cd ~/project
nano mean_calculation.c
Maintenant, entrez le code suivant :
#include <stdio.h>
#define MAX_SIZE 100
float calculateMean(int arr[], int size) {
float sum = 0;
for (int i = 0; i < size; i++) {
sum += arr[i];
}
return sum / size;
}
int main() {
int dataset[MAX_SIZE];
int size;
printf("Enter the number of elements (max %d): ", MAX_SIZE);
scanf("%d", &size);
printf("Enter %d integers:\n", size);
for (int i = 0; i < size; i++) {
scanf("%d", &dataset[i]);
}
float mean = calculateMean(dataset, size);
printf("Mean of the dataset: %.2f\n", mean);
return 0;
}
Compilez le programme :
gcc mean_calculation.c -o mean_calculation
Exécutez le programme et entrez des données d'exemple :
./mean_calculation
Exemple de sortie :
Enter the number of elements (max 100): 5
Enter 5 integers:
10
20
30
40
50
Mean of the dataset: 30.00
Décortiquons le code :
- Nous définissons une fonction
calculateMeanqui prend un tableau et sa taille en paramètres. - La fonction calcule la somme de tous les éléments du tableau.
- La moyenne est calculée en divisant la somme par le nombre total d'éléments.
- Dans la fonction
main, nous invitons l'utilisateur à entrer l'ensemble de données. - Nous appelons
calculateMeanet affichons le résultat avec deux décimales.
Sommer les carrés des écarts et calculer la variance
Dans cette étape, vous allez étendre le programme précédent pour calculer la variance en sommant les carrés des écarts par rapport à la moyenne. La variance mesure à quel point les nombres sont dispersés dans un ensemble de données.
Ouvrez le fichier précédent pour le modifier :
cd ~/project
nano mean_calculation.c
Mettez à jour le programme avec le calcul de la variance :
#include <stdio.h>
#include <math.h>
#define MAX_SIZE 100
float calculateMean(int arr[], int size) {
float sum = 0;
for (int i = 0; i < size; i++) {
sum += arr[i];
}
return sum / size;
}
float calculateVariance(int arr[], int size, float mean) {
float sumSquaredDeviations = 0;
for (int i = 0; i < size; i++) {
float deviation = arr[i] - mean;
sumSquaredDeviations += deviation * deviation;
}
return sumSquaredDeviations / size;
}
int main() {
int dataset[MAX_SIZE];
int size;
printf("Enter the number of elements (max %d): ", MAX_SIZE);
scanf("%d", &size);
printf("Enter %d integers:\n", size);
for (int i = 0; i < size; i++) {
scanf("%d", &dataset[i]);
}
float mean = calculateMean(dataset, size);
float variance = calculateVariance(dataset, size, mean);
printf("Mean of the dataset: %.2f\n", mean);
printf("Variance of the dataset: %.2f\n", variance);
return 0;
}
Compilez le programme mis à jour :
gcc mean_calculation.c -o mean_calculation -lm
Exécutez le programme et entrez des données d'exemple :
./mean_calculation
Exemple de sortie :
Enter the number of elements (max 100): 5
Enter 5 integers:
10
20
30
40
50
Mean of the dataset: 30.00
Variance of the dataset: 200.00
Points clés du code :
- Nous avons ajouté une nouvelle fonction
calculateVariancequi prend le tableau, la taille et la moyenne. - La fonction calcule l'écart de chaque élément par rapport à la moyenne.
- Elle élève ces écarts au carré et les somme.
- La variance est calculée en divisant la somme des carrés des écarts par le nombre d'éléments.
- Nous utilisons le flag
-lmlors de la compilation pour lier la bibliothèque mathématique.
Prendre la racine carrée pour obtenir l'écart type et afficher le résultat
Dans cette étape finale, vous allez terminer le calcul de l'écart type en prenant la racine carrée de la variance. L'écart type est une mesure clé de la dispersion des données dans l'analyse statistique.
Ouvrez le fichier précédent pour le modifier :
cd ~/project
nano mean_calculation.c
Mettez à jour le programme avec le calcul de l'écart type :
#include <stdio.h>
#include <math.h>
#define MAX_SIZE 100
float calculateMean(int arr[], int size) {
float sum = 0;
for (int i = 0; i < size; i++) {
sum += arr[i];
}
return sum / size;
}
float calculateVariance(int arr[], int size, float mean) {
float sumSquaredDeviations = 0;
for (int i = 0; i < size; i++) {
float deviation = arr[i] - mean;
sumSquaredDeviations += deviation * deviation;
}
return sumSquaredDeviations / size;
}
float calculateStandardDeviation(float variance) {
return sqrt(variance);
}
int main() {
int dataset[MAX_SIZE];
int size;
printf("Enter the number of elements (max %d): ", MAX_SIZE);
scanf("%d", &size);
printf("Enter %d integers:\n", size);
for (int i = 0; i < size; i++) {
scanf("%d", &dataset[i]);
}
float mean = calculateMean(dataset, size);
float variance = calculateVariance(dataset, size, mean);
float standardDeviation = calculateStandardDeviation(variance);
printf("Dataset Statistics:\n");
printf("Mean: %.2f\n", mean);
printf("Variance: %.2f\n", variance);
printf("Standard Deviation: %.2f\n", standardDeviation);
return 0;
}
Compilez le programme mis à jour :
gcc mean_calculation.c -o mean_calculation -lm
Exécutez le programme et entrez des données d'exemple :
./mean_calculation
Exemple de sortie :
Enter the number of elements (max 100): 5
Enter 5 integers:
10
20
30
40
50
Dataset Statistics:
Mean: 30.00
Variance: 200.00
Standard Deviation: 14.14
Points clés du code :
- Nous avons ajouté une nouvelle fonction
calculateStandardDeviation. - Cette fonction utilise
sqrt()de la bibliothèque mathématique pour calculer l'écart type. - L'écart type est la racine carrée de la variance.
- La fonction principale affiche maintenant les trois mesures statistiques.
- Nous continuons à utiliser le flag
-lmpour lier la bibliothèque mathématique.
Résumé
Dans ce laboratoire, vous avez d'abord appris à calculer la moyenne d'un ensemble de données en programmation C. La moyenne est une mesure statistique fondamentale qui représente la valeur moyenne d'un ensemble de nombres. Vous avez ensuite étendu le programme pour calculer la variance en sommant les carrés des écarts par rapport à la moyenne. La variance mesure à quel point les nombres sont dispersés dans un ensemble de données. Enfin, vous avez appris à prendre la racine carrée de la variance pour calculer l'écart type et afficher le résultat.



