Un sujet à  " Abordé" o๠" Abordable " ETABLIR UNE STATISTIQUE! - 17/12/2009

roerfebaybyx
Site Admin
Messages : 0
Inscription : jeu. janv. 01, 1970 1:00 am
Contact :

Un sujet à  " Abordé" o๠" Abordable " ETABLIR UNE STATISTIQUE! - 17/12/2009

Message par roerfebaybyx »

Bonjour !

UN METIER : STATISTICIEN !
L'une des difficultés de la Statistique tient au fait que les notions développées sont multiples.

les notions de "moyenne", "concentration ", "dispersion" représenteront le résultat d'un calcul précis, alors qu'on les utilise tous les jours dans différentes situations qui ne sont pas comparables.
Par exemple, qu'il est tout à fait concevable que :
>dans chaque département français, les employés consomment en moyenne plus de pomme de terre que
les ouvriers.
>en France entière c'est le contraire ; les ouvriers consomment en moyenne plus de pomme de terre que
les employés.
Ou encore que....
>une distribution sera d'autant plus concentrée qu'elle sera dispersée.
Ces résultats apparaissent comme des paradoxes car ils reflètent mal notre expérience quotidienne.
Intégré les définitions précises de ces trois notions, les paradoxes disparaitront sans doute.
Par contre, l'un des avantages de la Statistique turf réside dans le fait que les concepts et les calculs que nous
"absorbons " pourront être appliqués dans une grande partie des conceptions de jeux.
Les statistiques sont, par essence, totalement abstraites :
>Nous devrons donc faire un effort tout particulier pour oublier l'intuition et nous concentrer sur les définitions précises.
Plusieurs étapes pour élaborer un travail statistique.
Pour rester concret, un premier sondage sur la presse hyppique. On y trouve quotidiennement une foule
de résultats statistiques qui permettent d'illustrer les différentes étapes du travail du statisticien.
a) la collecte des données
Bien souvent, on entend par "statistique" le travail de collecte des données.
Dans un journal hyppique, internet et autres sources, on vous présente, pour chaque cheval, par exemple le cheval " 201 Tarakan "favori du quinté du 18-12-2009 à Pau.
— Jugement "littéraire" sur le comportement du cheval dans la course.
— Date de la course : 17 décembre 2009.
— Lieu de la course : Pau.
— Type de la course ( handicap, course à condition, course dite "à réclamer") : Handicap Réf . +9.
— Distance à courir : 3500 mètres.
— Prix au vainqueur : 165 000 francs.
— Etat du terrain (lourd,trés souple, souple, bon, dur et trés dur )
— Nombre de partants : 18
— Sa dernière course :Temps du vainqueur : 4'59''00
— Entraîneur : Jacques Ortet. Gains : 62 400 €
— Propriétaire : Mme Patrick Papot
— Gains : 62 400 €
— Valeur Cheval : 63
— Distances entre les 5 premiers (nez, courte tête, tête, courte encolure, encolure, 1/2, 1, 1 1/2, 2 ou
3 longueurs ) : 1 1/2 (une longueur et demi), 3/4 (3/4 longueur), 1 1/2 (une longueur et demi),
cte tête (courte tête), tête.
— Place du cheval dans la course : 2 ème
— Poids porté par le cheval dans la course : 67 kg
— Nom du jockey : C. Pieux
— "Cote" du cheval (rapport entre les sommes misées sur les autres chevaux de la course et les
sommes misées sur ce cheval):3.4/1
— Valeur du Cheval : 60
— Sa carrière de courses :
— Carrière Courues : 11
— Victoires : 5
— Places : 3
— Les dernières performances (1-5-10-50-100 et plus...)
— Information des dernières performances : Date-Hippodrome -Distance- Par - Corde Droite/Gauche -Spécialité Haies/Steeple-Cross-Terrain (lourd/Tsouple)-Valeur Course Q+ - Allocation - Son Rang (résultat) Valeur Cheval -Oeillères et autres.
—
Dans la mesure où tous les individus de la population (ici les chevaux de la course) sont étudiés selon les mêmes critères, on dit que l'on a procédé à un recensement.
A ce stade, aucune analyse n'est proposée.....
On n'hésitera pas sur les termes proposés (formulation):
>l'ensemble des chevaux qui participent à la course constitue la population étudiée .
>Un cheval particulier est un individu de la population étudiée.
> Ensuite, il est possible de trouver un tableau donnant l'avis de différents journalistes "Pronostiqueurs", Responsables d'une chronique hyppique, comme, par exemple :
3262 Confidences Pros 6 1 10 16 4 2 7 3
3615 Turf 7 3 10 2 1 4 6 5
Agence TIP 1 3 2 10 8 6 5 4
Beur FM 3 5 8 4 2 10 1 13
Bilto 1 2 3 5 10 8 6 9
Dernières Nouvelles d'Alsace 1 10 14 4 3 7 15 8
France-Soir 3 10 1 2 6 15 5 11
L'Indépendant 11 1 14 3 6 10 8 7
La Gazette des Courses 2 1 10 8 11 6 15 5
La Voix du Nord 3 2 1 4 10 11 14 7
Le Dauphiné Libéré 10 2 3 1 9 4 6 14
Le Favori 2 8 1 7 11 5 10 4
Le Parisien 1 6 2 8 10 3 7 14
Le Progrès de Lyon 1 3 2 10 5 4 8 6
Le Républicain Lorrain 3 1 2 5 10 6 11 4
Le Télégramme de Brest 2 1 8 5 11 4 10 7
Les 7 de Week-End 3 10 6 1 4 7 2 5
Matin Courses 1 2 8 6 10 5 11 3
Midi-Libre 7 8 1 2 10 3 4 15
Nice Matin 4 3 1 2 10 11 14 7
Nouvelle République du C.-O. 3 10 7 6 1 4 2 8
Ouest-France 3 1 2 8 6 7 10 4
Paris Courses 1 2 6 3 10 8 11 12
Radio Haute Angevine 6 4 2 11 1 3 10 8
Radios-net.com 2 1 7 10 3 5 8 14
Sport Complet 2 3 10 4 14 1 6 9
TIP sur les pistes 1 3 11 7 10 4 5 6
Tiercé Magazine 1 3 7 2 4 6 10 8
Tropiques FM 2 8 1 14 13 7 9 5
Turf-Dernière 2 3 1 10 6 7 14 4
Week-End 3 2 10 1 7 4 5 6
[url]http://www.paris-turf.com[/url] 10 1 3 6 8 5 4 2

SYNTHESE ORIGINALE

1 Tarakan 216
2 Unidentified Thief 180
3 Nouveau Roi 179
10 Titan War 123
6 Red Matrix 71
8 Ratio Spécial 67
7 Rhode Island 59
4 Radja de Brion 54
5 Blue Road 34
11 Duc du Fray 32
14 Sir Alex 24
9 Rose Line 5
15 Pythagore 4
16 Bint Elamal 4
13 Maître Auguste 3
12 Le Grillon 1


ABANDONNES

17 Mon Mirage 0
18 Risotto de Sèvres 0



LISTE TYPE

1 Tarakan 32
10 Titan War 31
2 Unidentified Thief 29
3 Nouveau Roi 28
4 Radja de Brion 23
6 Red Matrix 23
8 Ratio Spécial 20
7 Rhode Island 19
5 Blue Road 17
11 Duc du Fray 12
14 Sir Alex 10
9 Rose Line 4
15 Pythagore 4
13 Maître Auguste 2
12 Le Grillon 1
16 Bint Elamal 1

Un tel tableau ne prétend pas à l'éxhaustivité, il donne simplement l'avis d'un certain nombre de personnalités
supposées être "bien informées"......
Dans ce tableau, la population étudiée est un sous ensemble des pronostiqueurs : pour chaque individu
pronostiqueur, on note le numéro du cheval qui sera vainqueur de la course aux dires de ce dernier. On
n'a pas interrogé l'ensemble des pronostiqueurs : peut être en raison du coût d'une telle opération, (coût
d'intérogation, coût de publication ).
Vous Noterez que sont exclus de ce tableau les acteurs professionnels :
> Entraineurs, Jockeys, Propriétaires.
> En tous les cas la question reste posée de savoir en quoi ce tableau nous donne une idée de l'avis des "personnes bien informées".
Contrairement au cas précédent du recensement, ce second tableau nous donne les informations d'un échantilllon de pronostiqueurs : on dit que ce tableau représente les résultats d'un sondage.
Rapidité et moindre coût sont les avantages du sondage, son inconvénient majeur est celui du défaut de précision. Si l'échantillon est choisi "n'importe comment", il n'y a aucune raison pour que les résultats de l'étude aient quelque chose à voir de près ou de loin avec celui d'un recensement. Un cours de théorie des sondages propose que les individus constituant l'échantillon soient choisi au hasard dans la population étudiée. Le calcul montre que les résultats calculés sur l'échantillon ont "peu de chances" de s'éloigner des résultats que donneraient un recensement exhaustif et que plus la taille de l'échantillon (en nombre de personnes interrogées ) est important, plus les résultats observés sont proches de ceux donnés par un recensement.
Pour fixer les idées, il faut retenir que si (n) est la taille de l'échantillon, la précision est de l'odre de √n. Par exemple entre un échantillon de 1000 personnes et un échantillon de 4000 personnes, la précision varie de quelque chose de l'ordre de √1000 à quelque chose de l'ordre de √4000 . En multipliant la taille de l'échantillon par 4 (et donc vraisemblablement les coûts par 4), on a multiplié la précision par √4 = 2.
Pour la petite histoire, et pour préciser un peu le vocabulaire employé, considérons un sondage dont le
but est d'apporter des renseignements sur le comportement des chasseurs. Les contraintes qui portent sur ce
sondage sont : (1) Compte tenu du coût de l'enquête, un échantillon de 800 personnes doit être interrogé; (2)
Parité oblige, l'enquête doit permettre entre autres choses de mieux connaitre le comportement des femmes
qui chassent; (3) à partir de statistiques sur les personnes possédant un permis de chasse, on établit que
la proportion de femmes parmi les chasseurs est de 0.1 ( c'est à dire que les femmes représentent 10% de
l'ensemble des personnes possédant un permis de chasse).
>Si on dispose du fichier national des chasseurs, on choisit les persones interrogées au hasard dans ce fichier, (chacune a la même probabilité d'être choisie), on dit que l'on a constitué un sondage représentatif. Dans cet échantillon, les catégories de chasseurs sont représentées proportionnellement à leur poids dans l'ensemble des chasseurs : il y aura dans l'échantillon environ 80 femmes.
Pour mieux prendre en compte les femmes, on désire augmenter leur présence dans l'échantillon. On décide alors d'interroger 300 femmes et 500 hommes. L'échantillon est toujours tiré au hasard dans le fichier des personnes possédant un permis de chasse, mais il n'est pas représentatif, dans la mesure où ce que l'on observera dans l'échantillon n'est pas une réduction de la population étudiée : la proportion de femmes dans l'échantillon est de 300
800 = 0.375 alors qu'elle n'est que de 0.100 dans la population. On dit alors que l'on a fait un sondage raisonné.
> Si on ne dispose pas d'une liste de chasseurs, la tentation est de se promener dans les rues, ou de frapper à des portes au hasard : "bonjour, vous êtes chasseur ?". Le problème est que même si on arrive à trouver 800 chasseurs par ce moyen, il est clair que les personnes que l'on va interroger auront des caractéristiques particulières par exemple ce seront en majorité des personnes présentes à leur domicile entre 9 heures et 12 heures le mercredi matin.
Pour pallier à cet inconvénient, l'échantillon devra respecter une certaine composition qui fera que, du moins sur certains aspects, il sera représentatif de la population étudiée. Pratiquement, on calculera des proportions dans la population à partir du fichier des permis de chasse :
>Types de personnes : >Proportion dans la population:
- P/Hommes = 0.9
- P/femmes = 0.1
_ Total 1.0
>Types de personnes : >Proportion dans la population:
- P/Agriculteurs = 0.4
- P/Ouvriers = 0.3
- P/Autres = 0.3
_ Total 1.0
>Types de personnes : >Proportion dans la population:
- P/Moins de 35 ans = 0.2
- P/De 35 à moins de 45 ans = 0.3
- P/45 ans et plus = 0.5
_ Total 1.0

Il faudra exiger que l'échantillon respecte ces proportions, c'est à dire qu'il devra contenir 10% de femmes,40% d'agriculteurs, etc ... c'est ce qu'on appelle faire un sondage par quotas. Sur la place en bas de chez moi, et de façon très régulière, un troupe d'étudiants interroge les passants sur ce qu'ils ont retenu des publicités affichées dans le métro : première phrase d'accroche " Bonjour, vous voulez bien répondre à une enquête ?" : Ils disent cela car ils sont polis. Seconde phrase " Avez vous entre 34 et 42 ans, un enfant en bas age et une grand mère à la maison ? " Cette phrase, c'est pour vérifier que vous "rentrez dans le quota".
b) Les tableaux individus-variables
En fait, dans la phase de recueil des données, le statisticien ne fait bien souvent que relever sur des individus les modalités prises par un certain nombre de variables. Par exemple :
> Dans le cas des pronostiqueurs, on relève une première variable qui est le nom du cheval désigné comme vainqueur de la course par ce pronostiqueur, une seconde variable qui est le nom du cheval cité comme probable second dans la course, ..., une huitième variable qui est le numéro du cheval cité comme probable huitième par ce pronostiqueur.
Ces variables sont toutes qualitatives dans le sens où les différentes modalités sont des numéros ou des noms de chevaux et non pas des nombres que l'on peut ajouter, soustraire, etc...
> Dans le cas du passé des chevaux, le prix de la dernière course ou la distance à parcourir lors de la dernière course sont des variables quantitatives : on peut les ajouter, les multiplier par un m^me nombre, les mettere sur une èchelle de nombres.
> La date de la dernière course est une variable intermédiaire entre le qualitatif et le quantitatif :
cette variable peut être prise comme qualitative dans la mesure où elle repère la saison où a eu lieu cette course, les chevaux étant plus ou moins nerveux selon la saison ; mais elle peut être aussi prise comme quantitative, dans la mesure où elle permet de repérer depuis combien de temps ce cheval n'a pas couru, par exemple.
Le tableau suivant donne les indications sur la nature des variables relevées sur le fichier des dernières
courses :
Jugement "littéraire" sur le comportement du cheval dans la course = QUALITATIF
Date de la course = QUANTITATIF ou QUALITATIF
Lieu de la course = QUALITATIF
Type de la course ( handicap, course à condition, course dite "à réclamer") = QUALITATIF
Distance à courrir = QUANTITATIF
Prix au vainqueur = QUANTITATIF
Etat du terrain (lourd,trés souple, souple, bon, duret trés dur etc) = QUALITATIF
Nombre de partants = QUANTITATIF
Temps du vainqueur = QUANTITATIF
Distances enntre les 5 premiers (nez, courtetête, tête, courte encolure, encolure, 1, 2 ou 3longueurs ) QUALITATIF
Place du cheval dans la course = QUALITATIF & QUALITATIF
Poids supporté par le cheval dans la course = QUANTITATIF
"Cote" du cheval ou rapport entre les sommes misées sur les autres chevaux de la course et les sommes misées sur ce cheval = QUANTITATIF
Ces observations de variables aussi bien qualitatives que quantitatives peuvent toujours se résumer par un tableau:
> chaque ligne est atribuée à un individu
> chaque colonne est attribuée à une variable.
On dit qu'un tel tableau est un tableau individus * variables sur le passé de la course, on obtiendra une composante suivante:
NUMERO DU CHEVAL-DATE-LIEU-TYPE-DISTANCE-TERRAIN-NOMBRE DE PARTANTS-VAINQUEUR-DISTANCE 1er/2ème-PLACE-POIDS-COTE DEPART/COTE FINALE.

Pour ce qui est des pronostiqueurs, nous ne sommes pas intéressés à savoir quel cheval est annoncé en tête ou en huitième position par quel pronostiqueur, mains plutôt de savoir :
> Pour chaque cheval, combien de pronostiqueurs l'ont cité : on obtient alors ce que l'on appelle la "liste type "qui s'exprime sous la forme d'un tableau individu * variable :
> Pour chaque cheval son "score" obtenu, selon une formule proposée par le quotidien Paris Turf, qui accorde 10 points pour une place de premier, 8 points pour une place de deuxième, 6 points pour une troisième, 4 points pour une quatrième, 2 points pour une cinquième et 1 point pour un cheval cité en sixième, septième ou huitième position.
On obtient alors deux nouvelles variables sur la population des chevaux participant à la course :
NUMERO DU CHEVAL-LISTE TYPE-SCORE.
que faire avec les données ?
Une fois récoltées les données, il faut maintenant les traiter : c'est un autre aspect du métier. En gros, on attend du statisticien qu'il montre :
> En quoi les individus de la population étudiée sont semblables
> En quoi les individus de la population étudiée sont différents
Par exemple, considèrons les 1500 enfants du collège Bergson dont on connait le poids, la taille et le sexe.
On pourrait se demander
> En quoi ces enfants sont ils semblables : si on veut prévoir des chaises et des bureaux "ergonomiques",
sur quelle "taille de poste de travail" doit on faire la majorité des achats de bureaux ?
> En quoi ces enfants sont ils différents : combien de postes de travail doit-on prévoir pour les "petits
gabarits" et et les "grands gabarits"
Mais on attend aussi du statisticien qu'il puisse montrer :
> En quoi les variables étudiées sont elles semblables : les enfants qui pèsent plus que les autres sont ils
simplement plus grands que les autres ? Autrement dit, le poids et la taille sont-ils simplement des
reflets d'une même caractéristique qui serait la corpulence ?
> En quoi les variables peuvent-elles se déduire simplement les unes des autres ? Par exemple si on calcule
pour chaque individu le rapport du poids au carré de la taille ( poids (taille)2 ) obtient-on un bon indicateur
du taux de cholestérol dans le sang ?
Dans ce travail, l'individu s'efface : on calculera par exemple la taille moyenne des enfants, la proportion
des enfants dont la taille est inférieure de 10 cm à la moyenne, ce qui nous donnera la proportion des "petits
gabarits" et la proportion des enfants dont la taille est supérieure de 10 cm à la moyenne, ce qui nous
donnera la proportion des "grands gabarits". Que nous importe si c'est Albert ou Sophie qui est le plus
grand, Antoine ou Robert le plus petit ?
La réponse à ces différentes questions passe par des calculs et des dessins. Les calculs apportent des
réponses brutales (exactes ?) Les dessins permettent d'exprimer des nuances. Les deux techniques sont
utiles.
Les outils fournis par la statistique :
Décrire la distribution d'une variable dans une population, c'est indiquer que différents individus sont associés à différentes modalités. D'où la question : pourquoi différentes modalités ?
Par exemple, dans une course de chevaux "à handicap", on constate que les chevaux ne portent pas rous le même poids : Pourquoi ?
Parce qu'une personne, le commissaire de course, a décidé que "pour égaliser les chances", il fallait ralentir certains chevaux, et donc leur mettre plus de poids sur le dos. Evidemment, on ne peut pas penser qu'une personne, fut-elle un commissaire de course, sache apprécier les valeurs relatives de chacun des 10 000 chevaux qui participent à des courses sur une année en France. Pour calculer le poids que doit porter un cheval, il le fait au vu d'une caractéristique publique "la valeur handicap" du cheval.
On a donc ici une explication du fait constaté : les chevaux ne portent pas le même poids, car ils n'ont pas la même valeur-handicap. Il s'agit là d'un indice de performance attaché à chaque cheval et calculé ou plutôt décidée au vu des performances passées ( la règle étant que si un cheval s'est bien comporté dans une course, sa valeur-handicap augmente, s'il s'est mal comporté, il n'est pas clair qu'elle doive baisser : on se méfie toujours d'une contre-performance qui serait plus décidée par l'entourage du cheval que subie par les
conditions de courses ) .
Ceci étant, on ordonne les chevaux par valeur-handicap croissante : celui du milieu portera, disons 49 kilo, pour les autres, un écart d'un point de valeur-handicap par rapport au cheval de référence, vaudra un kilo, en plus ou en moins.
On a donc ici l'embryon d'un modèle :
> D''une part une constatation, les poids sont différents d'un cheval à l'autre
> D''autre part une explication : la valeur-handicap
> Enfin, une méthode de calcul qui permet de passer de la dernière variable à la première :

Un statisticien dirait qu'il a "expliqué la variable poids porté par le cheval" par la variable "valeur handicap"
Osteoffliessy
Site Admin
Messages : 0
Inscription : jeu. janv. 01, 1970 1:00 am
Contact :

Un sujet à  " Abordé" o๠" Abordable " ETABLIR UNE STATISTIQUE! - 17/12/2009

Message par Osteoffliessy »

[quote=Claude95]Bonjour !

UN METIER : STATISTICIEN !
L'une des difficultés de la Statistique tient au fait que les notions développées sont multiples.

les notions de "moyenne", "concentration ", "dispersion" représenteront le résultat d'un calcul précis, alors qu'on les utilise tous les jours dans différentes situations qui ne sont pas comparables.
Par exemple, qu'il est tout à fait concevable que :
>dans chaque département français, les employés consomment en moyenne plus de pomme de terre que
les ouvriers.
>en France entière c'est le contraire ; les ouvriers consomment en moyenne plus de pomme de terre que
les employés.
Ou encore que....
>une distribution sera d'autant plus concentrée qu'elle sera dispersée.
Ces résultats apparaissent comme des paradoxes car ils reflètent mal notre expérience quotidienne.
Intégré les définitions précises de ces trois notions, les paradoxes disparaitront sans doute.
Par contre, l'un des avantages de la Statistique turf réside dans le fait que les concepts et les calculs que nous
"absorbons " pourront être appliqués dans une grande partie des conceptions de jeux.
Les statistiques sont, par essence, totalement abstraites :
>Nous devrons donc faire un effort tout particulier pour oublier l'intuition et nous concentrer sur les définitions précises.
Plusieurs étapes pour élaborer un travail statistique.
Pour rester concret, un premier sondage sur la presse hyppique. On y trouve quotidiennement une foule
de résultats statistiques qui permettent d'illustrer les différentes étapes du travail du statisticien.
a) la collecte des données
Bien souvent, on entend par "statistique" le travail de collecte des données.
Dans un journal hyppique, internet et autres sources, on vous présente, pour chaque cheval, par exemple le cheval " 201 Tarakan "favori du quinté du 18-12-2009 à Pau.
— Jugement "littéraire" sur le comportement du cheval dans la course.
— Date de la course : 17 décembre 2009.
— Lieu de la course : Pau.
— Type de la course ( handicap, course à condition, course dite "à réclamer") : Handicap Réf . +9.
— Distance à courir : 3500 mètres.
— Prix au vainqueur : 165 000 francs.
— Etat du terrain (lourd,trés souple, souple, bon, dur et trés dur )
— Nombre de partants : 18
— Sa dernière course :Temps du vainqueur : 4'59''00
— Entraîneur : Jacques Ortet. Gains : 62 400 €
— Propriétaire : Mme Patrick Papot
— Gains : 62 400 €
— Valeur Cheval : 63
— Distances entre les 5 premiers (nez, courte tête, tête, courte encolure, encolure, 1/2, 1, 1 1/2, 2 ou
3 longueurs ) : 1 1/2 (une longueur et demi), 3/4 (3/4 longueur), 1 1/2 (une longueur et demi),
cte tête (courte tête), tête.
— Place du cheval dans la course : 2 ème
— Poids porté par le cheval dans la course : 67 kg
— Nom du jockey : C. Pieux
— "Cote" du cheval (rapport entre les sommes misées sur les autres chevaux de la course et les
sommes misées sur ce cheval):3.4/1
— Valeur du Cheval : 60
— Sa carrière de courses :
— Carrière Courues : 11
— Victoires : 5
— Places : 3
— Les dernières performances (1-5-10-50-100 et plus...)
— Information des dernières performances : Date-Hippodrome -Distance- Par - Corde Droite/Gauche -Spécialité Haies/Steeple-Cross-Terrain (lourd/Tsouple)-Valeur Course Q+ - Allocation - Son Rang (résultat) Valeur Cheval -Oeillères et autres.
—
Dans la mesure où tous les individus de la population (ici les chevaux de la course) sont étudiés selon les mêmes critères, on dit que l'on a procédé à un recensement.
A ce stade, aucune analyse n'est proposée.....
On n'hésitera pas sur les termes proposés (formulation):
>l'ensemble des chevaux qui participent à la course constitue la population étudiée .
>Un cheval particulier est un individu de la population étudiée.
> Ensuite, il est possible de trouver un tableau donnant l'avis de différents journalistes "Pronostiqueurs", Responsables d'une chronique hyppique, comme, par exemple :
3262 Confidences Pros 6 1 10 16 4 2 7 3
3615 Turf 7 3 10 2 1 4 6 5
Agence TIP 1 3 2 10 8 6 5 4
Beur FM 3 5 8 4 2 10 1 13
Bilto 1 2 3 5 10 8 6 9
Dernières Nouvelles d'Alsace 1 10 14 4 3 7 15 8
France-Soir 3 10 1 2 6 15 5 11
L'Indépendant 11 1 14 3 6 10 8 7
La Gazette des Courses 2 1 10 8 11 6 15 5
La Voix du Nord 3 2 1 4 10 11 14 7
Le Dauphiné Libéré 10 2 3 1 9 4 6 14
Le Favori 2 8 1 7 11 5 10 4
Le Parisien 1 6 2 8 10 3 7 14
Le Progrès de Lyon 1 3 2 10 5 4 8 6
Le Républicain Lorrain 3 1 2 5 10 6 11 4
Le Télégramme de Brest 2 1 8 5 11 4 10 7
Les 7 de Week-End 3 10 6 1 4 7 2 5
Matin Courses 1 2 8 6 10 5 11 3
Midi-Libre 7 8 1 2 10 3 4 15
Nice Matin 4 3 1 2 10 11 14 7
Nouvelle République du C.-O. 3 10 7 6 1 4 2 8
Ouest-France 3 1 2 8 6 7 10 4
Paris Courses 1 2 6 3 10 8 11 12
Radio Haute Angevine 6 4 2 11 1 3 10 8
Radios-net.com 2 1 7 10 3 5 8 14
Sport Complet 2 3 10 4 14 1 6 9
TIP sur les pistes 1 3 11 7 10 4 5 6
Tiercé Magazine 1 3 7 2 4 6 10 8
Tropiques FM 2 8 1 14 13 7 9 5
Turf-Dernière 2 3 1 10 6 7 14 4
Week-End 3 2 10 1 7 4 5 6
[url]http://www.paris-turf.com[/url] 10 1 3 6 8 5 4 2

SYNTHESE ORIGINALE

1 Tarakan 216
2 Unidentified Thief 180
3 Nouveau Roi 179
10 Titan War 123
6 Red Matrix 71
8 Ratio Spécial 67
7 Rhode Island 59
4 Radja de Brion 54
5 Blue Road 34
11 Duc du Fray 32
14 Sir Alex 24
9 Rose Line 5
15 Pythagore 4
16 Bint Elamal 4
13 Maître Auguste 3
12 Le Grillon 1


ABANDONNES

17 Mon Mirage 0
18 Risotto de Sèvres 0



LISTE TYPE

1 Tarakan 32
10 Titan War 31
2 Unidentified Thief 29
3 Nouveau Roi 28
4 Radja de Brion 23
6 Red Matrix 23
8 Ratio Spécial 20
7 Rhode Island 19
5 Blue Road 17
11 Duc du Fray 12
14 Sir Alex 10
9 Rose Line 4
15 Pythagore 4
13 Maître Auguste 2
12 Le Grillon 1
16 Bint Elamal 1

Un tel tableau ne prétend pas à l'éxhaustivité, il donne simplement l'avis d'un certain nombre de personnalités
supposées être "bien informées"......
Dans ce tableau, la population étudiée est un sous ensemble des pronostiqueurs : pour chaque individu
pronostiqueur, on note le numéro du cheval qui sera vainqueur de la course aux dires de ce dernier. On
n'a pas interrogé l'ensemble des pronostiqueurs : peut être en raison du coût d'une telle opération, (coût
d'intérogation, coût de publication ).
Vous Noterez que sont exclus de ce tableau les acteurs professionnels :
> Entraineurs, Jockeys, Propriétaires.
> En tous les cas la question reste posée de savoir en quoi ce tableau nous donne une idée de l'avis des "personnes bien informées".
Contrairement au cas précédent du recensement, ce second tableau nous donne les informations d'un échantilllon de pronostiqueurs : on dit que ce tableau représente les résultats d'un sondage.
Rapidité et moindre coût sont les avantages du sondage, son inconvénient majeur est celui du défaut de précision. Si l'échantillon est choisi "n'importe comment", il n'y a aucune raison pour que les résultats de l'étude aient quelque chose à voir de près ou de loin avec celui d'un recensement. Un cours de théorie des sondages propose que les individus constituant l'échantillon soient choisi au hasard dans la population étudiée. Le calcul montre que les résultats calculés sur l'échantillon ont "peu de chances" de s'éloigner des résultats que donneraient un recensement exhaustif et que plus la taille de l'échantillon (en nombre de personnes interrogées ) est important, plus les résultats observés sont proches de ceux donnés par un recensement.
Pour fixer les idées, il faut retenir que si (n) est la taille de l'échantillon, la précision est de l'odre de √n. Par exemple entre un échantillon de 1000 personnes et un échantillon de 4000 personnes, la précision varie de quelque chose de l'ordre de √1000 à quelque chose de l'ordre de √4000 . En multipliant la taille de l'échantillon par 4 (et donc vraisemblablement les coûts par 4), on a multiplié la précision par √4 = 2.
Pour la petite histoire, et pour préciser un peu le vocabulaire employé, considérons un sondage dont le
but est d'apporter des renseignements sur le comportement des chasseurs. Les contraintes qui portent sur ce
sondage sont : (1) Compte tenu du coût de l'enquête, un échantillon de 800 personnes doit être interrogé; (2)
Parité oblige, l'enquête doit permettre entre autres choses de mieux connaitre le comportement des femmes
qui chassent; (3) à partir de statistiques sur les personnes possédant un permis de chasse, on établit que
la proportion de femmes parmi les chasseurs est de 0.1 ( c'est à dire que les femmes représentent 10% de
l'ensemble des personnes possédant un permis de chasse).
>Si on dispose du fichier national des chasseurs, on choisit les persones interrogées au hasard dans ce fichier, (chacune a la même probabilité d'être choisie), on dit que l'on a constitué un sondage représentatif. Dans cet échantillon, les catégories de chasseurs sont représentées proportionnellement à leur poids dans l'ensemble des chasseurs : il y aura dans l'échantillon environ 80 femmes.
Pour mieux prendre en compte les femmes, on désire augmenter leur présence dans l'échantillon. On décide alors d'interroger 300 femmes et 500 hommes. L'échantillon est toujours tiré au hasard dans le fichier des personnes possédant un permis de chasse, mais il n'est pas représentatif, dans la mesure où ce que l'on observera dans l'échantillon n'est pas une réduction de la population étudiée : la proportion de femmes dans l'échantillon est de 300
800 = 0.375 alors qu'elle n'est que de 0.100 dans la population. On dit alors que l'on a fait un sondage raisonné.
> Si on ne dispose pas d'une liste de chasseurs, la tentation est de se promener dans les rues, ou de frapper à des portes au hasard : "bonjour, vous êtes chasseur ?". Le problème est que même si on arrive à trouver 800 chasseurs par ce moyen, il est clair que les personnes que l'on va interroger auront des caractéristiques particulières par exemple ce seront en majorité des personnes présentes à leur domicile entre 9 heures et 12 heures le mercredi matin.
Pour pallier à cet inconvénient, l'échantillon devra respecter une certaine composition qui fera que, du moins sur certains aspects, il sera représentatif de la population étudiée. Pratiquement, on calculera des proportions dans la population à partir du fichier des permis de chasse :
>Types de personnes : >Proportion dans la population:
- P/Hommes = 0.9
- P/femmes = 0.1
_ Total 1.0
>Types de personnes : >Proportion dans la population:
- P/Agriculteurs = 0.4
- P/Ouvriers = 0.3
- P/Autres = 0.3
_ Total 1.0
>Types de personnes : >Proportion dans la population:
- P/Moins de 35 ans = 0.2
- P/De 35 à moins de 45 ans = 0.3
- P/45 ans et plus = 0.5
_ Total 1.0

Il faudra exiger que l'échantillon respecte ces proportions, c'est à dire qu'il devra contenir 10% de femmes,40% d'agriculteurs, etc ... c'est ce qu'on appelle faire un sondage par quotas. Sur la place en bas de chez moi, et de façon très régulière, un troupe d'étudiants interroge les passants sur ce qu'ils ont retenu des publicités affichées dans le métro : première phrase d'accroche " Bonjour, vous voulez bien répondre à une enquête ?" : Ils disent cela car ils sont polis. Seconde phrase " Avez vous entre 34 et 42 ans, un enfant en bas age et une grand mère à la maison ? " Cette phrase, c'est pour vérifier que vous "rentrez dans le quota".
b) Les tableaux individus-variables
En fait, dans la phase de recueil des données, le statisticien ne fait bien souvent que relever sur des individus les modalités prises par un certain nombre de variables. Par exemple :
> Dans le cas des pronostiqueurs, on relève une première variable qui est le nom du cheval désigné comme vainqueur de la course par ce pronostiqueur, une seconde variable qui est le nom du cheval cité comme probable second dans la course, ..., une huitième variable qui est le numéro du cheval cité comme probable huitième par ce pronostiqueur.
Ces variables sont toutes qualitatives dans le sens où les différentes modalités sont des numéros ou des noms de chevaux et non pas des nombres que l'on peut ajouter, soustraire, etc...
> Dans le cas du passé des chevaux, le prix de la dernière course ou la distance à parcourir lors de la dernière course sont des variables quantitatives : on peut les ajouter, les multiplier par un m^me nombre, les mettere sur une èchelle de nombres.
> La date de la dernière course est une variable intermédiaire entre le qualitatif et le quantitatif :
cette variable peut être prise comme qualitative dans la mesure où elle repère la saison où a eu lieu cette course, les chevaux étant plus ou moins nerveux selon la saison ; mais elle peut être aussi prise comme quantitative, dans la mesure où elle permet de repérer depuis combien de temps ce cheval n'a pas couru, par exemple.
Le tableau suivant donne les indications sur la nature des variables relevées sur le fichier des dernières
courses :
Jugement "littéraire" sur le comportement du cheval dans la course = QUALITATIF
Date de la course = QUANTITATIF ou QUALITATIF
Lieu de la course = QUALITATIF
Type de la course ( handicap, course à condition, course dite "à réclamer") = QUALITATIF
Distance à courrir = QUANTITATIF
Prix au vainqueur = QUANTITATIF
Etat du terrain (lourd,trés souple, souple, bon, duret trés dur etc) = QUALITATIF
Nombre de partants = QUANTITATIF
Temps du vainqueur = QUANTITATIF
Distances enntre les 5 premiers (nez, courtetête, tête, courte encolure, encolure, 1, 2 ou 3longueurs ) QUALITATIF
Place du cheval dans la course = QUALITATIF & QUALITATIF
Poids supporté par le cheval dans la course = QUANTITATIF
"Cote" du cheval ou rapport entre les sommes misées sur les autres chevaux de la course et les sommes misées sur ce cheval = QUANTITATIF
Ces observations de variables aussi bien qualitatives que quantitatives peuvent toujours se résumer par un tableau:
> chaque ligne est atribuée à un individu
> chaque colonne est attribuée à une variable.
On dit qu'un tel tableau est un tableau individus * variables sur le passé de la course, on obtiendra une composante suivante:
NUMERO DU CHEVAL-DATE-LIEU-TYPE-DISTANCE-TERRAIN-NOMBRE DE PARTANTS-VAINQUEUR-DISTANCE 1er/2ème-PLACE-POIDS-COTE DEPART/COTE FINALE.

Pour ce qui est des pronostiqueurs, nous ne sommes pas intéressés à savoir quel cheval est annoncé en tête ou en huitième position par quel pronostiqueur, mains plutôt de savoir :
> Pour chaque cheval, combien de pronostiqueurs l'ont cité : on obtient alors ce que l'on appelle la "liste type "qui s'exprime sous la forme d'un tableau individu * variable :
> Pour chaque cheval son "score" obtenu, selon une formule proposée par le quotidien Paris Turf, qui accorde 10 points pour une place de premier, 8 points pour une place de deuxième, 6 points pour une troisième, 4 points pour une quatrième, 2 points pour une cinquième et 1 point pour un cheval cité en sixième, septième ou huitième position.
On obtient alors deux nouvelles variables sur la population des chevaux participant à la course :
NUMERO DU CHEVAL-LISTE TYPE-SCORE.
que faire avec les données ?
Une fois récoltées les données, il faut maintenant les traiter : c'est un autre aspect du métier. En gros, on attend du statisticien qu'il montre :
> En quoi les individus de la population étudiée sont semblables
> En quoi les individus de la population étudiée sont différents
Par exemple, considèrons les 1500 enfants du collège Bergson dont on connait le poids, la taille et le sexe.
On pourrait se demander
> En quoi ces enfants sont ils semblables : si on veut prévoir des chaises et des bureaux "ergonomiques",
sur quelle "taille de poste de travail" doit on faire la majorité des achats de bureaux ?
> En quoi ces enfants sont ils différents : combien de postes de travail doit-on prévoir pour les "petits
gabarits" et et les "grands gabarits"
Mais on attend aussi du statisticien qu'il puisse montrer :
> En quoi les variables étudiées sont elles semblables : les enfants qui pèsent plus que les autres sont ils
simplement plus grands que les autres ? Autrement dit, le poids et la taille sont-ils simplement des
reflets d'une même caractéristique qui serait la corpulence ?
> En quoi les variables peuvent-elles se déduire simplement les unes des autres ? Par exemple si on calcule
pour chaque individu le rapport du poids au carré de la taille ( poids (taille)2 ) obtient-on un bon indicateur
du taux de cholestérol dans le sang ?
Dans ce travail, l'individu s'efface : on calculera par exemple la taille moyenne des enfants, la proportion
des enfants dont la taille est inférieure de 10 cm à la moyenne, ce qui nous donnera la proportion des "petits
gabarits" et la proportion des enfants dont la taille est supérieure de 10 cm à la moyenne, ce qui nous
donnera la proportion des "grands gabarits". Que nous importe si c'est Albert ou Sophie qui est le plus
grand, Antoine ou Robert le plus petit ?
La réponse à ces différentes questions passe par des calculs et des dessins. Les calculs apportent des
réponses brutales (exactes ?) Les dessins permettent d'exprimer des nuances. Les deux techniques sont
utiles.
Les outils fournis par la statistique :
Décrire la distribution d'une variable dans une population, c'est indiquer que différents individus sont associés à différentes modalités. D'où la question : pourquoi différentes modalités ?
Par exemple, dans une course de chevaux "à handicap", on constate que les chevaux ne portent pas rous le même poids : Pourquoi ?
Parce qu'une personne, le commissaire de course, a décidé que "pour égaliser les chances", il fallait ralentir certains chevaux, et donc leur mettre plus de poids sur le dos. Evidemment, on ne peut pas penser qu'une personne, fut-elle un commissaire de course, sache apprécier les valeurs relatives de chacun des 10 000 chevaux qui participent à des courses sur une année en France. Pour calculer le poids que doit porter un cheval, il le fait au vu d'une caractéristique publique "la valeur handicap" du cheval.
On a donc ici une explication du fait constaté : les chevaux ne portent pas le même poids, car ils n'ont pas la même valeur-handicap. Il s'agit là d'un indice de performance attaché à chaque cheval et calculé ou plutôt décidée au vu des performances passées ( la règle étant que si un cheval s'est bien comporté dans une course, sa valeur-handicap augmente, s'il s'est mal comporté, il n'est pas clair qu'elle doive baisser : on se méfie toujours d'une contre-performance qui serait plus décidée par l'entourage du cheval que subie par les
conditions de courses ) .
Ceci étant, on ordonne les chevaux par valeur-handicap croissante : celui du milieu portera, disons 49 kilo, pour les autres, un écart d'un point de valeur-handicap par rapport au cheval de référence, vaudra un kilo, en plus ou en moins.
On a donc ici l'embryon d'un modèle :
> D''une part une constatation, les poids sont différents d'un cheval à l'autre
> D''autre part une explication : la valeur-handicap
> Enfin, une méthode de calcul qui permet de passer de la dernière variable à la première :

Un statisticien dirait qu'il a "expliqué la variable poids porté par le cheval" par la variable "valeur handicap"[/quote]
Faut avoir l'honnêteté de citer ses sources quand on pollue un forum.
On appelle cela du plagiat. DU VOL, DE LA TRICHERIE.
C'est de l'usurpation, de l'imposture, de l'escroquerie intellectuelle.
Je donne la source :
[url]http://cc.bingj.com/cache.aspx?q=agence+tip+turf&d=4864608855919812&mkt=fr-CA&setlang=fr-CA&w=aff0354e,69c3ff06[/url]

Allez-y et lisez : c'est du copier-coller tout simple.
Au lieu de polluer et rendre possible des poursuites contre le webmaster de ce site, il suffit de donner la référence au lieu de se faire passer pour un autre.

Bonne journée.

Ps : je déteste les voleurs et les tricheurs.
roerfebaybyx
Site Admin
Messages : 0
Inscription : jeu. janv. 01, 1970 1:00 am
Contact :

Un sujet à  " Abordé" o๠" Abordable " ETABLIR UNE STATISTIQUE! - 17/12/2009

Message par roerfebaybyx »

Monsieur Karto !

Une nouvelle fois indiscipliné......
Cette information est à la disposition de toutes personnes mentalement normales.
Si vous avez des difficultés à suivre ce mémoire, d'autres seront en tirer la QUINTESSENCE.
EXPLICATION DU MOT QUINTESSENCE POUR VOUS ETRE AGREABLE :
Ce qu'il y a de "MEILLEUR" , de "PLUS FIN", de plus "PRECIEUX" dans quelque chose.....
Un plaisir personnel....
J'ai recherché mathématiquement votre Test du χ² d'adéquation, il est très simple à trouver, je n'ai pas mis longtemps à chercher, la probabilité d'un résultat était évident.
Si le webmaster de ce site n'accepte pas cette source d'information il est suffisamment bien placé pour me le faire
savoir.
Ce cours de statistiques organisés par le département de mathématiques du CNAM, apprend d'une part à utiliser un certain nombre de modèles d'usage ...
Il suffit de le télécharger gratuitement a partir de ce lien...
[url]http://docs.google.com/viewer?a=v&q=cache:zDVYLWtQMmwJ:econometrie.cnam.fr/servlet/com.univ.utils.LectureFichierJoint%3FCODE%3D1181036101826%26LANGUE%3D0+cours+de+statistiques+organis%C3%A9s+par+le+d%C3%A9partement+de+math%C3%A9matiques+du+CNAM&hl=fr&gl=fr&pid=bl&srcid=ADGEESg3hBIFUWsogKyzRjcRKoEZMxenl_QNtbwuozmHl0nVHyJ9KhDqfbeUfsympYyLTMzgaVfsSitohTzgVXIK__SlIlJdr-YivrpJ4Ht77dANEEHxTexRZtRAPh64S4003H2k23qY&sig=AHIEtbTovP3_DfjyQ3xbGicpHZq4JQxZCw[/url]
Osteoffliessy
Site Admin
Messages : 0
Inscription : jeu. janv. 01, 1970 1:00 am
Contact :

Un sujet à  " Abordé" o๠" Abordable " ETABLIR UNE STATISTIQUE! - 17/12/2009

Message par Osteoffliessy »

[quote=Claude95]Monsieur Karto !

Une nouvelle fois indiscipliné......
Cette information est à la disposition de toutes personnes mentalement normales.
J'ai recherché mathématiquement votre Test du χ² d'adéquation, il est très simple à trouver, je n'ai pas mis longtemps à chercher, la probabilité d'un résultat était évident.
Si le webmaster de ce site n'accepte pas cette source d'information il est suffisamment bien placé pour me le faire
savoir.
Ce cours de statistiques organisés par le département de mathématiques du CNAM, apprend d'une part à utiliser un certain nombre de modèles d'usage ...
Il suffit de le télécharger gratuitement a partir de ce lien...
[url]http://docs.google.com/viewer?a=v&q=cache:zDVYLWtQMmwJ:econometrie.cnam.fr/servlet/com.univ.utils.LectureFichierJoint%3FCODE%3D1181036101826%26LANGUE%3D0+cours+de+statistiques+organis%C3%A9s+par+le+d%C3%A9partement+de+math%C3%A9matiques+du+CNAM&hl=fr&gl=fr&pid=bl&srcid=ADGEESg3hBIFUWsogKyzRjcRKoEZMxenl_QNtbwuozmHl0nVHyJ9KhDqfbeUfsympYyLTMzgaVfsSitohTzgVXIK__SlIlJdr-YivrpJ4Ht77dANEEHxTexRZtRAPh64S4003H2k23qY&sig=AHIEtbTovP3_DfjyQ3xbGicpHZq4JQxZCw[/url][/quote]
Ton intention de tricherie est manifeste.
Tu as modifié le texte en donnant comme exemple le quinté d'aujourd'hui avec Tarakan et compagnie.
Je violerai TOUTES LES DISCIPLINES du monde pour dénoncer des gens malhonnêtes, voleurs de la "sueur des autres", plagiaires et escrocs intellectuels.
Tu n'en es pas à ton premier essai.
D'autres articles postés en copier-coller par tes soins ont été publiés sans référence aux sources. L'article sur le calcul des cotes par exemple.
Alors, ne pollue pas les forums avec les travaux d'autrui.
Tu n'es qu'un vulgaire imposteur et je le crie tout haut au risque de paraître impoli.
Je suis impoli avec les gens malhonnêtes qui ne méritent aucun respect de ma part.
Ces gens-là prennent tous les membres pour des idiots, ils manquent de respect envers eux, ils les méprisent.
Pourquoi les ménagerai-je?
roerfebaybyx
Site Admin
Messages : 0
Inscription : jeu. janv. 01, 1970 1:00 am
Contact :

Un sujet à  " Abordé" o๠" Abordable " ETABLIR UNE STATISTIQUE! - 17/12/2009

Message par roerfebaybyx »

Monsieur Tiercé, Quarté, Quinté++++++
Inutile de débattre avec vous tellement vos messages sont ridicules, grotesques et burlesques.
Votre identité sans doute......
Au Canada, A cette heure là, les enfants sont couchés.
Surtout au Canada.C'est bien votre "RESIDENCE"...SVP
Encore un mensonge de votre part ?
Votre résidence....
Où.......
La fessée est interdite en France...
Je risque un procès de votre part.
Bien amicalement votre.

Vous avez pris connaissance du message du Webmestre :
Messieurs Claude et Karto,
J'ai dû supprimé du contenu de certains messages.
Ca a été dit et redit, le forum n'est pas là pour juger sur son petit voisin et encore moins pour le traiter de débile ...
Je ne suis pas là pour faire la police non plus !!
Les courses sont avant tout un loisir.
Rien de plus ...
a+

Ce message est le dernier avec vous....Monsieur "TURFRIC"
Des Membres Honnètes et constructifs ne postent plus sur le forum a cause de vos exactions intempestives.....STOP !
Pourquoi les "Membres de votre Forum" se retirent très rapidement de votre site, vous les recevez avec la plus grande HOSPITALTE, un accueil très chaleureux et BOULIMIQUE de bonnes intentions.....
Votre Objectif étant de reproduire la PARFAITE REUSSITE du SITE ITURF !

Source de l'image : [url]http://turfric.xooit.com/t175-Reouverture-du-forum.htm[/url]

[img]http://i47.tinypic.com/2chrdx2.jpg[/img]

J'ai passé l'age de jouer aux billes et devoir me justifier......la " Maternelle " est loin derrière moi......
Répondre

Qui est en ligne ?

Utilisateurs parcourant ce forum : Aucun utilisateur inscrit et 0 invité