Dans le cours : R : Les statistiques paramétriques

Débuter avec R - Tutoriel R

Dans le cours : R : Les statistiques paramétriques

Démarrer mon mois d’essai gratuit

Débuter avec R

Bonjour je me présente je m'appelle Vincent Isoz. Je suis consultant formateur en ingénierie statistique et financière et employé dans une entreprise spécialisée dans le conseil et la formation dans les techniques d'ingénierie statistique et financière de pointe et également dans le traitement de données de masse. Maintenant, pour cette formation que nous allons passer ensemble, nous allons étudier R Version 3.2. dans un environnement Windows 64 bits. Et nous allons nous concentrer sur les techniques de statistiques paramétriques sous-entendues évidemment non-bayésiennes. Et avant de commencer dans le vif du sujet, je souhaite faire une petite introduction normative avec quelques remarques. Commençons par la première remarque, pourquoi cette formation. Eh bien simplement, parce que déjà dans un premier temps, Les statistiques paramétriques sont actuellement les plus utilisées dans le monde. ça c'est la première raison. La deuxième raison, c'est que cette formation est la suite logique de la précédente, Où nous avions fait un survol de la manipulation de données dans R et de l'utilisation et de l'installation de ce logiciel. Maintenant, au niveau des objectifs, quels vont-ils être ? Eh bien, c'est simple. Les statistiques paramétriques, c'est un énorme sujet. Par exemple, mon entreprise, on a presque une formation de 20 jours sur les techniques statistiques paramétriques les plus utilisées dans le monde. Et évidemment, il y a autant de jours pour apprendre à utiliser le logiciel avec. La chose étant, c'est que nous, on a une durée limitée. Alors, voilà le choix qui a été fait. On va étudier les sujets dans l'ordre dans lequel ils sont étudiés dans la grande majorité des écoles d'ingénieurs et des universités dans le monde. Effectivement, mon entreprise a l'habitude d'analyser ce qui se fait dans les plus grandes universités et écoles d'ingénieurs. Et on connaît très bien les programmes de plus d'une centaine d'entre elles. Donc, on va simplement suivre l'ordre majeur des outils statistiques étudié et aller le plus loin possible jusqu'à ce que le temps qui nous est dédié soit épuisé. Maintenant, au niveau des prérequis. Commençons par la partie matérielle. Donc R est un logiciel qui fonctionne sur beaucoup de systèmes d'exploitation pour ne citer que les plus courants. On a Windows. Ensuite Linux et ensuite Mac. Peu importe lequel vous avez pour ce que l'on fera. Vous aurez la possibilité de tout répéter de manière identique. Au niveau des connaissances. Qu'avoir comme connaissances, déjà des connaissances équivalentes voire supérieures à la formation précédente qui est dans le catalogue. Sur R, bien évidemment. Maintenant, ça c'est les connaissances pratiques au niveau des connaissances théoriques. Un cours sur R n'est pas un cours de statistiques même si le sujet c'est les statistiques paramétriques. Donc, on ne va pas dans ce cours démontrer les modèles mathématiques ou faire des rappels des formules mathématiques. Vous dire comment interpréter les résultats mathématiques. Il s'agit d'un cours où on apprend à utiliser les commandes et à voir quels sont les possibles sorties de ces commandes. Si vous voulez un cours sur les statistiques, Il faut suivre un cours de statistique théorique. C'est comme pour un cours Word. Quand vous suivez un cours Word, vous n'allez pas demander à avoir un cours de français. Quand vous suivez aussi un cours Excel, Vous n'allez pas demander à avoir un cours de maths. Et ainsi de suite. Donc, il en va de même Pour R, SPSS, Matlab et compagnie. Maintenant, audience, public cible. à qui s'adresse cette formation ? à toute personne intéressée à faire des stats avec R. Tout simplement. Maintenant, les références bibliographiques. Est-ce que j'ai des livres à vous proposer bien adaptés pour cette formation ? Alors oui, en français j'en ai deux. D'abord, le livre que j'ai coécrit avec Daname Kolani, qui est un livre R d'à peu près 1 300 pages. Et qui au fait est un compagnon du livre théorique Sciences.ch, éléments de mathématiques appliquées, Qui est un livre de 4 900 pages A4, Qui démontre tous les théorèmes en détail de ce qui est utilisé dans le livre R. Donc, c'est le compagnon de l'un et de l'autre. Si vous lisez le premier, c'est-à-dire celui de droite souvent, il fait référence à R, SPSS, Matlab, etc., tous Les livres sur lesquels j'ai écrit avec des logiciels. Et quand vous lisez un livre sur un logiciel que je traite dans le livre R, Matlab, SPSS ou autres, Eh bien, je fais à chaque fois référence aux démonstrations mathématiques et au résultat calculé à la main dans le cours théorique. Donc, voilà pour les références bibliographiques et sachez que ces deux livres sont gratuits et que vous les trouvez sur Internet. Par contre, concernant R, Sachez que vous n'avez pas nécessairement la dernière version, car la dernière version est réservée aux clients de mon employeur. Maintenant revenons sur les remarques. Donc là, c'étaient les références bibliographiques. Maintenant, les hypothèses de travail, quelles sont-elles ? Bon, les hypothèses de travail, c'est les hypothèses des tests statistiques eux-mêmes. Donc, quand je vais vous montrer un test statistique, Comme vous êtes censé connaître la théorie qu'il y a derrière, Je vous rappelle que derrière chaque test, Il y a des hypothèses mathématiques sous-jacentes. Donc, soyez très prudents quant à leur utilisation. Maintenant, poursuivons et finissons avec les remarques. Est-ce qu'il y a une certification de R pour valider ces acquis ? Non, à part suivre une formation dans un centre de formation spécialisé de pointe et connu. Je ne connais pas de certifications officielles validées par le Cran par exemple. Ensuite, support post-formation. Est-ce qu'il y en a un ? Oui alors, Outre le fait que vous pouvez passer par la page de commentaires de cette formation, Il y a énormément de forums sur internet Où vous pouvez poser vos questions, il n'y a pas de souci. Mais sachez que la majeure partie des questions concernant R, de niveau école d'ingénieur premier ou deuxième cycle voire doctorat sont traitées dans l'ouvrage que j'ai écrit avec Daname Kolani. Ensuite, au niveau des avertissements qu'est-ce que j'ai à vous dire là-dessus ? C'est utiliser un logiciel et faire des clics, c'est une chose. Savoir utiliser correctement les tests statistiques c'en est une autre. Tant que vous faites des statistiques pour un mémoire, une thèse ou un travail de licence et qu'il n'y a pas de vie en jeu, ou des centaines de millions ou milliards de dollars, Il n'y a pas de problème. Par contre, dès qu'il y a beaucoup d'argent en jeu, S'il vous plaît, suite à ce que je vois ces dernières années dans les entreprises, Vraiment laissez le travail à un statisticien de métier Ou suivez une formation théorique. Ce serait trop dommage de mettre en péril l'entreprise à cause de mauvais calculs ou de mettre en péril votre propre poste. Et après qu'est-ce qu'il y a après une formation en statistiques paramétriques ? Normalement, dans la suite logique, il y a les statistiques non paramétriques, Si je discute de la formation juste après. Bien évidemment, après, il y a encore d'autres formations, par exemple, Les statistiques bayésiennes. Et on pourrait encore parler d'autres techniques comme par exemple ce que j'appelle les statistiques de force brute. Bon, en tout cas, voilà pour cette introduction. Et puis maintenant, j'espère que vous passerez un excellent moment en ma compagnie. Retroussons-nous les manches et attaquons ce vaste logiciel qu'est R.

Table des matières