Modele bayesien hierarchique

Dans mon prochain post, je vais introduire des modèles de mélange, le traitement de la distribution des moyennes de battage comme un mélange de deux distributions bêta-binomiale et d`estimer quel joueur appartient à quel groupe. Ceci introduira également le concept d`un algorithme d`attente-maximisation, qui est important dans les statistiques bayésiennes et fréquentiste. Nous verrons que les modèles de mélange sont toujours un bon ajustement pour le cadre empirique de Bayes, et montrent comment calculer une probabilité postérieure pour le cluster auquel appartient chaque joueur. Les statistiques Frequentist, le fondement plus populaire des statistiques [citation nécessaire], peuvent donner des conclusions apparemment incompatibles avec celles offertes par les statistiques bayésiennes en raison du traitement bayésien des paramètres en tant que variables aléatoires et de son utilisation de informations subjectives pour établir des hypothèses sur ces paramètres. [2] comme les approches répondent à des questions différentes, les résultats formels ne sont pas techniquement contradictoires, mais les deux approches sont en désaccord sur la réponse qui est pertinente pour des applications particulières. Les bayésiens affirment que les informations pertinentes concernant la prise de décision et la mise à jour des croyances ne peuvent pas être ignorées et que la modélisation hiérarchique a le potentiel de renverser les méthodes classiques dans les applications où les répondants donnent de multiples données observationnelles. De plus, le modèle s`est avéré robuste, la distribution postérieure étant moins sensible aux antécédents hiérarchiques plus flexibles. Ce n`était pas une grosse affaire quand nous estimions juste et pour le jeu de données global: nous avions tant d`informations, et nous estimions si peu de paramètres, que nous pouvions nous sentir bien au sujet de l`approche. Mais maintenant que nous mettons en avant ces nombreux paramètres, nous le poussons. En fait, la quantification, et le choix des méthodes robustes à la charge de “double-trempage”, implique des méthodes bayésiennes en dehors de la portée de cette série. Mais je voulais noter que ce poste atteint le bord de ce que les Bayes empiriques peuvent être utilisés pour. Eh bien, il ya certainement une tendance au fil du temps, mais il n`y a rien de linéaire à ce sujet: les moyennes de frappage ont à la fois augmenté et tombé à travers le temps.

Si vous êtes intéressé par l`histoire du baseball et pas seulement les statistiques bayésiennes, vous remarquerez peut-être que ce graphique marque la «lutte de pouvoir» entre l`attaque et la défense: il ya un problème que j`ai été ignorer jusqu`à présent avec l`approche empirique Bayésienne, qui est qu`il ya l`incertitude dans ces hyperparamètres aussi bien. Lorsque nous venons avec un alpha et bêta, ou de trouver des coefficients particuliers au fil du temps, nous traitons ceux qui sont des connaissances fixes, comme si ce sont les antécédents que nous “entré” l`expérience avec. Mais en fait, chacun de ces paramètres ont été choisis à partir de ces mêmes données, et en fait chacun est livré avec un intervalle de confiance que nous sommes entièrement ignorer. Cela est parfois appelé le problème de «double-trempage» parmi les critiques de Bayes empiriques. De nombreuses applications statistiques impliquent de multiples paramètres qui peuvent être considérés comme liés ou reliés de telle sorte que le problème implique la dépendance du modèle de probabilité conjointe pour ces paramètres. [4] les degrés de croyance individuels, exprimés sous la forme de probabilités, viennent avec l`incertitude. [5] au milieu de cela est le changement des degrés de croyance au fil du temps.