2008-09-25 9 views
2

Je dois expliquer au client pourquoi les dupes apparaissent entre deux examens supposés différents. Cela fait 20 ans que Prob et Stats.Problème de probabilité - Dupliquer au choix du grand panier

J'ai un examen à choix multiples généré. Il ya 192 questions dans la base de données, 100 sont choisis au hasard (pas de dupes).

Évidemment, il y a 100% de chances qu'il y ait au moins 8 dupes entre deux examens ainsi générés. (Principe du casier)

Comment calculer la probabilité qu'il y ait 25 dupes? 50 dupes? 75 dupes?

- Modifier après le fait - j'ai couru à travers ce excel, en somme des probabilités de n-100, Pour ce problème particulier, les probabilités étaient

n P(n+ dupes) 
40 97.5% 
52 ~50% 
61 ~0 
+0

Comme l'autre Chris mentionné, je soupçonne 50 dupes appe ar beaucoup de temps. Comme 75-80% ou plus. –

+0

Cette question semble être hors-sujet car il s'agit de mathématiques. – geoffspear

Répondre

2

Erm, ce qui est vraiment très flou pour moi. Mais il y a (192 choisir 100) examens possibles, non?

Et il y a (100 choisir N) façons de choisir N ​​dupes, chacune avec (92 choisir 100-N) façons de choisir le reste des questions, non?

Alors n'est pas la probabilité de choisir N ​​juste dupes:

(100 N choisir) * (92 100 choisissent-N)/(192 100 choisir)

EDIT: Donc, si vous voulez que le chances de N ou plus au lieu de dupes exactement N, vous devez additionner la moitié supérieure de cette fraction pour toutes les valeurs de N à partir du nombre minimum de dupes jusqu'à 100.

Errrr, peut-être ...

+0

Cela me semble bon, mais c'est la probabilité d'exactement N doublons. Pour obtenir une probabilité d'au moins N doublons - ce qui, je pense, est ce qui intéresse chris, il faut additionner un peu –

+0

@Maciej: Doh, bien sûr. Merci –

+0

Ouais, ça l'a fait. J'ai compris la sommation par moi-même. –

0

C'est probablement plus élevé que vous pense. Je n'essaierai pas de reproduire cet article: http://en.wikipedia.org/wiki/Birthday_paradox

+0

Veuillez utiliser [link text] (URL) pour créer un lien cliquable. – cjm

+0

terminé, touchez le bouton plutôt que le lien hypertexte: S – Chris

+0

J'ai regardé cela, et c'est génial pour trouver la probabilité d'une dupe simple, c'est un peu plus difficile de trouver la distribution de probabilité de dupe. –

1

Une fois que vous avez créé le premier examen, il y a 92 questions qui n'ont jamais été utilisées et 100 qui l'ont été. Si vous générez maintenant un autre examen, avec 100 questions, vous choisissez parmi un ensemble de 92 questions qui n'ont jamais été utilisées, et 100 qui l'ont été. Clairement, vous allez obtenir quelques doublons.

Vous vous attendez à obtenir (100/192) * 100 doublons, c'est-à-dire dans deux examens choisis au hasard, il y aura (en moyenne) 52 questions en double.

Si vous voulez la probabilité qu'il y en ait 25, ou 75, ou peu importe, alors vous avez deux choix.

a) les travaux mathématiques

b) Simuler quelques pistes sur un ordinateur

+0

Vous devriez dire que le nombre de doublons ** prévu ** est de 52. –

+0

en effet. Corrigée. –