INFERENCIA ESTADISTICA PRUEBA DE HIPOTESIS ... - edUTecNe
INFERENCIA ESTADISTICA PRUEBA DE HIPOTESIS ... - edUTecNe
INFERENCIA ESTADISTICA PRUEBA DE HIPOTESIS ... - edUTecNe
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Definiciones<br />
<strong>INFERENCIA</strong> <strong>ESTADISTICA</strong><br />
<strong>PRUEBA</strong> <strong>DE</strong> <strong>HIPOTESIS</strong> <strong>ESTADISTICA</strong>S<br />
PH I<br />
a. Una hipótesis estadística es una suposición que se hace sobre la F. de D. de una variable<br />
aleatoria asociada a un experimento aleatorio.<br />
PH 1<br />
b. Una prueba de hipótesis es un procedimiento que determina si la hipótesis en cuestión debe<br />
o no ser rechazada.<br />
Se anticipa que el no rechazo de una hipótesis no implica necesariamente su aceptación. Más<br />
sobre esto más adelante.<br />
Conceptos Principales<br />
PH II.1<br />
PH II<br />
Sea un experimento aleatorio con permanencia estadística. Sea X la variable aleatoria asociada al<br />
mismo.<br />
Para introducir las nociones básicas de la prueba de hipótesis, se considerará el caso de que la<br />
hipótesis a probar, también llamada hipótesis nula, tenga una única posible hipótesis alternativa.<br />
Sea la hipótesis nula:<br />
y la hipótesis alternativa:<br />
f<br />
X<br />
x<br />
0<br />
H0 : X tiene una f. de d. ( )<br />
f<br />
X<br />
x .<br />
1<br />
H1 : X tiene una f. de d. ( )<br />
Dadas estas hipótesis, imagínese para H0 el siguiente mecanismo de rechazo / no rechazo:<br />
1º. Se particiona a x (al conjunto de los números reales) en dos conjuntos. A uno de ellos se<br />
lo llamará “región de no rechazo” (NR) y al otro “región crítica” (RC). Esta partición por<br />
el momento se considera arbitraria (ver ejemplo en figura PH II.a).<br />
2º. Se efectúa una única vez el experimento. Llámese x al resultado. Si x ∈ RC se rechazará<br />
a H0, y si x ∈ NR no se la rechazará.<br />
RC<br />
NR<br />
Figura PH II.a<br />
x
PH 2<br />
Notar que al definir este mecanismo de rechazo / no rechazo no se entró en consideraciones acerca<br />
de si es bueno o malo. Otro mecanismo, evidentemente malo, sería tirar una moneda y rechazar a H0<br />
si sale cara.<br />
Al proceder de la manera indicada, pueden cometerse dos tipo de errores.<br />
Error tipo I: rechazar a H0 siendo cierta<br />
Error tipo II: No rechazar a H0 cuando es falsa<br />
Recordando que el no rechazo de H0 se produce cuando x ∈ NR, y que el rechazo de dicha<br />
hipótesis se produce cuando x ∈ RC, se tiene que:<br />
P(I) = P(Cometer error tipo I) = P(Rechazar H0 siendo cierta) =<br />
= P(x ∈ RC siendo H0 cierta) =<br />
= P(x ∈ RC cuando X tiene una f. de d. f<br />
X<br />
0<br />
( x)<br />
).<br />
A esta P(I) se lo llamará también “nivel de significación” de la prueba.<br />
Igualmente:<br />
P(II) = P(Cometer error tipo II) = P(No rechazar a H0 cuando es falsa) =<br />
= P(x ∈ NR siendo H0 falsa) = P(x ∈ NR siendo H1 cierta) = [3]<br />
= P(x ∈ NR cuando X tiene una f. de d. f<br />
X<br />
1<br />
( x)<br />
).<br />
Evidentemente, a distintas elecciones de zonas críticas RC corresponden distintos valores para P(I)<br />
y P(II). Según es obvio, el mecanismo de rechazo / no rechazo más arriba indicado será tanto mejor<br />
cuanto menores sean los valores de P(I) y P(II), y por lo tanto el diseño de un proceso de prueba de<br />
hipótesis se reduce a elegir una región crítica (a particionar el eje x) de manera tal que P(I) y P(II)<br />
sean “lo menor posible”.<br />
Desgraciadamente, es imposible disminuir simultáneamente a P(I) y P(II). Dada esta circunstancia,<br />
lo que generalmente se hace es tomar un valor convencional (generalmente 0,05) para el nivel de<br />
significación de la prueba P(I). Una vez fijado este valor, entre todas las regiones que den<br />
P(I) = 0,05 se elige a aquella que dé un P(II) mínimo.<br />
PH II.2<br />
Ejemplo<br />
a. Supóngase que:<br />
H0 = La variable X tiene una f. de d. f<br />
X<br />
( x)<br />
0<br />
H1 = La variable X tiene una f. de d. f<br />
X<br />
( x)<br />
1<br />
siendo f<br />
X<br />
( x)<br />
y f<br />
X<br />
( x)<br />
las indicadas en la figura PH II.b.<br />
0 1<br />
f<br />
X<br />
( x)<br />
0<br />
f<br />
X<br />
( x)<br />
1<br />
NR1<br />
α<br />
RC1<br />
[1]<br />
[2]<br />
x<br />
Figura PH II.b
Considérese la región crítica:<br />
En este caso (ver [2] y [3]):<br />
RC1 : x > α<br />
P RC (I) = P(x ∈ RC1 cuando X tiene una f. de d. f<br />
X<br />
( )<br />
1<br />
0<br />
x ) =<br />
∞<br />
= ∫ f<br />
X<br />
0<br />
( x)<br />
dx = Área<br />
α<br />
de figura PH II.b<br />
P RC (II) = P(x ∈ NR1 cuando X tiene una f. de d. f<br />
X<br />
( )<br />
1<br />
1<br />
x ) =<br />
= P(X ≤ α cuando X tiene una f. de d. f<br />
X<br />
( x)<br />
) =<br />
1<br />
α<br />
= ∫ f<br />
X<br />
1<br />
( x)<br />
dx = Área de figura PH II.b<br />
−∞<br />
PH 3<br />
b. Evidentemente, al variar α varía RC1 y varían P RC (I) y P<br />
1 RC (II). Si α aumenta,<br />
1<br />
disminuye P RC (I) pero aumenta P<br />
1<br />
RC (II), y viceversa.<br />
1<br />
Si, tal como indicado en PH II.1, se toma P RC (I) = 0,05, el valor de α queda fijado, lo<br />
1<br />
que a su vez fija el valor de P RC (II).<br />
c. Considérese ahora la región crítica (ver figura PH II.c):<br />
a b<br />
RC2<br />
1<br />
RC2 : a < x ≤ b<br />
f<br />
X<br />
( x)<br />
0<br />
f<br />
X<br />
( x)<br />
1<br />
NR2<br />
En este caso:<br />
P RC (I) = P(x ∈ RC2 cuando X tiene una f. de d. f<br />
X<br />
( )<br />
2<br />
0<br />
x ) =<br />
= P(a < X ≤ b cuando X tiene una f. de d. f<br />
X<br />
( x)<br />
) =<br />
0<br />
b<br />
= ∫ f<br />
X<br />
0<br />
( x)<br />
dx = Área de figura PH II.c<br />
a<br />
x<br />
Figura PH II.c
P RC (II) = P(x ∈ NR2 cuando X tiene una f. de d. f<br />
X<br />
( x)<br />
) =<br />
2<br />
1<br />
= P(X ≤ a ∪ X > b cuando X tiene una f. de d. f<br />
X<br />
( x)<br />
) =<br />
1<br />
a ∞<br />
= ∫ f<br />
X<br />
( x)<br />
dx + ∫ f<br />
X<br />
1<br />
( x)<br />
dx = Área de figura PH II.c<br />
1<br />
−∞ b<br />
d. Supóngase ahora que α (figura PH II.b) y a y b (figura PH II.c) hayan sido elegidos de<br />
manera tal que:<br />
PH II.3<br />
P<br />
1 RC 2<br />
RC ( I)<br />
= P ( I)<br />
= 0,05<br />
Se ve a simple vista que se tendrá que:<br />
PRC ( II)<br />
< PRC<br />
1<br />
2<br />
( II)<br />
PH 4<br />
y por lo tanto RC1 es una región crítica mejor que RC2.<br />
Más aún, observando atentamente las funciones f<br />
X<br />
( x)<br />
y f<br />
X<br />
( x)<br />
, se llega a la conclusión<br />
0 1<br />
de que entre todas las regiones críticas tales que P(I) = 0,05 se tiene que aquella que implica<br />
un P(II) mínimo es precisamente la RC1.<br />
Por lo tanto, queda terminado el problema del diseño del proceso de rechazo / no rechazo de<br />
la hipótesis H0. Si el resultado del experimento cae en RC1, la hipótesis será rechazada.<br />
a. Hasta el momento, el rechazo o no rechazo de la hipótesis nula se efectuaba en base al<br />
resultado de un único experimento.<br />
Esto no es motivo de horrorizarse, ya que en la práctica dicho único experimento puede<br />
hacerse tan exhaustivo como se quiera mediante el artificio de considerar como experimento<br />
único a un conjunto formado por una gran cantidad de experimentos elementales.<br />
Por ejemplo, supóngase que interese verificar la hipótesis nula:<br />
H0 : La variable X tiene una f. de d. normal (0 , 1)<br />
teniéndose como hipótesis alternativa:<br />
H1 : La variable X tiene una f. de d. normal (1 , 1)<br />
Supóngase que rechazar o no a H0 en base a una única realización del experimento no<br />
parezca reunir suficientes garantías (lo cual es en realidad cierto ya que puede probarse que<br />
con un nivel de significación P(I) = 0,05 se obtiene P(II) = 0,7422 para una RC óptima). Ver<br />
figura PH II.d.<br />
P(II) = 0,7422<br />
P(I) = 0,05<br />
f<br />
X<br />
( x)<br />
, f de d normal (0 , 1)<br />
0<br />
f<br />
X<br />
1<br />
( x)<br />
, f de d normal (1 , 1)<br />
0 1 α = 1,65<br />
x<br />
Figura PH II.d
PH 5<br />
Se harán entonces, digamos, nueve realizaciones del experimento primitivo y con ellas se<br />
formará un único experimento compuesto, cuya respuesta será el valor asumido por:<br />
X =<br />
X1<br />
+ ...+<br />
9<br />
X9<br />
siendo X1, ..., X9 las variables correspondientes a cada realización del experimento<br />
primitivo.<br />
Como las Xi son todas normales, se tendrá que X tendrá también una F. de D. normal. Sus<br />
parámetros serán:<br />
Entonces:<br />
m =<br />
X<br />
m<br />
H0 cierta (X normal (0 , 1)) ⇔<br />
H1 cierta (X normal (1 , 1)) ⇔<br />
Entonces, el rechazo / no rechazo de<br />
σ<br />
X<br />
=<br />
σ σ<br />
= =<br />
n 3<br />
*<br />
H 0 cierta ( X normal (0 , 1<br />
3 ))<br />
*<br />
H 1 cierta ( X normal (1 , 1<br />
3 ))<br />
problema primitivo queda pues mutado en la prueba de<br />
*<br />
H 1 .<br />
*<br />
0<br />
1<br />
3<br />
H implicará el rechazo / no rechazo de H0. El<br />
*<br />
H 0 , hipótesis que tiene como<br />
alternativa a<br />
Según se verá, una decisión a que se llegue en base a esta nueva situación será mucho más<br />
“seria” que la decisión basada en una única realización del experimento primitivo.<br />
Examinando las f. de d. f<br />
X<br />
0<br />
( x)<br />
y f<br />
X<br />
( x)<br />
(ver figura PH II.e), resulta evidente que para<br />
1<br />
probar a H la región crítica volverá a ser del tipo:<br />
*<br />
0<br />
RC : x > α<br />
quedando únicamente por averiguar el valor de α.<br />
Trabajando en un nivel de significación P(I) = 0,05, y teniendo en cuenta que si<br />
cierta se tiene que X tiene un F. de D. normal (0 , 1<br />
3 ), resulta que:<br />
⎛<br />
⎞<br />
0,05 = P(I) = P( X > α) = P<br />
⎜ X − 0 α − 0 ⎟<br />
⎜<br />
><br />
1 1 ⎟<br />
⎝ 3 3 ⎠<br />
normal (0 , 1<br />
3 ) normal (0 , 1)<br />
α − 0<br />
De la tabla de la función normal (0 , 1) sale entonces que: = 1,<br />
65<br />
1<br />
3<br />
1,<br />
65<br />
con lo que resulta que: α = = 0,55<br />
3<br />
*<br />
H 0 es
PH II.4<br />
PH 6<br />
*<br />
H 1 es cierta, se tiene que X tiene una f. de d. normal (1 , 1<br />
3 ), y<br />
Se calculará ahora P(II). Si<br />
entonces:<br />
⎛<br />
⎞<br />
P(II) =P( X < α) = P( X ≤ 0,55) = P<br />
⎜ X −1<br />
0,<br />
55 −1<br />
⎛<br />
⎞<br />
⎟<br />
⎜<br />
≤<br />
1 1 ⎟<br />
= P<br />
⎜ X −1<br />
⎟<br />
⎜<br />
≤ −1,<br />
35<br />
⎟<br />
= 0,0885<br />
1<br />
⎝ 3 3 ⎠ ⎝ 3 ⎠<br />
normal (1 , 1<br />
3<br />
) normal (0 , 1)<br />
Entonces, al pasar de una realización única del experimento primitivo a nueve realizaciones<br />
de dicho experimento consideradas como un experimento único, se tiene que el valor de<br />
P(II) baja de 0,7415 a 0,0885, para un nivel de significación constante igual a 0,05.<br />
El motivo de esto es el hecho de que las desviaciones típicas de las variables usadas en el<br />
experimento compuesto son tres veces menores que las de las variables usadas en el<br />
experimento primitivo, lo que causa el efecto ilustrado en las figuras PH II.d y PH II.e.<br />
f<br />
X<br />
0<br />
( x)<br />
, f. de d. normal (0 , 1<br />
3<br />
)<br />
P(II) = 0,0885<br />
Hasta ahora se ha considerado el caso de que la hipótesis nula tenga una única alternativa. Este caso<br />
se presenta muy poco en la vida real, donde generalmente a una hipótesis nula pueden corresponder<br />
muchas alternativas.<br />
Considérese el caso de un fabricante de herramientas cuya producción normal sea tal que a la<br />
dureza de las mismas pueda hacerse corresponder una variable aleatoria X con f. de d. normal<br />
(10 ; 1). El proceso de fabricación es tal que la varianza permanece prácticamente constante. El<br />
fabricante ha introducido una variante en la aleación del metal, y desea verificar que dicha variante<br />
no ha bajado la dureza de sus herramientas.<br />
Si se hubieran hecho 100 pruebas de dureza antes de variar la aleación, se tendría que la variable<br />
aleatoria correspondiente a la dureza promedio tendría una f. de d. normal (10 ; 1 ).<br />
100<br />
Si se hacen 100 pruebas de dureza después de variar la aleación, se tendría que la variable aleatoria<br />
correspondiente a la dureza promedio tendría una f. de d. normal (m ; 1 ), siendo m el valor<br />
100<br />
medio (desconocido) de la dureza. (Observar que se supuso que la varianza no cambió).<br />
Lo que al fabricante le interesa entonces es probar la hipótesis nula:<br />
H0 = X tiene una f. de d. normal (10 ;<br />
teniendo como conjunto de hipótesis alternativas:<br />
{H * } = { X tiene una f. de d. normal (m ;<br />
0 1<br />
α = 0,55<br />
1 )<br />
100<br />
1 )}, ∀ 0 < m < 10<br />
100<br />
f<br />
X<br />
( x)<br />
, f .de d. normal (1 , 1<br />
1<br />
3<br />
)<br />
P(I) = 0,05<br />
x<br />
Figura PH II.e
PH 7<br />
Notar que de estas hipótesis alternativas sólo una puede eventualmente ser verdadera (la que<br />
corresponde a la nueva dureza de las herramientas en caso de que en efecto la dureza haya<br />
cambiado), pero como no se la conoce, es necesario tener en cuenta todas las alternativas del<br />
conjunto.<br />
Se tiene entonces la situación indicada en la figura PH II.f.<br />
Examinando esta figura, resulta evidente que debe elegirse una región crítica del tipo:<br />
RC : x < α<br />
ya que en caso de ser falsa H0, para cualquiera de las hipótesis alternativas que sea la cierta, esta<br />
región crítica dará un valor mínimo para P(II).<br />
Suponiéndose que se trabaje con un nivel de significación P(I) igual a 0,05 se tiene que:<br />
⎛<br />
⎞<br />
0,05 = P(I) = P( X < α) = P<br />
⎜ X −10<br />
α −10<br />
⎟<br />
⎜<br />
<<br />
1 1 ⎟<br />
⎝ 10 10 ⎠<br />
Normal (10 ; 1<br />
10 )<br />
Normal (0 ; 1)<br />
lo que implica que sea:<br />
de donde:<br />
α = 1<br />
10 (– 1,65) + 10 = 9,835<br />
α −10<br />
= – 1,65<br />
1<br />
10<br />
La hipótesis H0, será pues rechazada o no según que X asuma un valor menor o mayor que 9,835.<br />
f de d normal (9,7 ; 1<br />
10 )<br />
f de d correspondientes a<br />
hipótesis alternativas<br />
9,6 9,8 10<br />
RC α = 9,835<br />
X<br />
0<br />
( x)<br />
(correspondiente a H0)<br />
P(I) = 0,05<br />
f , f de d normal (10 ; 1<br />
10 )<br />
Figura PH II.f<br />
Supóngase que el cambio en la aleación hubiera disminuido la dureza de las herramientas. En este<br />
caso H0 sería falsa y una de las hipótesis alternativas sería cierta. Entonces, para cada posible valor<br />
de m candidato a ser cierto que tendrá un valor de P(II) distinto, el cual está dado por.<br />
⎛<br />
⎞<br />
P(II) = P( X > 9,835) = P<br />
⎜ X − m 9,<br />
835 − m<br />
⎛<br />
⎞<br />
⎟<br />
⎜<br />
><br />
1 1 ⎟<br />
= 1 – P<br />
⎜ X − m<br />
⎟<br />
⎜<br />
≤ 10 ⋅ ( 9,<br />
835 − m)<br />
1<br />
⎟<br />
⎝ 10 10 ⎠ ⎝ 10<br />
⎠<br />
Normal<br />
(m ; 1<br />
10 )<br />
Normal (0 ; 1) Normal (0 ; 1)<br />
x
Graficando a P(II) vs m se obtiene lo indicado en la figura PH II.g.<br />
PH 8<br />
Este gráfico da una idea de la sensibilidad del experimento. Por ejemplo, si la dureza de las<br />
herramientas baja de 10 a 9,8, hay una probabilidad igual a 0,36 de “aceptar gato por liebre”, es<br />
decir de declarar por cierta la hipótesis H0 cuando en realidad no lo es.<br />
Si esto constituye una catástrofe, entonces habrá que aumentar la sensibilidad del experimento<br />
aumentando n (es decir, efectuando más mediciones de dureza).<br />
En cambio si el hecho de que la dureza baje de 10 a 9,8 no presenta mayores problemas, pero si los<br />
presenta el que baje de 10 a 9,7, el experimento tiene una sensibilidad adecuada ya que existe una<br />
probabilidad de sólo 0,09 de declarar válida a H0 cuando en realidad no lo es.<br />
PH II.5<br />
P(II)<br />
1<br />
0,8<br />
0,6<br />
0,4<br />
0,2<br />
0,09<br />
0,36<br />
0,5<br />
0,74<br />
0,95<br />
9,7 9,8 9,9 10<br />
9,835<br />
a. Sea el caso de un fabricante de ejes cuya producción es tal que al diámetro de los ejes pueda<br />
asociarse a una variable aleatoria X con f. de d. normal (100 ; 0,01).<br />
El fabricante y sus clientes se encuentran muy satisfechos con dicha producción. Con ese<br />
fin, cada tanto se hace un ensayo consistente en medir 25 ejes. Se pide indicar como se<br />
deben usar dichas mediciones para determinar si los parámetros de la f. de d. han cambiado<br />
o no.<br />
b. Si los parámetros no han cambiado, se tiene que la variable aleatoria X correspondiente al<br />
promedio de las medidas tendrá una f. de d. normal (100 ;<br />
0,<br />
01<br />
Por lo tanto, al fabricante le interesa probar la hipótesis nula:<br />
).<br />
25<br />
0,<br />
01<br />
m<br />
(dureza verdadera)<br />
H0 : X tiene una f. de d. normal (100 ; )<br />
25<br />
teniéndose como conjunto de hipótesis alternativas:<br />
{H * } = { X tiene una f. de d. normal que NO ES (100 ;<br />
0,<br />
01<br />
Figura PH II.g<br />
)}<br />
25<br />
Volviendo a principios básicos, se recuerda que el diseño de una prueba de hipótesis se<br />
reduce a la elección de una región crítica, resultado de una partición del eje x.
PH 9<br />
En los problemas anteriores, las regiones críticas consistían todas en semirrectas únicas del<br />
eje x (es decir del tipo x < α ó x > α).<br />
Esto no puede ocurrir en el presente caso por las razones indicadas a continuación, las cuales<br />
están ilustradas en la figura PH II.h.<br />
X<br />
f<br />
X<br />
f ( x)<br />
, f de d<br />
2<br />
( x)<br />
, f de d correspondiente<br />
0<br />
a otra de las alternativas, H2.<br />
correspondiente a H0.<br />
f<br />
X<br />
1<br />
( x)<br />
, f de d correspondiente<br />
a una de las alternativas, H1.<br />
1º. Si existiese el peligro de que la f. de d. primitiva (correspondiente a H0), f<br />
X<br />
0<br />
( x)<br />
,<br />
evolucionara hacia f<br />
X<br />
( x)<br />
, la región crítica que daría un P(II) mínimo sería del tipo<br />
1<br />
x < α.<br />
2º. Si existiese peligro de que la f. de d. primitiva evolucionara hacia f<br />
X<br />
( x)<br />
, la región<br />
2<br />
crítica que daría una P(II) mínimo sería del tipo x > β.<br />
3º. Si se adopta una región crítica del tipo x < α y la f. de d. primitiva f<br />
X<br />
0<br />
( x)<br />
evolucionara<br />
hacia f<br />
X<br />
( x)<br />
se tendría que la probabilidad de no rechazar a H0 cuando es falsa<br />
2<br />
disminuiría en vez de aumentar.<br />
Este estado de cosas es debido a que en el problema actual no se sabe “el lado por donde<br />
puede venir el enemigo”, cosa que se conocía en los problemas anteriores.<br />
Entonces, para “proteger ambos flancos” se dividen las “defensas”, teniéndose así que la<br />
región crítica constará de dos subregiones x < γ1 y x > γ2 (ver figura PH II.i) que cubren las<br />
“colas” de f<br />
X<br />
0<br />
( x)<br />
.<br />
f<br />
X<br />
( x)<br />
, f de d correspondiente<br />
1<br />
a una de las alternativas.<br />
P(I<br />
)<br />
0,025 =<br />
2<br />
α 100 β<br />
γ1 100 γ2<br />
x<br />
Figura PH II.h<br />
f<br />
X<br />
0<br />
( x)<br />
, f de d correspondiente a H0. f<br />
X<br />
( x)<br />
, f de d correspondiente a<br />
2<br />
otra de las alternativas.<br />
RC<br />
P(II) en el caso de que a la<br />
hipótesis cierta corresponda<br />
la f de d f<br />
X<br />
( x)<br />
1<br />
P(I<br />
)<br />
0,025 =<br />
2<br />
x<br />
Figura PH II.i
Se obtendrá así lo siguiente:<br />
PH 10<br />
1º. P(I) = 0,05<br />
2º. Si a la hipótesis verdadera correspondiera la f de d f<br />
X<br />
( x)<br />
se tendrá:<br />
1<br />
P(II) = ∫ 2 γ<br />
f<br />
X<br />
1<br />
( x)<br />
dx<br />
γ1<br />
Este valor es superior al que se obtendría si dicha hipótesis fuera la única alternativa<br />
posible (en cuyo caso toda la defensa estaría a la izquierda).<br />
3º. Igualmente, si a la hipótesis cierta correspondiera la f. de d. f<br />
X<br />
( x)<br />
se tendría que:<br />
2<br />
P(II) = ∫ 2 γ<br />
f<br />
X<br />
2<br />
( x)<br />
dx<br />
γ<br />
1<br />
4º. Supóngase cierta la hipótesis alternativa a la cual corresponda la f. de d. f<br />
X<br />
3<br />
( x)<br />
indicada<br />
en la figura PH II.j.<br />
En este caso se tendrá un P(II) muy grande, y casi con seguridad no se rechazará a H0<br />
cuando en realidad sea falsa.<br />
Esto no crea mayores problemas ya que en una producción cuya f. de d. sea f<br />
X<br />
3<br />
( x)<br />
será<br />
probablemente satisfactoria.<br />
P(II) si a la hipótesis<br />
cierta corresponde la<br />
f de d f<br />
X<br />
3<br />
( x)<br />
En otras palabras: el mecanismo de prueba indicado detecta bastante bien cambios en la<br />
producción que puedan ser peligrosos, pero su sensibilidad ante cambios más o menos<br />
inocuos es escasa o nula.<br />
PH II.6 (Muy importante)<br />
γ1 100 γ2<br />
f<br />
X<br />
3<br />
( x)<br />
, f de d correspondiente a la<br />
hipótesis alternativa.<br />
f<br />
X<br />
0<br />
( x)<br />
, f de d correspondiente a H0.<br />
a. Casi siempre es el operador quien determina la magnitud del error tipo I que está dispuesto a<br />
aceptar. Generalmente establece una magnitud pequeña, digamos P(I) = 0,05 ó P(I) = 0,01.<br />
Por lo tanto la probabilidad de rechazar erróneamente una hipótesis nula cierta es baja.<br />
RC<br />
x<br />
Figura PH II.j
PH 11<br />
Entonces se dice que la decisión de rechazar a H0 en base a los resultados obtenidos es una<br />
conclusión fuerte.<br />
Por otra parte, el aceptar a H0 en base a no haberla rechazado constituye una conclusión<br />
débil ya que la probabilidad P(II) de no rechazar a H0 cuando en realidad es falsa puede ser<br />
bastante alta (ver figuras PH II.d y PH II.j).<br />
b. En muchos casos, la prueba de hipótesis puede conducir a decisiones importantes. En estos<br />
casos la elección de las hipótesis nulas debe ser hecha buscando siempre la seguridad, es<br />
decir en base a una conclusión fuerte.<br />
Por ejemplo: supóngase que un nuevo proceso industrial parezca ser mejor que el que está<br />
en uso pero que el reemplazo sea muy caro. En este caso se tomará como hipótesis nula:<br />
H0 : El nuevo proceso NO es mejor que el anterior.<br />
Entonces, el hecho de que H0 sea rechazada con, digamos, un nivel de significación de 0,01<br />
implica que se decida que H0 es falsa, y que por lo tanto el nuevo proceso es mejor que el<br />
anterior, siendo igual a 0,01 la probabilidad de haber hecho una decisión errónea.<br />
PH III<br />
Prueba de hipótesis para el valor medio de una variable aleatoria correspondiente a una<br />
distribución cualquiera de probabilidad cuando se dispone de una muestra grande<br />
PH III.1<br />
a. Supóngase que se efectúe una cantidad n grande de repeticiones independientes de un<br />
experimento, y sean X1, ..., Xn las variables asociadas a dichos experimentos.<br />
Evidentemente, todas estas variables tienen un mismo valor medio m y una misma<br />
desviación típica σ.<br />
Por ser n grande se tiene (ver [5] de BNP VII.1) que:<br />
X1<br />
+ ... + X<br />
X =<br />
n<br />
n<br />
tiene una distribución aproximadamente normal (m ;<br />
y por lo tanto la variable:<br />
σ )<br />
n<br />
X − m<br />
σ<br />
n<br />
tendrá una distribución aproximadamente normal (0 ; 1).<br />
Por lo visto en b de BNP VII.I:<br />
m =<br />
X<br />
m<br />
σ =<br />
X<br />
σ<br />
n<br />
[1]<br />
[2]<br />
[3]
. Sea la hipótesis nula:<br />
H0 : m = 50 , σ = 2 ⇔ 50<br />
X = m ,<br />
y el conjunto de hipótesis alternativas:<br />
X = σ<br />
2<br />
n<br />
PH 12<br />
H1 : m < 50 ⇔ 50<br />
X < m<br />
Supóngase que se efectúen n = 100 repeticiones del experimento, lo que se considera<br />
suficientemente grande como para que sea válido lo indicado en [2].<br />
Supóngase que al realizar esos n = 100 experimentos se haya obtenido x = 49,65. Se pide<br />
indicar si en base a este resultado se debe rechazar o no la hipótesis H0 con un nivel de<br />
significación P(I) = 0,05.<br />
Evidentemente, como las alternativas de H0 son H1: 50<br />
X < m , la región crítica del caso<br />
estará ubicada totalmente a la izquierda de la región de no rechazo (se está en una situación<br />
similar a la indicada en PH II.4). Llamando α al punto frontera entre ambas regiones se tiene<br />
entonces que:<br />
⎛<br />
⎞<br />
⎜ X − 50 α − 50 ⎟ α − 50<br />
P(I) = P( X < α) = 0,05 ⇔ P⎜<br />
< ⎟ = 0,05 ⇔<br />
⎜<br />
2 2<br />
⎟<br />
0,<br />
2<br />
⎝ 100 100 ⎠<br />
y entonces resulta que:<br />
α = – 0,2 · 1,645 + 50 = 49,671<br />
siendo entonces la región crítica:<br />
RC: X < 49,671<br />
y como en el experimento se obtuvo:<br />
x = 49,65 ∉ RC<br />
Normal (0 ; 1)<br />
= – 1,645<br />
por tabla N(0 ; 1)<br />
se tiene entonces que no debe rechazarse a H0 con un nivel de significación igual a 0,05.<br />
(conclusión débil).<br />
c. Supóngase ahora que los verdaderos valores de m y σ hubieran sido 49 y 8 respectivamente.<br />
En este caso sería:<br />
P(II) = P(No rechazar a H0 siendo m = 49 y σ = 8) = P( x no caiga en RC) =<br />
⎛<br />
⎞<br />
⎜ X − 49 49,<br />
671−<br />
49 ⎟<br />
= P( X > 49,671) = P⎜<br />
><br />
⎟ = 1 – FN(0 ; 1)(0,839) = 0,2<br />
⎜<br />
8 8<br />
⎟<br />
⎝ 100 100 ⎠<br />
Normal (0 ; 1)
PH III.2<br />
Supóngase ahora que la hipótesis nula hubiera sido:<br />
H0 : m = 50 , σ = 2 ⇔ 50<br />
X = m ,<br />
y el conjunto de hipótesis alternativas:<br />
H1 : m ≠ 50 ⇔ 50<br />
X ≠ m<br />
X = σ<br />
2<br />
n<br />
PH 13<br />
Se está pues en una situación análoga a la indicada en PH II.5.<br />
Se dividirá a la región crítica en dos subregiones situadas respectivamente a la izquierda y derecha<br />
de la región de no rechazo.<br />
Sea α1 el punto frontera entre la subregión crítica de la izquierda y la región de no rechazo y sea α2<br />
el punto frontera entre la subregión crítica de la derecha y la región de no rechazo.<br />
Entonces será:<br />
⎛<br />
⎞<br />
P(I<br />
)<br />
⎜ X − 50 α − ⎟<br />
= 0,025 = P( X < α1) ⇔ P ⎜ <<br />
1 50<br />
1 50<br />
⎟ = 0,025 ⇔<br />
2<br />
⎜<br />
2 2<br />
⎟<br />
0,<br />
2<br />
⎝ 100 100 ⎠<br />
− α<br />
= – 1,96 ⇒<br />
⇔ α1 = – 1,96·0,2 + 50 = 49,608<br />
⎛<br />
⎞<br />
P(I<br />
)<br />
⎜ X − 50 α − ⎟<br />
= 0,025 = P( X > α2) ⇔ P ⎜ ><br />
2 50<br />
⎟ = 0,025 ⇔<br />
2<br />
⎜<br />
2 2<br />
⎟<br />
⎝ 100 100 ⎠<br />
⎛<br />
⎞<br />
⎜ X − 50 α − ⎟<br />
P⎜<br />
≤<br />
2 50<br />
α<br />
⎟ = 0,975 ⇔ 2 − 50<br />
= 1,96 ⇔ α2 = 50,392<br />
⎜<br />
2 2<br />
⎟<br />
2<br />
⎝ 100 100 ⎠<br />
100<br />
y resulta entonces que la región crítica será:<br />
y si en el experimento se obtuvo:<br />
RC : X < 49,608 ∪ X > 50,392<br />
x = 49,65 ∉ RC<br />
se tiene entonces que no hay motivo para rechazar la hipótesis nula H0. (conclusión débil).<br />
PH III.3<br />
Observaciones:<br />
1º. En todo lo antedicho en este párrafo PH III se ha supuesto conocida la desviación típica σ de las<br />
variables involucradas. En la práctica a menudo esto no ocurre, y para no ser objeto de parálisis,<br />
lo corriente es usar la estimación de σ indicada en [7] de IE IV:<br />
ˆ =<br />
σ<br />
1<br />
n<br />
∑( xi<br />
− x)<br />
2<br />
n −1<br />
n−1
PH 14<br />
2º. Si bien lo descripto hasta ahora es el procedimiento usual en el caso de muestras grandes,<br />
también es aplicable al caso de muestras chicas a condición de que procedan de una población<br />
con una distribución normal (ya que la suma de una cantidad cualquiera de variables normales<br />
es también normal), pero en este caso sería necesario conocer el valor exacto de σ.<br />
Sin embargo, para el caso de muestras chicas existe un procedimiento mucho más satisfactorio<br />
(ver PH V), que no requiere el conocimiento previo del valor exacto de la desviación típica.<br />
Aplicación<br />
PH IV<br />
a. Sean dos procesos A y B de fabricación de un mecanismo. A la vida útil de los mecanismos<br />
fabricados según A corresponde una variable aleatoria X normal (mX ; 3) y a la vida útil de<br />
los mecanismos fabricados por B corresponde una variable aleatoria Y normal (mY ; 4).<br />
El proceso A es bastante más barato que el B, pero este último tiene una buena ventaja sobre<br />
el A desde el punto de vista de las ventas.<br />
El fabricante decide que si puede llegar a una conclusión fuerte con un nivel de significación<br />
P(I) = 0,01 de que m − m > 2 , adoptará el proceso B, y que de lo contrario adoptará el<br />
Y X<br />
A.<br />
Con el fin de llegar a una decisión instala dos pequeñas líneas piloto de fabricación, una<br />
empleando el proceso A y la otra empleando el proceso B.<br />
Se fabrican 100 ejemplares del mecanismo con cada línea, obteniéndose los siguientes<br />
resultados: x = 50, y = 55.<br />
Indicar cuál será el proceso que adoptará el fabricante.<br />
b. Póngase:<br />
Z = Y – X<br />
Se obtendrá la antedicha conclusión fuerte a favor del proceso B cuando se rechace la<br />
hipótesis nula:<br />
H0 : m = m − m < 2<br />
Z Y X<br />
cuyas hipótesis alternativas son:<br />
H1 : m = m − m ≥ 2<br />
Z Y X<br />
Evidentemente, de ser H0 cierta la región crítica estará ubicada totalmente a la derecha de la<br />
región de no rechazo.<br />
Llámese α al punto frontera entre ambas regiones.<br />
Entonces:<br />
⎛<br />
⎞ ⎛<br />
⎞<br />
⎜ Z − 2 α − 2 ⎟ ⎜ Z − 2 α − 2 ⎟<br />
P(I) = P( Z> α) = 0,01 ⇒ P⎜<br />
> ⎟ = 0,<br />
01 ⇒ P⎜<br />
< ⎟ = 1−<br />
0,<br />
01 = 0,<br />
99<br />
⎜ σ σ ⎟ ⎜ σ σ ⎟<br />
⎝ Z Z ⎠ ⎝ Z Z ⎠<br />
Normal (0 ; 1)<br />
y por lo tanto, de la tabla de la F. de D. normal (0 ; 1) se obtiene:
α − 2<br />
= 2,<br />
33<br />
σ<br />
Z<br />
⇒ α = 2 + 2,<br />
33 σ<br />
Z<br />
teniéndose entonces que la región crítica será:<br />
RC :<br />
c. Se tiene que:<br />
Z = Y − X > 2 + 2,33σ<br />
[1]<br />
Z<br />
σ<br />
2<br />
σ<br />
2<br />
3<br />
2<br />
4<br />
2<br />
σ<br />
2<br />
= σ<br />
2<br />
+ σ<br />
2<br />
=<br />
X<br />
+<br />
Y<br />
= + = 0,<br />
25 ⇒ σ =<br />
Z X Y n n 100 100<br />
Z<br />
y entonces por [1] se tiene que :<br />
RC : Y − X > 2 + 2,33·0,5 = 3,115<br />
0,<br />
5<br />
Como el resultado experimental arrojó x = 50, y = 55 se tiene que:<br />
55 – 50 = 5 ∈ RC<br />
PH 15<br />
y por lo tanto se rechaza la hipótesis H0 con un nivel de confiabilidad de 0,01.<br />
El fabricante aceptará pues usar el proceso de fabricación B, y la probabilidad que tiene de<br />
haber hecho una decisión errónea es P(I) = 0,01.<br />
PH V<br />
Prueba de hipótesis para el valor medio de una variable aleatoria correspondiente a una<br />
distribución normal<br />
PH V.1<br />
Ver IC III.1 a y b.<br />
PH V.2<br />
a. Sea la hipótesis nula:<br />
H0: m = 10 ⇔ m = 10<br />
X<br />
X<br />
y sea el conjunto de hipótesis alternativas:<br />
H1: m > 10 ⇔ m > 10<br />
X<br />
X<br />
Supóngase que se efectúen n = 22 pruebas, y que su resultado sea:
x = 13,71 s = 3,468<br />
PH 16<br />
Se pide indicar si la hipótesis nula H0 debe o no ser rechazada, con un nivel de significación<br />
P(I) = 0,05.<br />
b. Se tiene (ver [2] de IC III) que:<br />
PH V.3<br />
T =<br />
X − m<br />
n −1<br />
X<br />
S<br />
tiene una distribución t de Student con n – 1 = 22 – 1 = 21 grados de libertad.<br />
Evidentemente, como las alternativas de H0 son H1 : 10<br />
X > m , en este caso la región crítica<br />
estará totalmente a la derecha de la región de no rechazo. Sea α el punto frontera entre<br />
ambas regiones. Entonces:<br />
X −10<br />
P(I) = P( X > α) = 0,05 ⇔P( 22 −1<br />
><br />
142<br />
4 43 S4<br />
Distribución<br />
t de Student<br />
⇔<br />
α −10<br />
22 −1<br />
) = 0,05 ⇒<br />
S<br />
10<br />
21<br />
S<br />
− α<br />
1, 721⋅<br />
3,<br />
468<br />
= 1,721 ⇒ α =<br />
+ 10 = 11,3024<br />
21<br />
Por tabla de distribución t de Student<br />
y por lo tanto la región crítica será:<br />
RC : X > 11,3024<br />
Como en el experimento se obtuvo:<br />
x = 13,71 ∈ RC<br />
resulta que la hipótesis nula H0 debe ser rechazada.<br />
Supóngase ahora que la hipótesis nula hubiera sido:<br />
H0: m = 10 ⇔ m = 10<br />
X<br />
X<br />
y que el conjunto de hipótesis alternativas fuera:<br />
H1: m < 10 ⇔ m < 10<br />
X<br />
X<br />
Valor asumido por S<br />
Este caso sería tratado igual que el indicado en PH V.2 pero ubicando la región crítica totalmente a<br />
la izquierda de la región de no rechazo.
PH V.4<br />
Supóngase ahora que la hipótesis nula hubiera sido:<br />
H0: m = 10 ⇔ m = 10<br />
X<br />
X<br />
y que el conjunto de hipótesis alternativas fuera:<br />
H1: m ≠ 10 ⇔ m ≠ 10<br />
X<br />
X<br />
PH 17<br />
Este caso también sería tratado igual que el indicado en PH V.2, pero dividiendo la región crítica en<br />
dos subregiones ubicadas respectivamente a la izquierda y derecha de la región de no rechazo.<br />
PH VI<br />
Prueba de hipótesis para la varianza de una variable aleatoria correspondiente a una<br />
distribución normal<br />
a. Sean n repeticiones independientes de un experimento aleatorio, a las cuales corresponden<br />
las variables aleatorias normales X1, ..., Xn, todas con el mismo valor medio m y la misma<br />
varianza σ 2 . Sea:<br />
n<br />
S<br />
2 1<br />
= ∑ ( Xi<br />
− X)<br />
2<br />
n<br />
i=<br />
1<br />
Por lo indicado en JtF III se tiene que:<br />
La variable<br />
nS<br />
2<br />
σ<br />
2<br />
tiene una distribución χ 2 con n – 1 grados de libertad. [2]<br />
b. Supóngase que se efectuaron 20 pruebas y que la variable S 2 asumió el valor:<br />
Sea la hipótesis nula:<br />
H0:<br />
2<br />
σ 0 = 0,01<br />
1<br />
n<br />
s 2 = ∑ n i=<br />
1<br />
( x − x)<br />
y el conjunto de hipótesis alternativas:<br />
H1:<br />
2<br />
σ 1 > 0,01<br />
i<br />
2<br />
= 0,145 [3]<br />
Se pide verificar la hipótesis H0 con un nivel de significación igual a 0,05 en base al<br />
resultado obtenido en [3].<br />
[1]
PH 18<br />
2<br />
nS<br />
2<br />
c. Suponiendo que H0 sea cierta, se tiene que la variable tendrá una distribución χ con<br />
2<br />
σ 0<br />
n – 1 grados de libertad.<br />
2<br />
Si en la realización del experimento S asume un valor s 2 2<br />
ns<br />
tal que constituya un valor<br />
2<br />
σ 0<br />
2<br />
nS<br />
“patológicamente” alto, tal que difícilmente sea asumido por , existe una fuerte<br />
2<br />
σ 0<br />
presunción de que H0 sea falsa.<br />
En cambio tiene una fuerte posibilidad de que sea cierta la hipótesis H1, la cual por suponer<br />
2 2<br />
2<br />
nS<br />
que σ 1 > σ 0 implica que sea un valor que “mas razonablemente” puede ser asumido<br />
2<br />
σ<br />
2<br />
nS<br />
por 2<br />
σ1<br />
.<br />
1<br />
Lo antedicho supone que en la pruebe de hipótesis de H0, la región crítica de los valores<br />
asumidos por S 2 deben estar completamente a la derecha de la región de no rechazo.<br />
Entonces, si α es el punto frontera entre ambas regiones:<br />
P(I) = P ⎟ ⎛ ⎞<br />
⎜ > α<br />
⎝ σ ⎠<br />
2<br />
2<br />
nS<br />
= 0,05 ⇒ α = 30,14<br />
y por lo tanto la región crítica será si H0 es cierta:<br />
2<br />
nS<br />
RC : > 30,14<br />
2<br />
σ<br />
Como el resultado experimental obtenido fue:<br />
2<br />
ns<br />
2<br />
σ<br />
=<br />
20 ⋅ 0,<br />
145<br />
0,<br />
01<br />
= 29 ∉ RC [4]<br />
se tiene que no debe rechazarse a H0 con un nivel de significación igual a 0,05.<br />
PH VII<br />
Prueba de hipótesis para el parámetro p de una distribución binomial<br />
PH VII.1<br />
χ 2 con 20 – 1 grados de libertad<br />
Ver tabla de distribución χ 2<br />
a. Sea p la probabilidad de que ocurra un cierto suceso A en un experimento aislado.<br />
Supóngase que se efectúen n = 50 repeticiones independientes de dicho experimento y sea c<br />
la cantidad de veces que ocurrió A en dichas n = 50 repeticiones. Por ejemplo, supóngase<br />
que resultó c = 10.
Sea la hipótesis nula:<br />
H0: p = 0,1<br />
y el conjunto de hipótesis alternativas:<br />
H1: p > 0,1<br />
PH 19<br />
y supóngase que se quiera verificar la hipótesis H0 con un nivel de significación igual a 0,05.<br />
b. En el nomograma de la figura PH VII.a, trácese una recta que una a p = 0,1 con<br />
P(x ≤ c) = 1 – 0,05 = 0,95. En el punto en que esta recta corte a la curva n = 50, determínese<br />
el valor de c que corresponde a dicho punto de corte. Resultó c = 8.<br />
Por lo tanto, de ser p = 0,1 (H0 cierta) existe una probabilidad igual a 0,95 de que X,<br />
cantidad de ocurrencias del suceso, sea igual o inferior a 8, y por lo tanto, una probabilidad<br />
igual a 1 – 0,95 = 0,05 de que X sea mayor que 8, lo que implica que la región crítica del<br />
experimento sea:<br />
PH VII.2<br />
RC : X > 8<br />
Como experimentalmente se encontró que:<br />
se rechaza la hipótesis nula H0.<br />
x = 10 ∈ RC<br />
Supóngase ahora que con la misma hipótesis nula anterior:<br />
H0: p = 0,1<br />
el conjunto de las hipótesis alternativas hubiera sido:<br />
H ´<br />
1: p < 0,1
Nomograma para el cálculo de:<br />
c<br />
⎛n<br />
⎞<br />
P(<br />
X ≤ c)<br />
=<br />
−<br />
∑ ⎜ ⎟ p<br />
i<br />
( 1−<br />
p)<br />
n i<br />
i=<br />
⎝ i<br />
0 ⎠<br />
Figura PH VII.a<br />
PH 20
PH 21<br />
En el nomograma de la figura PH VII.a, trácese una recta que una a p = 0,1 con P(X ≤ c) = 0,05. En<br />
el punto en que esta recta corte a la curva n = 50, determínese el valor de c que corresponda a dicho<br />
punto de corte. Resultó c = 1,5.<br />
Por lo tanto, de ser p = 0,1 (H0 cierta) existe una probabilidad igual a 0,05 de que X sea menor o<br />
igual que 1,5 (es decir de que sea X = 0 ó X = 1), lo que implica que la región crítica del<br />
experimento sea:<br />
RC´ : X ≤ 1<br />
Como experimentalmente se encontró que:<br />
x = 10 ∉ RC´<br />
en este caso no se rechazará a la hipótesis nula H0.<br />
PH VII.3<br />
En el caso de que n sea grande, más allá del alcance del nomograma, y de que p no sea muy<br />
próximo a 0 o a 1, la variable x correspondiente a la cantidad de ocurrencias, será aproximadamente<br />
normal (Teorema de Lindeberg) cayéndose así en el caso analizado en PH III.<br />
Se tendrá entonces que la hipótesis nula será.<br />
H0: p<br />
X = m y<br />
ˆ<br />
X<br />
σ<br />
PH VIII<br />
=<br />
x ( 1−<br />
x)<br />
n<br />
Prueba de hipótesis para el parámetro λ de una distribución de Poisson<br />
a. Sea una variable X que tiene la distribución de Poisson. Supóngase que experimentalmente<br />
se ha encontrado un valor x = 4.<br />
Sea la hipótesis nula:<br />
H0: λ = 2<br />
y el conjunto de hipótesis alternativas:<br />
H1: λ > 2<br />
Supóngase que se desee verificar a H0 con un nivel de significación igual a 0,05.<br />
b. Evidentemente, la región crítica estará totalmente a la derecha de la región de no rechazo.<br />
Sea x el punto frontera entre ambas regiones.
Debe ser:<br />
P(I) = P(X ≥ x) ≤ 0,05 ⇔ ∑ ∞ −λ<br />
e<br />
i=<br />
x i!<br />
λ<br />
i<br />
≤ 0,05<br />
PH 22<br />
Buscando en la tabla de la figura PH VIII.a para λ = 2 el mayor x para el cual<br />
P(X ≥ x) ≤ 0,05 se encuentra x = 6.<br />
Por lo tanto la región crítica será:<br />
RC : X ≥ 6<br />
Como el valor hallado experimentalmente fue:<br />
x = 4 ∉ RC<br />
no hay motivo para rechazar la hipótesis nula H0 con un nivel de significación igual a 0,05.
P(X ≥ x) = ∑ ∞ = i −λ<br />
i<br />
e λ<br />
i=<br />
x i !<br />
x λ = 0.2 λ = 0.3 λ = 0.4 λ = 0.5 λ = 0.6<br />
0 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000<br />
1 .1812692 .2591818 .3296800 .393469 .451188<br />
2 .0175231 .0369363 .0615519 .090204 .121901<br />
3 .0011485 .0035995 .0079263 .014388 .023115<br />
4 .0000568 .0002658 .0007763 .001752 .003358<br />
5 .0000023 .0000158 .0000612 .000172 .000394<br />
6 .0000001 .0000008 .0000040 .000014 .000039<br />
7 .0000002 .000001 .000003<br />
x λ = 0.7 λ = 0.8 λ = 0.9 λ = 1.0 λ = 1.2<br />
0 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000<br />
1 .503415 .550671 .593430 .632121 .698806<br />
2 .155805 .191208 .227518 .264241 .337373<br />
3 .034142 .047423 .062857 .080301 .120513<br />
4 .005753 .009080 .013459 .018988 .033769<br />
5 .000786 .001411 .002344 .003660 .007746<br />
6 .000090 .000184 .000343 .000594 .001500<br />
7 .000009 .000021 .000043 .000083 .000251<br />
8 .000001 .000002 .000005 .000010 .000037<br />
9 .000001 .000005<br />
10 .000001<br />
x λ = 1.4 λ = 1.6 λ = 1.8 λ = 1.9 λ = 2.0<br />
0 1.0000000 1.0000000 1.0000000 1.0000000 1.0000000<br />
1 .753403 .798103 .834701 .850431 .864665<br />
2 .408167 .475069 .537163 .566251 .593994<br />
3 .166502 .216642 .269379 .296280 .323324<br />
4 .053725 .078813 .108708 .125298 .142877<br />
5 .014253 .023682 .036407 .044081 .052653<br />
6 .003201 .006040 .010378 .013219 .016564<br />
7 .000622 .001336 .002569 .003446 .004534<br />
8 .000107 .000260 .000562 .000793 .001097<br />
9 .000016 .000045 .000110 .000163 .000237<br />
10 .000002 .000007 .000019 .000030 .000046<br />
11 .000001 .000003 .000005 .000008<br />
x λ = 2.5 λ = 3.0 λ = 3.5 λ = 4.0 λ = 4.5 λ = 5.0<br />
0 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000<br />
1 .917915 .950213 .969803 .981684 .988891 .993262<br />
2 .712703 .800852 .864112 .908422 .938901 .959572<br />
3 .456187 .576810 .679153 .761897 .826422 .875348<br />
4 .242424 .352768 .463367 .566530 .657704 .734974<br />
5 .108822 .184737 .274555 .371163 .467896 .5559507<br />
6 .042021 .083918 .142386 .214870 .297070 .384039<br />
7 .014187 .033509 .065288 .110674 .168949 .237817<br />
8 .004247 .011905 .026739 .051134 .086586 .133372<br />
9 .001140 .003803 .009874 .021363 .040257 .068094<br />
10 .000277 .001102 .003315 .008132 .017093 .031828<br />
11 .000062 .000292 .001019 .002840 .006669 .013695<br />
12 .000013 .000071 .000289 .000915 .002404 .005453<br />
13 .000002 .000016 .000076 .000274 .000805 .002019<br />
14 .000003 .000019 .000076 .000252 .000698<br />
15 .000001 .000004 .000020 .000074 .000226<br />
16 .000001 .000005 .000020 .000069<br />
17 .000001 .000005 .000020<br />
18 .000001 .000005<br />
19 .000001<br />
Figura PH VIII.a<br />
Distribución de Poisson<br />
PH 23
PH IX<br />
Comparación de distribuciones teóricas y experimentales<br />
PH IX.1<br />
PH 24<br />
a. Hasta el momento, el problema que se ha encarado consistía en rechazar o no hipótesis<br />
hechas sobre parámetros correspondientes a distribuciones cuya forma general era conocida.<br />
Sin embargo, puede ocurrir que no se esté seguro acerca de dicha forma general.<br />
PH IX.2<br />
Ejemplo 1º: Los buques mercantes de un cierto tipo estuvieron expuestos durante 400 días a<br />
todo tipo de accidentes. Sea X la cantidad de accidentes que ocurren en un barco<br />
determinado durante esos 400 días. Supóngase que se hayan registrado los siguientes datos:<br />
Cantidad de accidentes (X) 0 1 2 3 4 5 6<br />
Cantidad de barcos con X accidentes 1448 805 206 34 4 2 1<br />
Se pregunta si estos datos justifican o no la hipótesis de que X tiene una distribución de<br />
Poisson.<br />
Ejemplo 2º: Sea R la variable aleatoria correspondiente a la resistencia de un cierto tipo de<br />
conductor eléctrico.<br />
Supóngase que al sacar 20 muestras se obtuvieron los siguientes valores:<br />
9,8 14,5 13,7 7,6 10,5 9,3 11,1 10,1 12,7 9,9<br />
10,4 8,3 11,5 10,0 9,1 13,6 12,9 10,6 8,9 9,5<br />
Se pregunta si estos datos justifican o no la hipótesis de que R tiene una distribución normal.<br />
Ejemplo 3º: Se probaron 20 tubos de rayos catódicos y sus vidas en meses arrojaron los<br />
siguientes valores:<br />
7,2 37,8 49,6 21,4 67,2 41,1 3,8 8,1 23,2 72,1<br />
11,4 17,5 29,8 57,8 84,6 12,8 2,9 42,7 7,4 33,4<br />
Se pregunta si estos datos justifican o no la hipótesis de que la variable V correspondiente a<br />
la duración de los tubos tiene una distribución exponencial.<br />
Notar que en todos estos ejemplos se tenía un “pálpito” previo acerca de cual era la<br />
distribución del caso, y lo que se preguntaba era si dicho “pálpito” era justificado o no.<br />
a. Sea el siguiente caso:<br />
En la realización de un experimento aleatorio, según una cierta hipótesis H0 la variable<br />
aleatoria X puede asumir los valores x1, ..., xk, siendo P(X = xi) = pi. A estas probabilidades<br />
se las llamaran probabilidades teóricas.<br />
Sean n repeticiones de dicho experimento y sean n1, ..., nk las cantidades de veces que<br />
aparecen los resultados x1, ..., xk respectivamente. Evidentemente será n1 + ... + nk = n.<br />
Sea la variable:<br />
k<br />
2<br />
( ni<br />
− npi<br />
)<br />
V = ∑<br />
i= 1 npi<br />
[1]
PH 25<br />
que, a primera vista, puede ser una medida adecuada de la discrepancia en valor absoluto<br />
entre los valores medios teóricos npi y los obtenidos en la muestra.<br />
Un teorema muy importante debido a K. Pearson establece que si la hipótesis H0 es cierta,<br />
cuando n tiende a infinito la distribución de V tiende a una distribución χ 2 con k – 1 grados<br />
de libertad.<br />
Evidentemente esto también ocurrirá aproximadamente para n suficientemente grande.<br />
Por lo tanto la hipótesis nula será rechazada con un nivel de significación igual a 0,05<br />
cuando la variable V asuma un valor superior a 2<br />
χ<br />
0, 05;<br />
k−1<br />
.<br />
b. Por ejemplo:<br />
Se tira un dado 6000 veces y los resultados obtenidos son:<br />
n1 = 800 n2 = 1080 n3 = 950 n4 = 1086 n5 = 1304 n6 = 780<br />
Sea la hipótesis:<br />
1<br />
H0: El dado es perfecto ⇔ p1 = p2 = p3 = p4 = p5 = p6 = 6<br />
Entonces según [1] es:<br />
PH IX.3<br />
1 2 2 2 2 2 2<br />
v = 1000 (200 + 80 + 50 + 86 + 304 + 220 ) = 197,112 [2]<br />
y como según la tabla de χ 2 para α = 0,05, k = 6 – 1 = 5 es:<br />
se tiene entonces la región crítica:<br />
χ<br />
2<br />
0,<br />
05;<br />
5<br />
= 11,07<br />
RC : V > 11,07<br />
Como el valor obtenido en [2] cae dentro de esta región crítica se tiene que debe rechazarse<br />
a H0.<br />
a. En el ejercicio anterior se proponía una distribución teórica completa, y el problema<br />
consistía en tratar de averiguar si los datos experimentales podían o no provenir de dicha<br />
distribución.<br />
Ahora se propondrá una distribución teórica de la cual se ignora uno de sus parámetros, y el<br />
problema consistirá en tratar de averiguar si los datos experimentales pueden o no provenir<br />
de dicha distribución. El valor del parámetro que se considerará será su estimación máximo<br />
verosímil hallada en base a los datos experimentales obtenidos.<br />
b. Sea el mismo ejemplo 1º indicado en PH IX.1.<br />
Si la distribución es en efecto la de Poisson se tiene que (ver [1] de IE IV):<br />
ˆ 0 ⋅1448<br />
+ 1⋅<br />
805 + 2 ⋅ 206 + 3⋅<br />
34 + 4 ⋅ 4 + 5 ⋅ 2 + 6 ⋅1<br />
λ = x =<br />
= 0,5404<br />
1448 + 805 + 206 + 34 + 4 + 2 + 1<br />
Se tiene que en este caso es:
n = 1448 + 805 + 206 + 34 + 4 + 2 + 1 = 2500<br />
ˆp 0 = p(X = 0) = e -0,5404 = 0,5825 ⇒ ˆp 0<br />
ˆp 1 = p(X = 1) = e -0,5404 (0,5404) = 0,3148 ⇒ n ˆp 1 = 787<br />
ˆp 2 = p(X = 2) = e -0,5404<br />
2<br />
( 0,<br />
5404)<br />
= 0,0850 ⇒ n ˆp 2 = 213<br />
ˆp 3 = p(X = 3) = e -0,5404<br />
2!<br />
( 0,<br />
5404)<br />
3!<br />
3<br />
n = 1456<br />
= 0,0153 ⇒ n ˆp 3 = 38<br />
ˆp 4,<br />
5,<br />
6 = 1 – p(X ≤ 3) = 1 – (0,5825 + 0,3148 + 0,0850 + 0,0153) = 0,0024 ⇒ ˆp 4,<br />
5,<br />
6<br />
( 1448 −1456)<br />
v =<br />
1456<br />
2<br />
( 805 − 787)<br />
+<br />
787<br />
2<br />
( 206 − 213)<br />
+<br />
213<br />
2<br />
+<br />
( 34<br />
− 38)<br />
38<br />
2<br />
+<br />
n = 6 [3]<br />
( 7<br />
− 6)<br />
6<br />
2<br />
= 1,273412<br />
PH 26<br />
En este caso hay 5 sumandos y uno de los parámetros de la distribución es inferido en base a<br />
los resultados experimentales.<br />
Según Pearson en este caso la distribución de V será χ 2 con (n – 1) – 1 = n – 2 grados de<br />
libertad, es decir con tres grados de libertad.<br />
Como según la tabla de χ 2 para α = 0,05 y k = 3 es:<br />
resulta una región crítica:<br />
y como resultó:<br />
2 χ 0,05;3 = 7,81<br />
RC : V > 7,81<br />
1,273412 ∉ RC<br />
no se rechaza la hipótesis de que los datos experimentales obtenidos pertenecen en efecto a<br />
una distribución de Poisson.<br />
c. Observación importante:<br />
Notar que en [3] se refundieron en una sola categoría las estimaciones de P(X = 4), P(X = 5)<br />
y P(X = 6), considerándose en su lugar a la estimación de P(X = 4 ∪ X = 5 ∪ X = 6) a la<br />
que simbolizó como ˆp 4,<br />
5,<br />
6 .<br />
PH IX.4<br />
Esto se debe a lo siguiente (ver P. Hoel “Introduction to Mathematical Statistics”, pág. 167):<br />
“La experiencia y las investigaciones teóricas indican que este método de prueba de<br />
“hipótesis es generalmente satisfactorio siempre que (ver [1]) ni ≥ 5 ∀i y k ≥ 5.<br />
“Si algún ni < 5, conviene reunir en una sola a “celdas” adjuntas hasta que se cumpla lo<br />
“arriba indicado”.<br />
a. Hasta el momento se han considerado únicamente casos en que las distribuciones eran<br />
discretas.<br />
Supóngase que los valores asumidos por la variable continua X hayan sido tales que:
Veces<br />
PH 27<br />
X ≤ 9,5 10 < X ≤ 10,5 11 < X ≤ 11,5 12 < X ≤ 12,5 13 < X ≤ 13,5 14 < X ≤ 14,5<br />
9,5 < X ≤ 10 10,5 < X ≤ 11 11,5< X ≤ 12 12,5 < X ≤ 13 13,5 < X ≤ 14<br />
1 0 2 1 1 2 0 4 7 6 13<br />
14,5 < X ≤ 15 15,5 < X ≤ 16 16,5 < X ≤ 17 17,5 < X ≤ 18 18,5 < X ≤ 19 19,5 < X ≤ 20<br />
15 < X ≤ 15,5 16 < X ≤ 16,5 17 < X ≤ 17,5 18 < X ≤ 18,5 19 < X ≤ 19,5<br />
14 15 13 24 15 19 23 22 12 12 7<br />
20 < X ≤ 20,5 21 < X ≤ 21,5 22 < X ≤ 22,5 23 < X ≤ 23,5 24 < X ≤ 24,5 X > 25<br />
20,5 < X ≤ 21 21,5 < X ≤ 22 22,5 < X ≤ 23 23,5 < X ≤ 24 24,5 < X ≤ 25<br />
6 8 6 4 2 2 0 3 0 0 1<br />
n = 250<br />
Haciendo los cálculos del caso resulta:<br />
n 1<br />
1<br />
n<br />
m ˆ = x = ∑ xi<br />
= 17,<br />
0<br />
ˆ σ<br />
2<br />
=<br />
2<br />
∑ ( xi<br />
− x)<br />
= 7,<br />
1 ⇒ ˆ σ = 2,<br />
7<br />
n i=<br />
1<br />
X n −1<br />
X<br />
i=<br />
1<br />
Sea la hipótesis nula:<br />
H0: los datos provienen de una distribución normal.<br />
Divídanse los datos experimentales en 5 categorías:<br />
A1: X ≤ 12 A2: 12 < X ≤ 15 A3: 15 < X ≤ 18 A4: 18 < X ≤ 21 A5: X > 21<br />
Teóricamente, si H0 es cierta:<br />
⎛12 −17<br />
⎞<br />
p1 = P(A1) = P(X ≤ 12) = FN(0,1) ⎜ ⎟ = 0,03<br />
⎝ 2,<br />
7 ⎠<br />
⇒ np1 = 7,5<br />
⎛15 −17<br />
⎞ ⎛12 −17<br />
⎞<br />
p2 = P(A2) = P(12 < X ≤ 15) = FN(0,1) ⎜ ⎟ – FN(0,1) ⎜ ⎟ = 0,02 ⇒<br />
⎝ 2,<br />
7 ⎠ ⎝ 2,<br />
7 ⎠<br />
np2 = 50<br />
⎛18 −17<br />
⎞ ⎛15 −17<br />
⎞<br />
p3 = P(A3) = P(15 < X ≤ 18) = FN(0,1) ⎜ ⎟ – FN(0,1) ⎜ ⎟ = 0,41 ⇒<br />
⎝ 2,<br />
7 ⎠ ⎝ 2,<br />
7 ⎠<br />
np3 = 102,5<br />
⎛ 21−<br />
17 ⎞ ⎛18 −17<br />
⎞<br />
p4 = P(A4) = P(18 < X ≤ 21) = FN(0,1) ⎜ ⎟ – FN(0,1) ⎜ ⎟ = 0,24 ⇒<br />
⎝ 2,<br />
7 ⎠ ⎝ 2,<br />
7 ⎠<br />
np4 = 72,5<br />
⎛ 21−<br />
17 ⎞<br />
p5 = P(A5) = 1 – P(X ≤ 21) = 1 – FN(0,1) ⎜ ⎟ = 0,07<br />
⎝ 2,<br />
7 ⎠<br />
⇒ np5 = 17,5<br />
Experimentalmente se obtuvo:<br />
n1 = Veces que ocurrió X ≤ 12 = 7<br />
n2 = Veces que ocurrió 12 < X ≤ 15 = 49<br />
n3 = Veces que ocurrió 15 < X ≤ 18 = 109<br />
n4 = Veces que ocurrió 18 < X ≤ 21 = 67<br />
n5 = Veces que ocurrió X > 21 = 18<br />
y aplicando la fórmula [1] resulta:<br />
v =<br />
( 7<br />
− 7,<br />
5)<br />
7,<br />
5<br />
2<br />
+<br />
( 49<br />
− 50)<br />
50<br />
2<br />
( 109 −102,<br />
5)<br />
+<br />
102,<br />
5<br />
2<br />
+<br />
( 67<br />
− 72,<br />
5)<br />
72,<br />
5<br />
2<br />
+<br />
( 18<br />
−<br />
17,<br />
5)<br />
17,<br />
5<br />
2<br />
= 0,82
PH IX.5<br />
PH 28<br />
En este caso hay 5 sumandos y dos de los parámetros de la distribución (m y σ) son<br />
inferidos en base a los resultados experimentales.<br />
Según Pearson en este caso la distribución de V será χ 2 con (n – 1) – 2 = n – 3 grados de<br />
libertad, es decir con dos grados de libertad.<br />
Como según la tabla de χ 2 para α = 0,05 y k = 2 es:<br />
resulta que la región crítica es:<br />
y como resultó:<br />
2<br />
0,<br />
05;<br />
2<br />
χ = 5,99<br />
RC: V > 5,99<br />
v = 0,82 ∉ RC<br />
resulta que no se rechaza la hipótesis nula, que consistía en que los datos experimentales<br />
provenían de una distribución normal.<br />
Se hace notar lo siguiente:<br />
1º. En PH IX.2 la hipótesis nula consistía en una distribución teórica completamente especificada, y<br />
si la variable V indicada en [1] constaba de k sumandos, su distribución era una distribución χ 2<br />
con k – 1 grados de libertad.<br />
2º. En PH IX.3 la hipótesis nula consistía en una distribución teórica en la cual un parámetro era<br />
estimado en base a los datos experimentales recogidos, y si la variable V indicada en [1]<br />
constaba de k sumandos, su distribución era una distribución χ 2 con (k – 1) – 1 grados de<br />
libertad.<br />
Generalizando:<br />
Si la hipótesis nula consiste en una distribución teórica en la cual r parámetros son estimados en<br />
base a los datos experimentales recogidos, y si la variable V indicada en [1] consta de k<br />
sumandos, su distribución será una distribución χ 2 con (k – 1) – r grados de libertad.
Problemas sobre pruebas de hipótesis<br />
PH 29<br />
PH 1 Sea X la variable aleatoria correspondiente a la vida de una producción de tubos<br />
fluorescentes. Probados 100 tubos resultó x = 1570 y s = 120. Se pide verificar la hipótesis:<br />
H0: 1600<br />
X = m<br />
siendo la hipótesis alternativa:<br />
H1: 1600<br />
X < m<br />
con un nivel de significación igual a 0,05.<br />
PH 2 Una universidad afirma que sus profesores cobran en promedio $ 7200 anuales, con una<br />
desviación típica de $ 2000. En una muestra al azar de 400 profesores se encontró un<br />
promedio de $ 6000 anuales. Se pide:<br />
a) Con un nivel de significación igual a 0,05, verificar si la afirmación de la facultad es<br />
cierta.<br />
b) Si el sueldo medio anual verdadero fuera de $ 6000 con la misma desviación típica,<br />
indicar el error tipo II que se cometería al aceptar la afirmación de la facultad.<br />
PH 3 Un fabricante de arandelas afirma que el espesor de las mismas sigue una ley normal<br />
(1 ; 0,1). Se toman 100 arandelas y resulta que el espesor promedio resultó 0,99.<br />
Con un nivel de significación de 0,05, comprobar la afirmación del fabricante.<br />
PH 4 Sea un nuevo producto farmacéutico que tiene una cierta toxicidad. El proceso de<br />
fabricación determina una distribución para la toxicidad a la cual corresponde una variable<br />
aleatoria normal T.<br />
Se sabe que una toxicidad de 130 ya es ligeramente nociva, y el fabricante desea tener una<br />
probabilidad igual a 0,99 de que el 99,9% de las píldoras que salen al mercado no superen<br />
dicho valor. Con ese fin analizó 10000 píldoras, lo que arrojó un resultado de t = 97 y<br />
s = 10.<br />
Indicar si este resultado determina o no que el fabricante logró su objetivo.<br />
PH 5 Una máquina embolsadora de papas debe estar regulada para embolsar 112 Kg / bolsa por lo<br />
menos. Un inspector sospecha de dicha regulación, toma 8 bolsas al azar y obtiene los<br />
siguientes resultados:<br />
115 110 109 107 108 102 111 113<br />
Indicar si las sospechas del inspector son justificadas o no.<br />
PH 6 Una máquina ha producido arandelas de 0,05 cm de espesor. Para comprobar si la máquina<br />
sigue en buenas condiciones se toma una muestra de 10 arandelas resultado x = 0,0515 cm<br />
y s = 0,003 cm. Supóngase que la distribución del espesor de las arandelas es normal. Se<br />
pide averiguar si la máquina está o no en buenas condiciones de ajuste con un nivel de<br />
significación igual a 0,05.<br />
PH 7 En una chimenea se ha instalado un sistema de precipitación de sólidos con el cual se cree<br />
que la concentración de los mismos bajará de 1,8 g/m 3 a 0,6 g/m 3 . Puesto en marcha el<br />
nuevo sistema se efectuaron 10 mediciones cuyos resultados fueron:<br />
0,6 0,62 0,63 0,64 0,65 0,66 0,66 0,67 0,73<br />
¿Cree Usted que el nuevo sistema cumple con lo deseado?
PH 30<br />
PH 8 De un conjunto de 17 plantas, 9 de ellas fueron sometidas a un tratamiento químico, y el<br />
número de frutas que dieron fue respectivamente:<br />
17 27 18 25 27 29 27 23 17<br />
A las 8 plantas restantes no se las sometió a ningún tratamiento y su rendimiento en frutos<br />
fue:<br />
16 16 20 16 20 17 15 21<br />
Indicar si puede considerarse que el tratamiento fue eficaz.<br />
PH 9 Sea X la variable aleatoria correspondiente al nivel mental de los alumnos de la<br />
universidad A, y sea Y la variable aleatoria correspondiente al nivel mental de los alumnos<br />
de la universidad B. Se toman 20 alumnos de la universidad A y 22 de la B. Se halló<br />
x = 90, 2<br />
s = 100, y = 110 y 2<br />
s = 80.<br />
X<br />
Y<br />
Se desea saber con un nivel de significación igual a 0,01 si hay una diferencia significativa<br />
entre los alumnos de esas dos universidades.<br />
PH 10 Sea un proceso de fabricación de bombas de luz con las cuales se obtiene una calidad tal<br />
que a lo sumo el 1 % de las bombas resultan malas. Se introduce una modificación en el<br />
proceso de fabricación que, se espera, no altere dicha calidad. Se fabricaron 300 bombas<br />
con la nueva modificación de las cuales 5 resultaron malas. Se pide:<br />
a) Determinar si se puede establecer conclusivamente que ha habido un deterioro en la<br />
calidad con un nivel de significación igual a 0,05.<br />
b) Usando la región crítica hallada para a), hallar P(II) si la calidad de las bombas bajó del<br />
1 % de malas a 2 % de malas.<br />
PH 11 Se quiere verificar la hipótesis de que el nacimiento de varones sigue la ley binomial con<br />
p = ½ . En una muestra de 100 000 nacimientos resultaron 48 600 varones y 51 400<br />
mujeres. Indicar si este resultado confirma o no la hipótesis con un nivel de significación<br />
de 0,005.<br />
PH 12 La flor de una cierta planta de adorno puede venir de 4 colores distintos. Un experimento<br />
sobre 217 plantas arrojó los siguientes resultados:<br />
Color: A B C D<br />
Cantidad: 120 48 36 13<br />
Según las leyes de la genética la probabilidad de aparición de dichos colores es:<br />
P(A) = 9<br />
16 , P(B) = 3<br />
16 , P(C) = 3<br />
16 y P(D) = 1<br />
16 .<br />
Indicar si los resultados obtenidos concuerdan con esta ley con un nivel de significación de<br />
0,05.<br />
PH 13 Sea una muestra de 60 circuitos impresos bastante complejos.<br />
Aparecieron:<br />
Con 0 falla: 32 circuitos<br />
Con 1 falla: 15 circuitos<br />
Con 2 falla: 9 circuitos<br />
Con 3 falla: 4 circuitos<br />
Indicar si las cantidades de fallas de este tipo de circuito sigue una ley de Poisson con<br />
P(1) = 0,05.
PH 14 Se supone que la duración de las llamadas telefónicas tienen una duración exponencial<br />
negativa:<br />
P(T < t) =<br />
0 para t < 0<br />
1 – e - λ t para t > 0<br />
PH 31<br />
Se hacen 100 llamadas, y sus y sus duraciones respectivas fueron tales que:<br />
T ≤ 1 : 42 1 < T ≤ 2 : 21 2 < T ≤ 3 : 12<br />
3 < T ≤ 4 : 12 4 < T ≤ 5 : 7 T > 5 : 6<br />
Supóngase que el promedio de duración de dichas llamadas haya sido t = 1,98 minutos.<br />
Se pide hallar con un nivel de significación igual a 0,05 si los datos obtenidos provienen en<br />
efecto de una distribución exponencial negativa.