Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Lívro Noções de Probabilidade e Estatística - Magalhães parte 2 (1), Notas de estudo de Oceanografia

probabilidade e estística

Tipologia: Notas de estudo

2014
Em oferta
30 Pontos
Discount

Oferta por tempo limitado


Compartilhado em 17/05/2014

jennifer-venturim-12
jennifer-venturim-12 🇧🇷

4.5

(33)

1 documento

1 / 97

Documentos relacionados


Pré-visualização parcial do texto

Baixe Lívro Noções de Probabilidade e Estatística - Magalhães parte 2 (1) e outras Notas de estudo em PDF para Oceanografia, somente na Docsity! t68 Capítulo 6: Variáveis Aleatórías Contínuas ruxilia na atribuição de probabilidades. Assim, paÍa a variável aleatória contínua X representando a profundidade do lençol de água, a função densidade f é dada )0r r(,) : { tt:', para2}<r<100; pafar ( 20 our > 100. Tendo em vista que, nesse exemplo, a função densidade é bastante ;imples, a probabilidade de que a profundidade do lençol esteja em qm dado rrtcrvalo pode ser calculada com o uso de áreas de figuras planas. Assi\r, para rbter a probabilidade de uma profundidade pelo menos igual a 25, mas injerior a ,, portanto, P(25 < X < 29) : 4180. Considerando o caso geral, vamos nos ocupar agora em formalizaÍ as déias discutidas anteriormente. Faremos isso através da definição apresentada a eguir. )efinição 6.1: Função densidade de probabilidade Dizemos que /(r) é uma função contínua de probabilidade ou função ensidade de probabilidade para uma variável aleatória contínua X, se satisfaz tuas condições: i) Í(r) ) 0, para todo r e ( - oo, oo); ii) A área definida por f (r) é igual a 1. (t. I Introdução Com o auxílio do cálculo diferencial e integral, podemos caracterizar a condição ii) através de r6 I f@)dr:1.J-- Da mesma forma, para calcular probabilidades, temos que para a 1 b, f(r) dr ; a integral, acima, indica a írea sob a função / definida pelo intervalo [4, b]. Note que, pela forma como atribuímos as probabilidades no caso contínuo, teremos áreazero sob qualquer valor individual, isto é, P(X: k): O para qualquer k. Portanto, em se tratando de variáveis aleatórias contínuas, a probabilidade de ocorrência de um valor isolado é sempre zero e, consequentemente, as probabilidades calculadas sobre os intervalos lu,,bl,la,b), (o,b) e (a, b) são as mesmas, para qudisquer valores de a e b. Exemplo 6.2: Arqueólogos estudaram uma certa região e estabeleceram um rnodelo teórico para a variável C, comprimento de fósseis da região (em cm). Suponha que C é uma variável aleatória contínua com a seguinte função densidade de probabilidade: tG): se0(c120; caso contrário. É imediato observar que /(c) é positiva. Através do gráfico da função, apresentado a seguir, podemos verificar com auxílio da fórmula da área de trapézio que 1r3 área sob lk): ao : an x 2o : 1. 2 Concluímos que /(c) é efetivamente uma densidade. Tendo em vista a forma simples de /(c), o cálculo de probabilidades de interesse para esse exemplo poderá ser feito sem dificuldades através de áreas' 169 P(o<x<b): I-:: {y'*"" D 170 Capítulo 6: Variáveis Aleatóriqs &t Introduçao ë, rssim, temos que P(C < B) : 7lZS. tr Exemplo 6.3; Num teste educacional com crianças, o tempo para arealização de Umit bateria de questões de raciocínio verbal e lógico é medido e anotado para ser €ttttlparado com um modelo teórico. Este teste é utilizado para identificar o descnvolvimento das crianças e auxiliar a aplicação de medidas corretivas. o ütodelo teórico considera T, tempo de teste rem minuto,s, como uma variável alcatória contínua com função densidade de probabilidade dada por: h(t-+), se8(ú<L0; h, se10(t<15; 0, caso contrário. o gráfico da função densidade é apresentado a seguir. Deve ser notado que, pela tlcrÍ'inição de /(ú), ela se anula parat ( 8 ou ú > 15. 171 [] 1140 A probabilidade de um fóssil, escorhido ao acaso nessa região, ap.comprimento inferior a. s-"- poa" ,", ã"rc"r"a" diretamenteìo granco oadensidade de probabitiauo",.ãrï;;ï figura a seguir: Í(t): J (t) O cálculo da probabilidade envoÌve a soma de duas áreas: '.qlll!.F 176 Determine: (ltpltttlo ô: VuricÍveis Alecttórius CctntínuaE e{auaupoì: I a. P(X > J).{,,.. . t b. p(l. ;ç < 4).' c.P(X <BlX>r)., - d. Um número b tal que,F(y s b): 0,6!_e. o vator esperado, à variância " árn"a;d" X. L \3' A quantia gasra anuarmenre, em mirhões g" r.1i:, na manurençao oo ugr)tro.rnuma cidade do inrerior e r"pr"r"ntJãi""tu uuriau"r I, com densidad/ar.r, ,.^", ffu):{i,-t, se 0,5{yq2. ( U, caso contrário. Obtenha: a. P(y < 0,8). b. P(Y > 1,51I'> 1). c. O valor esperado e a variância de )..d. A medianadey. 4' o grrifico abaixo representa a densidade de uma variáver areatória x. a. Obtenha o valor a" ol " ,/. ..,..,.Ir.I)ctcr.min? p(X > 0l-r. s).' tr. C"'irlcute A4d(X), E(X) e Vor(X) ã.2 Príncipais Modelos Contínuos 5. Numa certa região, fósseis de pequenos animais são freqüentemente encontrados e um arqueólogo estabeleceu o seguinte modelo de probabilidade para o comprimento, em centímetros, desses fósseis. 41 r 18: 8(z(10; 10(r(11; ( h", Í(*):J i" * *' [ il,' a. Faça um gráfico da função densidadé; ''- b. Para um fóssil encontrado nessa região, determine a probabilidade do comprimento ser inferior a 6 centímetros? E de ser superioi a 5 mas inferigr a 10,5 cm? ( c. Encontre o valor esperado para o comprirnento dos fósseis da região. 6.2 Principais Modelos Contínuos Apresentamos, nesta seção, os principais modelos teóricos para variáveis ttlcatórias contínuas. Vimos que, para caracterizar completamente uma variável ttlcatória contínua, precisamos fornecer sua função denìidade de probabilidade 11rrc, segundo sua definição, é uma função positiva e com integral iguãt a t. DcfiniçQo 6.4: Modelo Uniforme Contínuo uma variável aleatória x tem distribuição (Iniforme contínua no irrtcrvalo fa,bl, a < b, se sua função densidade de próbabilioáoe o dada por: caso contrário. a1r1 caso contrário. f (") :{ b-a' 0, Usaremos a notação X - [J[a,b] para t lrriforme Contínuo no intervalo considerado. queXsegueomodelo Note que não há restrição de valores paÍa cL e b, exceto o fato de a < b. A f rigura 6.I mostra a densidade do modelo U[a,b], para a)b > 0. tr t78 Capítulo 6: Variáveis Aleatórias Figura 6.7: Densidade Ilnifurme Contínua. o modelo uniforme pressupõe que os valores possíveis para a variál aleatória têm todos a mesma probabilidade de ocorrência. seu válor esperado sua variância são obtidos através do cálculo de integrais, de tal forma que: f---_. b2+ab+a2 -t e} logo, b2+ab+a2 o2 : E(xz) - p, : -(+)' Exemplo ó.5.' com o objetivo de verificar a resistência à pressão de água, oi técnicos de qualidade de uma empresa inspecionam os tubos ãe pvc produzidos os tubos inspecionados têm 6 metros de comprimento e são submetidos a pressões até, o aparecimento do primeiro vazamento, cuja distância a uma dag extremidades (fixada à priori) é anotada para fins de análise posterior. Escolhe-se um tubo ao acaso para ser inspecionado. Queremos calcular a probabilidade de que o vazamento esteja, no máximo, a I metro das extremidades. vamos denotar por x a variável areatória que indica a distâncie correspondente ao vazamento. Admitindo igual probabilidade de ocorrência em "-! ô,2 Principais Modelos Contínuos 179 torlos os pontos, temos que X - U[0,6], com função densidade de probabilidade clncla por r@) : {',3; lï,ï=*ï,ã.1; Para calcular a probabilidade de X e {[0,1]U [5,6]], podemos obter as drças dos dois retângulos hachuriados na figura a seguir. l@) segrrc, sem maiores dificuldades, que a probabilidade desejadaê 113. Esse mesmo cálculo poderia ser feito através de integrais da seguinte P(x e {[0,1] u [5,6]]) : Note que os intervaloj [0, 1] e [5,6] são disjuntos e, portanto, a P(0<x<1)+P(5<x<6) l"'*0. * l,"uo. rrl r16_l -L -l6lo' 6ls 1651 6-o+6-6:5' plob.rbilidade iltlcrvalo. áu ,uu uniáo é, ffsoma das piobabilidades de ocorrência de cada;[iElf\ /l tr Definição 6.5: fuIodelo Exponencial Uma variável aleatória contínua X,segue o modelo Exponencial "o_ puram.tro , 180 A densidade está X - Exp(a) para Capítulo 6: Varitiveis Alecttórias o assumindo valores não ) 0 se sua densidade é ) 0: negati representada graficamente na Figura 6.2 e adotaremos a notÉindicar que X tem distribuiçã" ËÇ;;;;ju, o" parâmerro c. r@): f ae-o*, rI o, ", caso contrário. Fígura 6.2 : Densídade Exponencial. Í(x) . para calcular probabilidades com aintegrll correspondente, jâ qu" não-t".1ïo. exenrplos considerados até aqui. arri., -'^' Exponencial, precisamos resolver g as figuras geométricas simples doJ Note que a inclusão acirna. Para obter a ;rnrÍos, porém, não P(n < X < b) : -[,," oe-.,:I;dr : - "-a:t:1rt : s-ítn, * "-art ou não dos extremos a e ó não altera o cálculo efetuado média e a variância, véìmos fazer esse 6,2 I'rincipais Modelos Contínuos t81 êxprcssões finais. Temos, para X - Exp(a), F:Ila e o2:I/az. Exe ntplo 6.6: IJma indústria fabrica lâmpadas especiais que ficam em operação efiptinuamente. A empresa oferece a seus clientes a garantia de reposição, caso a lâlnpada dure menos de 50 horas. A vida útil dessas lâmpadas é modelada através drr clistribuição Exponencial com parâmetro 1/8000. Determine a proporção de trucas por defeito de fabricação.' Cada lâmpada terá seu tempo de duração definido pela particular feirlização da variável aleatória. Isto é, a vida útil da lâmpada pode ser pensada ç(JlÌìo um valor escolhido de acordo com a densidade Exponencial de parâmetro l/t1000. Representemos, pela variável aleatória T, o tempo de vida da lâmpada, e assirn 7 - Exp(I18000). A probabilidade desejada será P(T <50) : /t'#"- #'dt- 1 - s-*s : 0,006. l)ussa forma, a proporção de trocas por defeito de fabricação será de nlrloximadamente 0,67o. Esse número é relativamente pequeno, o que não ê, lfprpresa, tendo em vista que, como o parâmetro é a:1/8000, a duração média drrs lâmpadas é Lr - If a':8000 horas. tr A distribuição Exponencial tem sido amplamente utilizada nas áreas de l'Ísicn, engenharia, computação e biologia, entre outras. Variáveis como a vida útil dc equipamentos, tempos de falha, tempos de sobrevivência de espécies e irrlcrvalos entre solicitações de recursos são algumas das quantidades que têm sitlo modeladas, com bons resultados, pela Exponencial. Essa densidade tem, nincla, a vantagem de ter propriedades matemáticas interessantes, conforme ' ;:,:;;:ïïïï"ïïïÏ ;","0", em minuto s, entre emi s sões c onsecurivas de rurra fonte radioativa é uma variável aleatória com distribuição Exponencial de lrrrrâmetro a : 0,2. Vamos calcular a probabilidade de haver uma emissão em um irrtcrvalo inferior a 2 minutos. Temos, n2 P(x <D: Jno,z"-}'2:r 4*: - s-012t:13 = - "-0'a + 1 :0,33. Calculemosl ugoro, a probabilidade do intervalo ser superior ou igual a 7, sirbencJo-se que ele é superior ou igual a 5 minutos. será necessário aplicar a integração por catculo e, apenas, apresentamos os 7', 186 /\ I L i, Jr'I r'' Cup Ítu lo ô ; Vl1 yi1lyt6, i,1 A I ett Ítí riu;t apresentar tempo dã il t t l: I í, n'., ( | ""s"ti,J,"li;ï"1Ï* :i',:?' as. probabilidades de intervâlos com recurs o imporranre " " :: "t:ï:jl^",id,e n tes. .i n teruot o. n o 0".ì"' ï"r,,, * rs orr re n o u s o a u t aa "r i i. affi ï, # iï ;ïïï:ï iïìï Ëï; ."#P(X>s):pçX-tr,3-2, -/ q 3 ):P(Z>1/3) .r, i :0,5_p(0 Szq7, A rabera tu,,'ue- ^^r" :: ì- ' .t' : 0'5 - 0'7293 :0'3707' cerra probabiria"aa lPét pode ser utilizada 13^s1nti{o inverso, isro é, dado u I", : : o, " ;" ï (ï:, iï ;.5?;, ?;"1ïffi j: íï1.:ïi "."_o r o, qu i iJ;'ro:1i1,,110,"_qu" rà,, se aproxima de 0.4 é o ?oo7. ^^__., p: ou^ tobËËserá o uutora"ll-'rorò ò r , 0,399 ; ""rr"r;;;ã;J;"tï:rïSuponha, ar lï jËt:"ffi :ï:xï,;i;Ëïïï#lï:fi 'lfr ,;::,:Áí^ìP^,:, probabiridade 0,8. pera. simet); ;,"íu";ï;ï fï,Ji: ïJ*ç2, g,$, ,m:X ï::;:::^::,''l^:i::"':;;;ilï:o,uìì0"*;:';:-0,84Exemplo ó.8.. Doente" cnfro-r^ r "'vÌ wPurtanto d: -0184,traram-ento;";;;,;ïr":, sofrendo o" ":11u molésria, são submetidos a ua" -!o-i'"ï'ÏJ::ï;H;:ïtË*ï::ï .' '""a"r'"aã"il,. uïu ì*,idade Normc P(x>rT):11x-15' \/4- 77- 51 /4"J -) P ( A.probabilidade de ur "\uct'- (( u'< è <' 4 ) )nor a 20 dias ..'u n",lp-1ïenre, escoÌhii,ioÁí13ír!;,,u,cura inferi ias;;;;;Ë; P(x <,20) : e(4 - ts. 2o - 151 _ D/,7' v4 rt / ,,:\z < 2,5): 0,993g. uma questão interessanre seria saber o ,!riJ*:r;:ô- i :|:ï1".'"çã". de 25vo ao' p*i"n-,;'ï ïï:^ï.t"":l: máximo necessário paro & 'itc ien tes é i nrerpreradu^'.o-Àï'ï ;"tdf,i,:ï. ïj.;'"ff 'u o "on,un,o aJ'*cnc'rcamente escorhido. Assim, p.*iJ",ï", obter umìaro. r iar oïï:" ;";;;; )-r\z>t):0Ã582.bo,;P-' --- r 1 lhiãË Áo à"t^'"In' -^-:^^ - 1)Z Pt ittripuis Modelos Contínuos 187 P(X < t) :0,25, ,(#.'#):p(z< €etrr ,r uso da tabela (e alguma reflexão) obtemos t-15 -A:-0,67)t:13,66. il-u],#=ã ffi ffi ffi' 1N t-L5._ Jt ) : 0,25. r ,il 0r ,)''" Çorrclrrírnos, então, informando que 25% dos pacientes ficarão curados antes de, êpLox irnadamente, 14 dias. . considere agora que r00 pacientes são escolhidos ao acaso, quar seria o õtlnrcru esperado de doentes óurados em menos de rr dias? obtemos, lf,icirrlrnente, a probabilidade de um paciente genérico ser curado em menos de I Idl's. lirn seguida, essa probabilidade é interpietaau.o-à prú"ìça" de pacientes ãiliil ::',o em menos de 11 dias e é multiplicada por lOopaia óbter a resposta. I t'lllos, P(X<rr;:r( 11- 15, n.'t'' ",'1 ' jL 'ì t -, ) : P(z < -2) :0,0228. Errtii., para 100 pacientes, o número esperado com tempo de cura inferior a tlirrs será de 100 x O,0Z2B - 2 pacientes. x-75 v4 ll tr Na Tabela 6.1 apresentamos as expressões da média e da variância para us rrrodelos contínuos estudados até aqui. Tabela 6.1: Modelos contínuos - vsror esperado e variâncía. ,lv- /88 Cultítulo 6: Varidveis Aleatórias P ri t r c ipais M odelo s Contínuos lnnrnial, melhor será a aproximação. Nos casos em que certa assimetria estiver te, valores crescentes de n fornecerão melhores resultados. Densidade de Freqüência Figura 6,4: Aproximação Normal para o Modelo Binomíal. Para melhorar a aproximação, alguns autores introduzem a correção de corltinuidade no cálculo com a Normal. Esse mecanismo consiste em alterar de 0,5 unidade o valor com que se deseja calcular a probabilidade. A alteração para tuitis ou para menos depende, respectivamente, da probabilidade desejada excluir ou incluir a igualdade ao valor desejado. Por exemplo, teríamos, P(X > 50) - P(Y > 50,5) = P(Z > ) :0,9292. Note que, com relação a Y e Z, é indiferente se a desigualdade inclui ou não o sinal de igual. Para calcular a igualdade a um valor, digamos X : 50, criamos um intcrvalo artificial, pois com variáveis contínuas essa probabilidade seria zero. 189 ::: r: fl.'; :ï'1,:',":?, ilïïïj;.:ï: ::'.'"" i mp ortan re s em Es tarís ti ca M ;"ï,i""1ï:ïiïi:,,ïq"""'à''ï''HJ'ïï-iiJ;,ïï"ffi il';"rï:H';;i se refere à c,,o ,,,,,1ï:: da média. Uma outra razão daimnorÍÂn^i. r^ rÌ__ sua util' ""'"::l:u da p rtâ ciad;No; próximo "*;;;;, ï"ffi:XïffÏï,,fi|fà'*ação para outras - disrribuições. Exemnln tÇ o, ,.-t-_:- ara aproximar o modelo Bin;;;.lxeryrto 6.9.' Estudo do sindicato oo, n-.n;;:;; :,ooelo smomial' Fïï'ï:.',ï:*:'#:if ï#ffi " j#l':ï'ï,ï**fi :,"":il:í:; menos 50 com "rru ào"nçu ? 's' Qual seria a probabilidaJ" ã"; Admitindo o,ro "."oo ho-^:_i_ i:r:Ëii:$ìrnrïïËrlJr*i'ï', trï*#ïïï:ï:rïïï ;lï:#,Tlt":*'ilï*l" r":ï Ë.'r'":ï ub1,:,i?que conra o número torar r;ifffrliil""ï""ülâ:::;;;;;;;;Jï:::;;:ï,ïff :ï::;üïiï:r: 1,ffïJ[i:,i,ïil,ï;J,i']i1ïH"l ã f#ï,ï"11;"'::i,?fi; indicando que a so,uçãodada pela distribuição N;;;d ; ##X; sera u'e484; l histograma d" Bi;;iul e a densirran. n. ^1oi1"l' Na.Figura 6.4, representamos oa inãmiar " "ï""rrãÌ;ï';""ï'"""e1' ì baseúa no r"or",ãu ôentral do Lïmite ,,,''1o*l_:1r.!zaaa,1a aproxìmaçã";;;; eada Teorema ; * - _ uwrròrudue oa lormaÌ utili flo Canírrrt^ ? E* _ Ce t ite, um impo.tanie P(x>50):f1zoo\ 'tãn\ n )o'sro'7200-t' P(x >5o) - P(Y > 4s,s) : P(z > W, : o,e4l4; 50,5 - 60---------- \/ 42 n c píru r o 7 . Em g"'ur, q, *ì'ilï : ffi ,'ftïnï"r;"ïi r:: ilHf,ïffi :ï ; FT çap#ulo 6: Vartdvels Alearárlas t9l Assim, P(X :50) - p(4g,5< f < 50,5) - p150,5 - 60 -'/42ì 3^:r1::,". exaro da probabilidade fornece oa qualidade da aproximaçao. v _ 49,5_60.' > -õ-) :0,0182. valor 0,0190; mostrando, Note como o histograma se aproxima de um modelo simétrico e em lbrma Élrro (semelhante ao modelo Normal) à medida que caminhamos da esquerdo ir direita (valores crescentes de n). Pode também ser notado que a tvcrgência será mais râpida em situações em que a distribuição Binornial é' Ëpftrxirnitclitmente simétrica, o que ocorre para valores de p próximos a 112. '' Uma propriedade muito importante do modelo Normal, cuja CCtttotrstração será omitida, é aquela que garante que qualquer combinação lineAr de virriírveis Normais independentes, também, terâ distribuição Normal, Em €gtlrrs palavras, se X1 , Xz, .. ., X, formam uma seqüência de variáveis aleatóriaS N(tt,,r?) independentes è atta2,...,a,,, são constantes quaisquer, então g,r . fouxuterá distribuição Normal. Seus parâmetros são determinados a partir i=L dns propriedades do valor esperado e da variância, ou seja, '\tr 'n rL n, p*: E(DarXr):\n@rxr ) : Don E(Xn):Lorlu; i--r i:l i:l i--L oï : V"r(Do;Xr, ) : \var(arXr ) : \alvar(Xr) : l"l ol, i:L i.:l i.:l i:l liste resultado amplia, consideravelmente, o uso da Normal em várias sitUnçõeU, conforme pode ser notado nos exemplos a seguir. Iìxemplo 6.10: rJm serviço de fiscalização é criado para averiguar se garrafm de u,r", ""ito refrigerante contém, de fato, o volume especificado pelo fabricante. Parn tanto, 10 gariafas do produto são compradas no varejo, em várias regiões dn cidade. Cada uma dessas garrafas é esvaziada e o volume de seu conteúdo, que denotaremos por I/, é aferido. Uma vez obtidos os 10 valores, a média aritmética M é calculada e, se M < 290 mililitros (ml), a companhia é multada. Estudos na linha de produção do fabricante mostraram que variações sempre ocorrem' rnesmo ," os "rp""ificações forem seguidas. Por essa tazáo, considera-se o volume dO conteúdó das garrafas como seguindo um modelo Normal, com média P : 300 ml e desvio-padrão o:25 ml. Gostaríamos de calcular qual é a probabilidade de que o fabricante seja multado injustamente? A multa será injusta se, apesar de dentro das especificações, o valor de M for abaixo de 290 ml. Observe que isto pode ocorrer devido ànattreza aleatória do enchimento das garrafas. Como ilust ïÌïïrïït*::ïïx';i;;ïïJ;'rïïïiii:íf r::ïï,",Í;'.,rrlvator de n ;.;,.i;ï; temos assim p iguat a 0,2.;0,j " õ; ;.,ioo o" cada linharumentado, tomando os valores ro, sóÍil,roo P=0.3,n =10r[fl 'Àï'=' o'4l]Fn. Jl][ p=0.5,n=100  p=0.2,n =tO p=0.2,n =30 p=0.2,n=100 p=0.5,n=10 P=0.5,n =30 Figura 6.5: Histogramas para valores simulados da Binomíal i 3. Suponha que dada por: c. Supondo que um automóvel a probabilidade de que seja anos de uso? uma variável aleatória contínua tenha densidade de '-=F (itpítuIo ó; Vuridveit AIetttõritu 0<u<3; caso contrário. condições descri ano de uso? E t96 ï(r): a. Qual é o valor de k? b. Quanro valeb,ral que p(X > b) :5/gt t ïï:f:;t"::1iï,*,11"^" 1: ,,n amorrecedor de cerra marca emsujeitos a uso contínun ", *,.'"^ *::ï:":"""r o t Í aul contínua, medi'a "j":-:-r":e.ro, pode ser consideruOo "o.ã u.uid em ânôs o,,^"j-ïI*l ò,ç u loerad como ma var seguinre expressão: 1 a o ' suponha que a função ;il;;; é dada.l t res ão: 0{r{2' 24r{6; caso contrário. lI,+t', Ì0, f (r) :Í; : a' Verifique que a função-acima é, de fato, uma densidade.o. Sï:t é a probabiliãade d" "rn';r',;;óvel, sujeiro àsaclma, necessitar de froca de amortecedores antes de I1 e 3 anos? está há 3 anos com o mesm.ì ah^rr^^^Ã^,- necessário fazer a,.,t"t-o amortecedor, qual )ca antes de completar 4t fi;lí;r;"-no médio adequado para a troca do amorrecedor desses 5. O gráfico, a seguir. r X. _ epresenta a densidade de uma variável a. Verifìque que f (r) representa uma densidade.b. Escreva a expressão dà funçao. "- s 'o c. Calcute p(X < S/12). 5---' d. Determine um número c tal que p(X { c) : 112 ó. 6,J lirercícios t97 O acréscimo anual na área atingida por uma certa praga, numa região produtorit cle frutas, pode ser modelado por uma variável aleatória contínua, medida em hectares (10 mil m2), com densidade: (?", 0<z<1; I f@):{1-ã, 1(r13; I |. 0, caso contrário. a. Construa o gráfico dessa densidade. b. Qual seria a probabilidade da praga atingir entte 2 e 3 hectares esse ano? c. Que âreaserâatingida com507o decetteza? d. Determine o acréscimo médio anual na área atingida pela praga. suponha que o peso de recém-nascidos (em kg) pode ser considerado uma variável aleatória com a seguinte densidade: í fi"+rl, 01r12; I f@):1-h"**, 2<r16; I ( 0, caso contrário' Qual a probabilidade de, escolhendo ao acaso uma criança, ela ter peso: a. Inferiora3kg? b.Entrele4kg? c. Pelo menos 3 kg? 7. aleatória contínua a. Determine a mediana e a média.b. Calcule a variância. 10. A função apresentada, a seguir,aleatóriacontínua X. ....-F Ci t p / t t r I o ó ; Vet r i cí tt e i,t, A I e t r I tí r i us Co n t corresponde à densidade de uma variâvel 0{r<>. caso contrário. l98 t. Y:^f:"fuso produzido por um rornovariação no i"u "";;.i;;:' '::i: automático poderá rer umacomporrame".*":;frï'#:ï:;,.,iïrJ,"r"&lï1;ïïã;f#ï* f(r):{r"*#, #s'si3; ( 0, caso contrário.a. Determine o valor - probabilidaoe.*^-^ de k tal que f (r) seja, de fato, uma função densidade rb. Para um parafuso quar a p.Ju"üiüãã"iJ;:,:;*;:,ïï""j.",.: os produzidos I ".cut"u"ï;;;;#""tomédiodesseso",Ïï:'ïï,;;ï*fi Jiiti*",.:ï 9. Suponha Que u[14 r seguinte função: variâvel aletória contínua x tem densidade dada Í(r): 0(r<r' _ +, 7<r<>. 2ar{B; caso contrário. Í(r): Determine: a. P(X > 1). b. P(x < 1'/2). c.P(1/2<x< llX<3/2). 11. Suponha que o I ',"tfo, em meses, para a fecrrÍìernnõn ,r^ -^re crrurgia oo unor"ll,l i::::-q-:*çto. de pactentes submeridos a um certo tipo d ì ;;;;;.:ï-ïiïÏ-ry*n'o i ridosvariível arearória contínua x, ";;;;;;"";:*:::1,",ryde. ser moderado p;;;;; {:* por:;ï : *", r r ri a " , r i i il ;íjï ;ilï"ï:ïn #ï j ïi:iïâ1ïj ï jff ï(*): --- 6,,1 lixercícios (+, o(r(1;t' f(*):1-I*+*, L<r15;t'" [ 0, caso contrário. a. Determine a média e a mediana do tempo de recuperação. b. Calcule o desvio padrão. 12. A trava de segurança de um aparelho industrial deve ser trocada com freqüência, de modo a evitar a quebra devido ao fim de sua vida útil. Estudos anteriores admitem que essa vida útil pode ser representada por uma variável aleatória contínua, assumindo valores entre 0 e 1 ano. Sua densidade é a seguinte: (*(t-*'), ocr(1; f@):1'\ 't [ 0, caso contrário. a. Calcule a probabilidade da vida útil ser superior a 6 meses. b. Determine a vida útil média. 13. Suponha que o comprimento de fósseis encontrados em uma certa regiilo, dado em centímetros, pode ser representado por uma variável aleatória X conr função densidade de probabilidade dada por: r@): L2<r120; caso contrário. a. Calcule a média e a variância de X. b. Se um museu decide comprar os fósseis encontrados pagando R$ 100,00 para os de comprimento menor que 10 centímetros e R$ 200,00 para os demais, quanto paga em média por exemplar? '14. O tempo de corrosão, em anos, de uma certa peça metálica é uma varirivel com densidade: 01r 1I; Ilr12; *3a,21r13; caso contrário. r99 T2; {5 ;:311ïï:áconstante a s que 1,5 unor. T*Toa como tendo exaramenre , oF ut ror"'i" ï; o"'resistência à co' 1 5. o c o n s u rn o d e "."' u' " o * ; ;;.# "oit u t' q' uï' u' ;ffiïlrr5i$:.iïï medida-Jm"q;#T,:::'ível de um cerro auromóvel é r,*^ .a.,,uuu.iau;iï,ó..,;;;;dï::,liï""rf"ï:ï;,ïilïJ,il:f l:i,ffi: lr, / t,f ['- ..0, losz<1r;f(r):lrr-r, rr<rS12; f, : 3"ïlï-ïïl#ï ::^" r:rJ'ï *," " "" ï'j on rrá ri o em uma "'"*"Ãïïï;fiJ[ïl;;:ir:T+ì, quar será atu'^t"lg: *- ,t;,; derermine: )om esse;il;;;",." média da despesa a. P(0 < X'.'ti' --'çrrrrrll€i b. P6 . 2).- -'' ; iÍll â',. nr e. P(x < 2lx > r). 17. Vigas de ferrou'ã ãir'"'il:",ff""#ïT;":j:0" sua exrensão a urna j:,_Í.rull::Í"fliifl "X,"'",,H:trï;#ËïH:;Ïi;x:"itïT"ï:Íxï a. sabendo-Sê que ,,* .^,r^-" t6uat ir o metros' deÍermine a probabiridade de , ju, "Ã;ar"uma falha ocorreu, eÌa ser distante no mib' ocorrer rurr,ulï."rne h^- -, '-"'v rru rnaxlfilo em I metro 18. Dois ;;;"iil nos dois metros centrais da viga. *l'n*ü*iryn+*ïrïr*i q,'mprobabiÌidad" ããr"r'iïIatamente se nãc ---"!v uu tnrervalo iniciaÌmente e n c o n t ra re nì il ï i, ii. j ï.""1".ïlï ; "ïïïïïï ";, ,; i,sï#l#,ï (irytft u|o ó; Wrriãyei,r Aiettkfu.icts Con.íínuqs 6.3 Exercícios 201 19. Em uma empresa, o equipamento de ar condicionado trabarha continuamentë,exceto quando ocorre alguma falha que causará uma interrupção e necessiduclede manurenção. vamos supor q""-;od"l;;;;'ïi'*ãï,ï", uma farha porsemana (7 dias), que ocorue "orn prãbubilidade OpS.^Ë_.fravendo falha, elnpode ocorrer em qualquer hora ao iia-p+horas). a. Se o expediente na empresa vai de g às lg.horas de segunda a sexta, qual ttprobabilidade de uma falha durante o expediente?b. As falhas, durante o expediente, acarretam custos de Rg 300,00 enquantoque nos demais horários o cusro é de Rg ZOO,Oò. Ãa"irìnr" se não houver ::tl";:,ïï:,:,ï:ï :r^ o,"rnunu,, quar é o custo ;ãi" devido a fathns 20. Seja X - Exp(I/I}), calcule: a. P(x < s). b.P(4<x<6). c.P(2<X<5). d.P(X<7lX>2). e. O valor esperado de y, sendo y : JX _12. f. A variânciadey. , t ;TïJ#""ïjr"ï:1"*^* l:.:ry.:o 1 . calcul e a probabilidade de s ortearmos i#:'::iï,ï,,ïï':i::""::"T?:11ib';.;;;oi;:ffi #;""ïï:::ï:ru;runção de disrribuição dessa ""'ia'"ì. ôr;lJã ffiï;ï::ffi;ffï,ï? '13.,ïïff;;ïJï:::ì;j: ::ltil:" d::i caixa eretrônico por crientes de unr ;:ï1*ï :' ro i mo der ad o p o r ;; ";; á; -il; ï;: ff"ï : ffi ::-,1ï' Í i,ïï] a. P(I: < r). b. P(T > l:r < 4. c. Um número a tal que p(T < a) : 0,4. 23. o tempo necessário para eriminar o perigo de contaminação de certo pesticicra,após sua apricação em um pomar, è u,'u variáver ur"utoriu Exponenciar creparâmetro 2 (em anos). o maior oo n,"no. tempo depende de fatores conro iii"ïï;,1ïï,ï#'^t^"ie da região. r"noo ", uì*o áir" l"ornpor,omento, us rr u r a s p u r ve. ;ffi ;".'"",ï,::ïï :ff ," _,ïïjïÍ;ï f ;, j|#; il :i.ïprobabiridade de um. f*rta_cresse porïr,.r.oihiao oo o.o'.o, não estar maiscontaminada após r ano cra purverizuçio. quar e " "ãrì- ,,segurança,, seaguarderrrnos 2 anos pnru .unruini, "rra*'f,.utn*? 206 (e tpítuht 7: ln.fi'rf ncitt li,çttttí,ttit,rt _ Ii, Em outras palavras, ,todas as quantidades associadas à âmostra terãoaleatório e, portanto, devem r"""b", trataÃLnto probabilístico. Um ponto importante a destacar í amosrra, remos, nu p,âti"u, roda a i"r"rÃJçïï ru,ï:iïïff iiÏïïrïitramostragem, ou seja, não há alearoriedad" Ënuotuà^ ;;;;;^rn -^ ^^ rFE'.rrvurrqõvrrr' w òçJa''..0 na t t n dade e v lvici\ por exemplo, se os l( iïï::"* ï::' i,ii:ï191 i"i T" ro."_ "n t*ul; ;;r\;;üli o uo r o. "* ntoproporção dos que desejam conrinuar os estudos ;;ffird;;":ï"rïï, iSL: Xïïlli:",r:::::::-::" 1ïstra e o resurtaa" "utiàã,irá ser ,",n0,,mesmo, não importando qnanras vezes reperi',-,o. u ";l;;j;;ffi. ; ilï: :::ïï::":j3::iï,::: ::jlll": Ito trocam de opinião "nt.e a, coreras e, porracomo rodos os arunos sempre enrram na amosrra, a proporção "#ïl:ïffiïln" ,-r^_I"^Ìr^" iil]jy1:, formalizaremos alguns conceitos relacionados a um rânda Inferência Estatística denomina ao "rìi*oçao. Estudarem". ffiïn;ii ;ltïï**ï::.:: ,*:jïis, objerivanJo a obtençao de informações a reslde características de interesse na ptpulaçao. * ""'"""'w uç ''urrnaçoes ,_",_l::: ;:tiji:j1r,ïully": e,ãonrusões de noração, vamos repreuma amostra de ramanho ??, a ser rerirada da populaçã;,Ëìi,ï;; . .,"i; Exemplo 7.r: uma empresa fabrica r00 equipamentos eletrônicos por semana L:'"n ç:,1'::":::ï: ::,:"-.npo.j1 u,",i.tên"iu d",;; ;id ;e equipamento ereração à arreração de voltagem. um res;;;";*dil;#ïïr:ïJ'#ffiiï^:j: 3"""#Jff:,:":i"'ì: "-T r":"^*flsu;1s3ivas art".ãço"Jfuá.onlïuou, de vortagerle observar o efeiro no aparerho. serão consideiado, "o- ;Ë?ffiïffï:aparelhos que passarem no teste. como esses testes são demorados e demandamcustos expressivos, apenas 5. desses aparelhos ,"rao t"rtoáos. eue cuidadosprecisamos ter na escolha e na interpretação dos resultados? os 5 aparelhos escorhido, pr""ià. ser "representativos,, da produção, ouseja, a amostra precisa representaì bem a popuração de aparerhos produzidos.Assim, se questões referentes a operado."s, máquinás utilizaãas ou, até mesmo, odia em que foram produzidos tiu"r"- efeito na quuriãuã" ao aparelho, erasprecisam ser consideradas na amostra. uma alte;ativa seria o sorteio, porexemplo, de um aparelho a cadadia, tentando não repetir op"râor". ou máquinasutilizadas' Além disso, fazer alguma froposta de mudança no processo deprodução, baseando-se apenas nos resurtados de ,,nu ,ãLuna, parece serprecipitado. o mais indicaão seria coretar amostras em várias semanas.uma vez escorhido o esquema de amostrag"^ "" ""oa elemento daamostra podem ser atribuídos varoìes 0 ou 1 depeniendo, ,"rp""tiuumente, doaparelho ser crassificado como tendo má ou bà ,"ririen"iu às arterações de --F. 207I ltrlt rulttç'ïltt $ãettt1il, 7.2: Dtvida-se da "honestidade" de um dado e decide-se lançá-lo l0 íãr',,,rr.'; de utilizálo em um jogo. Os resultados obtidos foram: I , 5, I , 4, I , 2, g, .1, 2 c 3, A que conclusão chegamos? A íÌeqüência de ocorrêniias de cada face é apresentada na tabela abatixo: r. A amostrn (X1 ,X2,..',X5,) poderia ter a resposta (0, l, l' l' l) emtrr.'olcta o numa outra ( l, l, 0, l, 0). Face 1 2 J 4 5 6 Freqüência t.) 2 a 1 1 0 Freq. relativa 0,3 0,2 0,3 0,1 0,1 0 Ërrr scndo o dado equilibrado, as freqüências de ocorrência de todas as f'aces Ghrvcrr.ianr ser próximas. Entretanto, a amostra coletada parece,indicar um certo rlcshirlanceamànto do dado, favorecendo valores pequenos' E bom notar que ,,r..r,no um dado honesto pode produzir a amostra acima. Talvez uma amosttit ti,,,i,,, pud"rse corrigir o deìvio encontrado, mas, baseado no que foi informado, o tnclltor seria não jogarcom esse dado! tr Ii.vcntploT.3..Noprimeirodia,apósmudarparaumnovobairro,vocêdecicle 1',"rgunto. às pessoas' no ponto de ônibus, quanto tempo se espera para o ônibus .t,Jgnr. As li pessoas pràsentes forneceram os seguintes números (em minutos); .5, lõ, 5, 15,lt,12, rc:15,20, 15,20,12, 8, 10 e 10' uma demora de l0 minutss l)ilrece ser inevitável? E claro que as pessoas deram suas op.iniões baseadas em experiêncins Irnteriores, que devem sór diferentes entre si. É possível, também, que algumas rlclas sejam mais atentas que outras na questão da demora, além do que nõO clcvem ""h"gu. todas no mesmo horário ao ponto. Algumas, talvez, levem em conta o comportãmento das últimas semanas para dar a opinião, outras apenas o dia itnterior.Também,quemsabeaSpessoaspessimistaspegugmodiademaior clemora e as otimistas o de menor. Dessa maneira, a subjetividade da resposta é Í'ruto da informalidade e imprecisão da pergunta. Das informações obtidas, temos rnédia igual a 11,6; moda 10 e mediana igual a 12. Assim, num prirneiro momento, parece ser razoável acreditar em espera pouco acima de 10 minutos. tr Exercícios da Seção 7.L: L. Liste as idades de cinco dos seus amigos' Escreva cada um desses números em umpequenopedaçodepapel,deigualtamanho'ecoloque-osdentrodeum "nu"lop". Antes de "aoa r"iirada, chacoalhe vigorosamente o envelope e I'eche os olhos. 208 (it1tftub 7: ln.l'erêndu E,ytutls,tiut " Ii,rri a. Qual é a intenção de toda a "engenharia" descrita acima? b. Repita três vezes o seguinte procedimento: retire de uma vez três papéis do envelope e anote seus números. Comente sobre as três trincas d" números encontradas. c. Repita três vezes o seguinte procedimento: retire um dos papéis do envelope, anote o número e devorva-o ao envelope. Faça mais duas retiradas nos mesmos moldes. Comente sobre as três trincas encontradas. d. Que diferenças existem nos procedimentos descritos em (b) e (c)? 2. Deseja-se sortear 100 crianças entre 4 e r0 anos, num certo bairro, para urna pesquisa sobre saúde bucal. Foram propostas três alternqtiÍaslpru u "ãl"tu, l;Y#.lJlïio aleatório , reatizado enrre as crianças iir,uaár\g no.io II: um sorteio aleatório de casas do bairro e, em seguida, uma escolha aleatória de uma criança de cada casa sorteada, se houver. III: Escolhe-se, ao acaso, um dia de semana em uma das escolas do bairro. Nessa ocasião, 100 crianças são sorteadas dentre as várias classes, com alunos na faixa etária de interesse. comente as diferenças e dificuldades de cada alternativa. 7.2 Parãmetros, Estimadores e Estimativas Para formalizar as idéias que serão apresentadas neste capítulo, precisamos definir alguns conceitos. Definíção 7. I : Parâmetro As quantidades da população, em geral desconhecidas, sobre as quais temos interesse, são denominadas parâmetros e, usualmente, representadas por letras gregas tais comol$ __ e gentre outras. tr Dffinição 7.2: Estimador e estimativa À combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população, denominamos estimador. E^m geral, denotamos os estimadores por ^rr-boio, com o acento circunflexo: ê, fu, õ, etc. Aos valores numéricos assumidos pelos estimadores denominamos estimativas pontuais ou simplesmente estimativcrs. tr A notação utilizada paru a média de uma população é p, acrescida de um subscrito, se houver possibilidade de confusao soúre a que população ou variável 209 7, J I'ttr(ìrtrttlrrts' lislittndttt'es r E:tlltttttliytts s referimos. Por exemplo ' px e Fe 1ão-us1ct :J:Ï"':1i,ïì';;ïtï::i:i:iiï íïì,ïï:'ï":;,::JJJïïïïËil,:r:i.:,=T":lï^.,ïi:ïïTfi *fi'""jËjïï llÍ:l : *ïJff :ï : ï.ilÏï,ï'ï í'"il1*::: |:3ï1i: ï;,:ïïï#ÍJi: i: Ëï;ì,Ëlï:ilffi l.:1iïi.ï'T:',:íti""if ï;#"Ëï"ïilï,ï,::*ffÍ:1: llilll ïÍ 3Ï 8iÏ:: ï ffi ;: ;; " ;; "r " ü'" * " 1 i. t,1"^ .',."*..ïff ,.: ï :? :Ï,''n l; ïïliü:ïil:ïï"fi", aurores e tentaremos utilizar aquera que nos pareça mars Notamos que um estimador' digamos 3' :,::"-função t*r:::U",:i nr.,,,o.ijì iï'nï#;' J" am?stla' ,i":. i 3 ^:^!^Í:::^!-::;;*Ì;,ti:ï;""# : iï i ìff:ï ffi:i';ï-" ;;;i;ï "ú:r' I ::ï::i :iÍ:i[ ^l' ï111ï;:ï: i: ;ïllilïffi "ïÏ?"ï-i';;;u,"-o*"eo*"no::ï#".:ïïii'"'*dlll-o*:ïil,ïïilï*iïi,ï*í*u" da amosrra para os parâmetros da população' ";;'r';;;;';.r,u"u'.,o'interessados*:::::.1ï*'ffi .tïii""ïït""i"i*:':::,:'i:Íi;"J:ï:#"ìil;:"Ëq:"i:*..1"^Ti":,,:Jï:J:iïï,ïiï ; ïï ::,1"' "ï *1t i ó'ü.' ;;; d" s oeí e 1i,y1ltt:ï i i.ï"n'.ï;"'ï "l::,ffir: :ìlï::ïï ,"ï;'"'3ff:J'J'l;"Ëil, ";'";ìhtd;' uo u"u'o dentre a popuração ioï"n',*uoécompost"^p"l,.t^l::::i?1,ï:J:?iiïflïi::tlt;':: ,,,'",,n"LtÏïlï:t':H"Ë;#;ï;;'a*"o"4"*'ï::'ï;:liï:ïï:::f ï:: i',',ïlïJiï:'"Ïï"::'Ëïru*;Ì{,:j:;"*l'li:ï,ïïl'3i;';""ïffi :iovens, representaoa PUr Á'' n orrrvu!rw'--'Lu" o."cisamos resolver é que função ;ì;, ;;;t dizer algo a respeito de p' o- i .^*^^r^ ;",^ 6 n.ar será o estimador.ttcla, vamos ü t. ;1 çòP *v uv r/' v â,uàtu, isto é, qual rlos valores amostrais "ïti'"ÏÏ::f:i "t' Apresentamos a seguir algumas opçoes: ímínimo + máximo) . pr: f1(Xr, ..., Xro) : frz: lz(Xt ..',Xto) : Xt"Xt*...+Xro Ft: hlXr,..., Xto) : -----6- Poderíamos listar outros estimadores' mas os três apresentados são suficientes putu lo'itu'- *"u discussão' Inicialmente' vamos esclarecer o significado de cada trn a"i"t' O estimado'fu' é a média aritmética entre os valores mínimo e máximo da amostra e frz'é"simplesmente' o primei::"1'1]": sorteado na amostra' Ëì""f-"tt"' F' é ?-eáiu dos valores da amostra' ou seJï' il rnédia amostral.. Apresentamos, a seguir, os valores observados na amostra e âs re spectivas "rti'nutiu u' ï;;iú ; "Ín o-s estimadores definido s acima' Amostra (em metros): 1,65; !,57; !,72;1,66; |,7|; |,74; |,8|;1,68; 1,60 e 1,77. lï 2t0 Estimativas: lJlno" : u": teria coletar a amostra? concordam. Assim tomamos Capítulo 7: Inferência Estcttístícq _ Es : 1,69; 1,65; 7,65+r,57+...+r,77 10 16.91: -10 : 1'69 ' Apesar desses números, calculados para uma amostra particurar, serem muito distintos uns dos outros, não devemos escolher o estimador olh:apenas, se a estimativa correspondente é, razoâvel. como decidir qual deles u X:,::lï, "1lllj:l que esra questão_é resolvida, estudando_s" u, p.opr"Aua",diversos estimadoràs. É .ómp." uo* t"-ú.u; õ;;ú"; Ëï;ï;.' ::ï:1i:ï:l:tïli--Íota na população, pois se eló fosse conhecido, que senti Exemplo 7.5: Para detectar.o apoio popular a um projeto governamental reforma agrâria, foram entrevistadãs +oô pessoas espalhadás ".n-uá.iu, capitairamostra conrém as 400 resposras que'consistem de "r,, (o;:;tïn""Ï:ïtïconcordam com o projeto) e não (para os que discordam). Para formarizar o problema, iniciàlmente caracterizamos a população interesse como aquela formada pelos habitantes adultos do país. A informa< desejada é a proporção das pessoãs que concordam com o ,"fàido projeto, oparâmetro de interesse é p: proporlão dos que concordam com o projeto. / t, _, A oTorrra pode ser pensada como o vetor de variáveis aleatór\Ãt,Á2,...,xq00), cada uma delas seguindo um modelo Bernouili, ou seassumindo.valT. 1 para sucesso (resposta sin) e 0 parufraro"", çrerpo sta naQ.E intuitivo considerar como estimador ã prãporçao àmostral dos r p- número dos entrevistados eue aprovctm o projeto 400 que, tendo em vista as variáveis de Bernoulli, pode ser escrito como: ì-Xt+.Xz]-"'*Xqoo.- 400 como veremos adiante, esse estimador arém de intuitivo tem boas propriedades. El Suponha, como antes, que uma amostra de tamanho população e representada pero cónjunto de variáveis areatóritrs n é retirada da (Xr, Xz,'.., X,,), (1,57 + 1,g1) ___ 211 7.2 Parôtmetros, Estimadores e Estimativas Xt*Xz-l +x" l)cnote os parâmetros média, variância e população PoÍ F, o'" p, respectivamente' cprantidades são as correspondentes média, proporção de certa característica nâ Os estimadores "naturais" para estas variância e proporção calculadas na n rì1ostra. Representpnd-o-os, respectivamente, por /í., o- e P, temos '^l l,e- t '"- X: ^2o.: :i&,?nn r1ìjf (xn - X), ;n-' número de itens com a característica na amostra f'í'hryt n Note que cada um dos\estiàadores apresentados depende dos valores pertencentes h o*oìtra aleatória (Xr,'..,Xr;'Como veremos no decorrer desta seção' os ;r;;;;;;r", X "?, uié* d" serem intuitivos, têm as boas propriedades que serão tlcÍ'inidas adiante. No entanto, com respeito àG2, uma alteração na sua expresSãO scrá necessár ia paraque satisfaça uma dessas importantes propriedades' Iixcmplo 7.6: Paraestudar o nível de colesterol em uma população de esportistas, colctamos uma amostra de 10 jovens atletas, obtendo os segUintes valores: ItÌ0,196, 185, 165, 190, 195, 180, 176, 165 e195' Vamos definir nosso interesse como sendo o nível médio de colesterol e' irssumindo que não temos acesso à toda a população, estimaríamos o parâmetro p (valor descoìhecido da população) pela média amostral calculada com os valores rlirclos, isto é, 180 + 196 + 185 + + L76 + 165 + 195 : L82,7.Td,": 10 I'rrrtanto, a amostra, através do estimadot X, fornece para o parâmetrO pl n trstimativa 182,7. O limite de colesterol para pessoas sadias é'200, isto é, acimn rlcsse valor o indivíduo aumenta o seu risco de ter uma complicação cardíaCA' A iilÌìostra forneceu um valor relativamente baixo, indicando que as pessoas que lrrilticam esportes, aparentemente, estão mais protegidas de complicações do coraçito. Tendo em vista que a população em estudo é constituída de jovens atletas, rrrn nível de colesterol acima de 190 poderia ser considerado preocupante e inrlicativo para um acompanhamento médico mais freqüente. Dessa forma, ,ufnnno quà classifiqu"*o, como tendo taxa alta os atletas com valores acima de 2t6 Qtltltulo 7: Inl'erêttt,iu Elktthtic,rt - E(õ?):*rtËrxt-x)z1 :*,"tttxt-tr+p-x),Ì : *utDrx, - rò2\ì)1-,,,, a'n ls: ;2ts6o - P)' - E(x - p)' Z:I 7 , 1": -no'_ _o.nn ,Tl, - 7, n: \-;)o"' como é imediato verificar, o quociente (n- r)/nnunca será r, exceto no rimitcquando n tende a infinito. podemos eliminar ó vício ,nuriipri"uno o al po, , Idividindo por (n - 1). Assim, definimos um novo estimador .s2 : -_l_tf" _ x), ,n - IZJ\"z /L) ' que é não viciado para o2. para seu cálcuro, podemos usar a expressão alternativa .9': 1 /Én-t\ux?-"-*') Esse estimador recebe o nome de variância amostrare será sempre denotado pors2 paradistinguir de outros estimadores denotados genericamen te porG2. D Note que a variância ou o_ desvio padrão de um estimador fornece uma ::Í':_1L,':: llïïyl; ïor ìsso, 9 .-"''n; denominar " o"#ïi,ï""ï""H:ïii::: i : .:. :"_ ! : d,*. eu ando a"i.. ",,iÃïãïï",'r;#';;ï,tJ:;ï:. ï Hilil::::,:fiïïé o mais nrecisn Nccra nn-t^ v+^ ^ ^^,^ - .,p ciso. esre contexto, o conce iti de eficiênrr" i ^ií*!"!r;ilïïL:?;Definíção 7.5 : Eficiência " Dados dois estimadores ?1 e ê2, não viciados para um parâmetro d,dizemos qu" ?, é mais eficiente oo qu" ó) ," r"rìA,iï ,ïiïA; tr -tF V,. ) I' t t ríl t t t (t t ro s, lis t i t u rul o rc,r c b]l I i t r t t t I i v t t,r *,_.***.{, 2t7 )Exttrnplo Z.//.. No Exemplo 7 .9, no caso de distribuição Normal, verificamos que 'ãl "tii*oaores p1 :X e frz:medtana(Xt,"',X") são não viciados e suas vnriÍìrrcias foram calculadas' Então' var(Q) - o' ln, : ? :0,63 < L + var(Fr) < var(fr,r), V'4 p; : ç" 121"'1" iT ê eottcluímos que p, é mais eficiente do que -1ìr' Na tabela a seguir, apresentamos estimadores de p, p e 02' Tabela 7.1: Estimadores para média, proporção e variância' (x) a consistência não foi demonstrada no texto mas é válida Exercícios da Seção 7.2: l. Foram sorteadas 15 famílias com filhos num certo bairro e observado o número de criancas de cada família, matriculadas na escola. Os dados foram: l, l,Z,D, 2, (,2,,'3,4, ), l, Z,0,0, e2. Obtenha as estimativas correspondentes aos seguintes estimadores da médìa de crianças na escola nesse bairro: (mínimo * máximo) . PÚI - ^t (xr+x3.fr: --n- , frs:X' Qual deles é o melhor estimador da média e por quê? 2.Para se estudar a variabilidade em um teste de Inglês (notas de 0 a 5), foram sorteados 16 alunos de uma escola e suas notas anotadas: 0, 1, 2, 1,2,3,3,2, 3, 3, 4,5, 1, 3, 2 e 3. Paraestimar a variância foram propostos os estimadores: n 218 Copltub 7: Ittferprrirt liyutíltictt - Ii, ,? : *E(xo - x)2 ; Obtenha as estimativas e discuta qual é melhor. 3' o número de reclamaçõ;s,uue chegam por hora à uma centrar de Atendimentodo consumidor foi anotadó puru ,i-u amostra de argumas horas escorhidas,aoacaso. Deseja-se organizar o serviço de modo a ate-nder, iÃ"aiutu-" nte, 909"das chamadas que chegam. O"t"r,,'ln" uma estima tiv.a n^,o n -,í*^_^ rriru n c i s n f ri s s n ec L s s á r i o i, " u ?,";ì ;", ï;,;iïJ ïï; ï JË, i"ï1 ;, i,"{;r,V,l,B,+,$,b, l, X, +,+,i, L:'[,1, i, ìïì: d)V, ! " +.4' IJm ônibus passa por um determinado ponto em intervalos regurares (emminutos inteiros) que você, por ser nouo no bairro, d"s"onh""e. Ao chegar a ::ì;,,ï"ï,,ïlï'":"ïj:::i^ 1li: pessoas e resorve ;",s"*;; " eras sobre ;seuônibus. uma delas diz_que está no ponro h;;;;; fi";ïftÍ;ï'JJJ: ff:passou. A outra está há cerca de 40 ^minutos e já viu passar dois desses ônibus,Faça uma estimativa da demora puru pu.ru, o seu ônibus. 5' um fabricante deseja estudar a duração de baterias que são utilizadas emrelógios de pulso. uma amostra de vãrios lotes rauric'aÃs por uma mesmacompanhia foi submetida a testes acererados " proaori*- JJ r"grint", temposde duração (em anos):. 1,2; I,4; 1,7; 1,3; 1,2;2,3;i,0,-i.S,"f ,S ; 1,4; 1,6; 1,5;7'7;1,5 e 1,3' Determine estimatiu* puru a média e a variância do tempo deduração dessa p'has -para avariância,'use os estimadores da TaberaT.r. 7.3 Distribuições Amostrais Vimos que estimadores. são funções de variáveis areatórias e, portanto,eles também são variáveis areatórias. N".'tu ,"çao vamos estudar a distribuição deprobabilidade de arguns dos estimadores mais utilizados. Iniciamo, com umexemplo simpres, em que não é difícil carcurar expticitamánte a função deprobabilidade dos estimadores de interesse. Exemplo 7.12: um jogo consiste em lançar uma moeda honesta 3 vezes. paracada ,ançamento, se saircara você ganha-ì ponto, caso saia coroa, você perde um - 219 poilto. Podemos modelar essa situação através de uma variável x que, em umn i6pulação, pode assumir os valores -l e 1, com probabilidades iguais' Para uma ãrri,,rtrá aleatória e independente de tamanho 3, vamos determinar as funções de probabitidade dos estimadores X e ^92.' Um cálculo simples fornece o valor da média e variância de X, obtendo' tc, respectivamente, 0 e 1. O vetor amostral (Xt,Xz,Xt) é constituído de Vlriírveis aleatórias independentes e identicamente distribuídas com função cle probabilidade igual à de X. A tabela, a seguìr, apresenta as possíveis amostrâs, i'espectivas probabilidades e valores de X e 52. 7, I I )ist rihuif:íics Arttttst rnl'r (X1, X2, Xs) probabilidade X gz -1, -1, -1) L/s -1 0 -1, -1, 1) T/B -113 413 (-1, 1, -1) L18 -r/z 413 (-1, 1, 1 rl8 U3 413 ( 1, -1, -1) tlB -L/3 413 1, -1, 1) 7/8 r13 413 1, 1, -1) r/8 L/3 413 I 1 1 L/s 1 0 Os valores da tabela foram obtidos através dos cálculos usuais. Por exemplo, parn n umostra (-1,1, -1), temos -1+1-1 : -tl3;rohs: (-1)'?+ (1)2 + (-1)'z- 3(-1l3)'z (3-1) Baseando-se na tabela anterior, podemos construir as distribuições dos cstimadores, dadas por: t :413. Xl-1 -LlB rl3 1 ^ Os valores esperados podem ser calculados facilmente: E(N) :(-r) x 1/8+ (-1l3) x 1/8 +Lll x 718* 1 x 1/8 : 0; E(S') : o x rl4+ 413 x 314 : r' eapftnlo 7: hlferëncio Erttttl,rtictt . Dessa forma, uma vez que.E(-t) : 0 : ,,li. : E(s^r): 1 : var(x),ambosestimadores são não ui"iuooì fuluì**Ë.r,"os parâmerros esrimados. _ t . No exemplo anterior, pudemos en .'xiïJffi :::**;,ïrTJ*,ï;;riïfu *,ïi#:",ëJJ"ïï.ï:v ^^_1:x,"ìntinuu,'"''*'"ï"lïüi j#::""ïïïïï* iílïl;l jï:,Ël *: iïï* i! J; Jl ; ïï *r:iï'i:iil I utu,,,uc o n r ín u a o ", " i.liï ïi" :ï*envolvidas, não seria viável ;il;;; ïoàï,"r".o c i a das variáveis aleatóritobtenção das densidao", pu.u u^Àeji""l"t as amostras possíveis, o qu" l.p"ìo apresentado flo Exemnl^ ? r. \Ì? para a variância amostral neln mÁr^rn pro 7 13 .wr9 "Ã"íffi;,Hï#fiïï::r p Ìo éror ,ffiïïil::rïi'J'::*; :::.o^.1*i" g,", é que o0,", u'oli;,ïff,:,:": ïi::1,ffi :.ff "i"'::ii:d;õ;"iË'l'J,ïï,Jlfi "ï"ff :':':;;ïi; Í;..ïi,,;,trt1t*dï;JÍïiï:riïïJ,ï-áïLï,ï::ï:.ïil:rjit*ïyi ii,ïlïtïfJ.';Í:ïry:ff 4i*:*:*lÈfiï1"Ë,,*,.ï,ü;l"1,::,'iffi ":: uu.iau"r ïïì;H:ï:,,.,n_i"iurm"nr",-;;," de umà õ;;ü; Normar, isro é, arepresenra uma ^;^:.: : N(!".' o2)' Portan ; ffi;;ï" :Íï;àïx"Ëïï.Jilïï:,.1i,#i,,;,n#llrdìÉ;J$*li:;i j X'i - N(p,, o2), ,i: I,...rn; X; é independente 4s X j, para todo i t' j. XtTr, gue, para quaisquer consianres a,{; também tem disìribuìcãn a^ ^-:;:;,,.*l' ,"'.4:, a combinação lineart*f;*f f rui*ïÍlï* j:ï,J"ï,ii;."àïâ;,X,ïiLiïtï#ï:A distribuição da média ,-;;Ë*" Pruoa'Illdade dada pelo modeló Nor,r,ui. a,; : 7/n, 'para i,: t, ..., n. A.ssi- u,' :of:n* desÍe resultado ao to-urn,ã.t , para , I . ,r."'Ã,,"}:"ïttetamente t lr rr propriedades dâ esrr."o-^ô ^,.^-:^ N(p*, ol) e, com o auxílii edades a perança e variânciu uor"r"n ooxïJ,#".ï;:ï ;:ïnt o das tt,: E(X) : uÉËx) : *n, : ,, o1: va,(X) : v"4!txò : #ro, : # Logo, para uma clistribuição de coleção de variáveis probabilidade, dada aleatóriás independentes com uma mesmapor um modelo Normal ""_ ;ã;;;'è E: Figura 7.1: Efeito de n na distribuíção amostral de X - N(10, L6ln). *I-F '" - --"-=Çt 77t '. I I t i.t' t riln i çilc,t A rru ^! nli,t nciã o2, a média amostral'X também terá distribuição Normal, com média p vrrrifincia o2ln. Note que, pelo resultado acima, podemos concluir que à medida em que o talnlnho da amostra cresce, a probabilidade de a média amostral estar nil Vlzinhança da média populacional torna-se maior. Intuitivamente tal fato é êFltclirdo, uma vez que, ao aumentarmos o tamanho da amostra, estamos tendo ituis informação e, de certa forma, fazendo a amostra ficar "mais parecida" com tt A polrulação. E, assim, razoâvel acreditar que a média amostral será próxima dn ntérlia populacional. Excmplo 7.13: Considere uma amostra independente de tamanho zl de uma vrrriírvel N(10,16). Isto é, Xt,X2,...,X,, são independentes e todas com distribuição Normal com média 10 e variância 16. Como se comporta X em lirrrçiro de n? A variável aleatória X tem distribuição N(10, 16/n) e o gráfico de sua elcrrsidade é apresentado, a seguir, para alguns valores de n. Como podemos notar, à medida que n aumenta, a função densidade vai sc eoncentrando ao redor da média 10, que é amédia populacional, indicando metior probabilidade de amostras grandes fornecerem uma estimativa de X próxima dn rnódia populacional. Densidade tr 226 eapftub 7: Inlbrêttrlu Es,kttí,ttirtt . Tendo em vista o Teorema Central do Limite temos quesuficientemente grande, Notamos que a soma das variáveiszfe_xgias/, digamos W : Dïl-ttem disrribuição exara dada por uma Binomid ì#;;il;;", n e p. Deforma, probabilidades, envolvèndo a propárção amostrar, podem ser calculadagmodo exato usando essa distribuiçao. cáso o varor de n seja muito grande, eglprobabilidades darão aislm trabar"ho para serem carculadas L to-u_r" "onu.ni.Jutilizar a aproximação Normal. ,u::*!':.''f,;t\*:^q:: l proporção.de peças rora de especiricação em ?i^ "Í " lZ ^! !: :- T:-uo u -u -u_ u''à, tà ; " ã'"''r' ; rï, ; ïï'"ïi:ï: J :i:jÏï "t:T,:,ï :11 t.:1,".:3: de . peças aereituosls- ;";i;"" 0, 5 0 podec arcur ada de l?:-" "I1" '.'. b ino'"iuL à ;d;#;"ilï#,:"üilJ: ::: Y l rari ável, aleatóri a represË"r""a" " -"',nÁ";"" ;; il#;na amostra. Claramente, W _ b(80;0,40). Logo, se p representa aamostral de peças defeituosas, temos que P(ì < 0,50): p(W/80 < 0,50) : p(W < 15) _ +{ /Bo\.: à\"i 1o'no' o'6s30-z: o'8250' considerando agora .a aproximação Normal, temos, como conseqüência doTeorema Central do Limite -' --'^rvu' vvrrrv ? - N(0,40, o' no,t ; o, nor, . Assim, P@ < o,5o) - pç3-!- . / p(r-p) v --;, temos, então, mesmo para uma razo6*el entre as duas respostas. 0,50 - 0.40 .-ffi ): P(z < 7,72) V ----m ' amostra não muito grande, uma ,.1 I t i t t rì h u i çi\e t A nttttl rtt I s 227 ,_ rcÍcios da Seção 7.3: I fltrrn variável de Bernoulli com probabilidade de sucesso p é amostrada, de lìrlrna independente, duas vezes. Apresente a função de probabilidade da ltrétliu amostral. l, 11 ltirnero de divórcios por indivíduo adulto casado, em certa comunidade, foi rrrorlelado pela variável aleatória D, cuja função de probabilidade é' rrllrcsentada a seguir: tlrna amostra, representada por (Dt,Dz), sorteada com dois desses irrtlivíduos e os seguintes estimadores, para a média de divórcios, foram e trttsiderados: 0r : JDõ e frz : máximo - mínimo' Para cada estimador' otrtenha sua distribuição de probabilidade e verifique se é viciado. !. [.lr-na variável aleatória assume quatro valores (-2, -I, 1, 2) com igual plobabilidade. Para uma amostra de tamanho dois, obtenha a distribuição de ,92 e verifique se ele é não viesado para estimar a variância da variável. 4. Coleta-se uma amostra de 10 observações independentes de uma N(2,2), I)etermine a probabilidade de a média amostral: n. Ser inferior a l. b. Ser superior a 2,5. c. Estar entre 0 e 2. 5. Supõe-se que o consumo mensal de água por residência em um certo bairrO poulirtunolem distribuição Normal com média 10 e desvio padrão 2 (em m3), Para uma amostra de 25 dessas residências, qual é a probabilidade de a média amostral não se afastar da verdadeira média por mais de 1 m3? (r. Um fabricante afirma que sua vacina contra gripe imuniza em 807o dos casos. Uma amostra de 25 indivíduos que tomaram a vacina foi sorteada e testes foram feitos para verificar a imunizaçáo ou não desses indivíduos. Se o fabricante estiver correto, qual é a probabilidade da proporção de imunizados rra amostra ser inferior à0,75? E superior à 0,85? ol proximidade tr ,.E'c 228 Cupítttlo 7: Infi'rêncict Ëstntí,ytittt - Ii, 7. A resistência de vigas de madeira utilizadas na construção está sendo o fornecedor atesta que, em média, cada vigaresiste a-3 tonelJas com des padrão de aproximadamente 2 toneradas. úint" dessas vigas serão para serem utilizadas numa obra. considerando que é verdãdeira a inf, do fornecedor e supondo que o modelo Normal é ãdequqdo, pergunta_se: a. Qual a probabilidade de uma dessas ) ''t.,.ncleÃc,ì r..us us UIIÌ q sas"tgaE-ytar menos dos as-"rgq tipgtrruí'-"ï , que tonelada? b. Qual a probabilidade de 2,5 toneladas? c. Qual a probabilidade em suposição de normalidade as vinte vigas suportarem, em média, pelo (b), considerando agora 40 vigas e sem fazer para os dados. 7 .4 Estímação por Intervalo os estimadores discutidos até aqui são estimadores pontuais, fornecem como estimativa um único varor numérico puru -o'fuïã**o' ïl1liïl:, Pi. r"r."T..variáveis_ aleatórias, os "rti-uããì", -ü;;;'"" distribuição de probabilidade e, levando este fato em consideração, apresentar uma estimativa mais informativa para o parâmetro de interèsse 11]:1,::1 ryoi{ de precisão do valor obtido. Ésse métod" o" árìiÃ"çâü lX:lY: i:t e rv a t : d e. c o nfi a n çÍ, .iLq 9.noru, à esti mati vu pon*t ;; Ëffi ;;informações a respeito de sua vãriabilidaàe. Intervalor o" "onrãïçã".il;tdrï ',1, : +#1/v(0,1).o/vn / atrav.és da distribuição amostral de seus estimadores. consideremos, inicialmente, o intervalo de confianç a paru a média 1t deuma certa população Normal, com variância conhecida o2. Supãndo uma amostrade tamanho n dada por (Xr,...,X,), vimos que a -eaiu amostral temdistribuição Normal com a meyq44q a 1_r e variância o2 f n.Assim, -1 \ +\tr Fixado um valorì ta7 l que 0 < 7 < 1, podemos encontrar umvalor zrlz p(Zl a r.,p)_ .P(_ z-112 { Z < zrlz) : 1. o índice de zrlz apresenta o valor de 7 dividido por 2 uma vez que a ,,massa,' deve ser distribuída iguarmente em tomo de 0 (veja a figura a seguir). '"'uF. '/.'l |ist ittrctção por I trle rvultt 22e) -Zw 0 zvz o valor z1p pode ser obtido da tabela da Normal padrão' localizando o viúor de 7f2 no "orpo da tabela e obtendo o valor 4l'2 nas margens correspondentes. Feito isso, temos o intervalo T_,, - ztlz<Z< z11zè - zt/2a'#1ztlz" o/\/n clue pode ser reescrito como' com coeficiente de conflança'y' é dado UI ; X + 2.,12--f;1. \/ lú'v tal que OO X - 2.,126< t-L < X * zt1z76' Assim, o intervalo de confiança paÍa p, por A interpretação do intervalo de confiança deve ser feita com cuidado' A expressão IC(t+,'y) envolve a quantidade X que é uma.variável aleatória e' portanto, o intervalo obtido tambdm é aleafório. Á probabilidade oue ele contenha o verdadeiro valor da média populacional ;;õãtpìíì:ão aor"iut a amostra' X i;.*-* ã;=, ètonìõ "ò-ntiéïéúo, o, n e z^,12, ó int"tuuto passa a ser numérico' Desta forma, uma interpretação convenienti e a seguinta se obtivermos vórias amostras de mesmo tamanho e, parq c:ada i*o delas' calcularmos os correspondentes intervalos de confiança com coeficiente de confiança 'l' 230 Ctpftulrt 7; ln.li,rêncirt lhttttí,t,tit.tr _ Iilt esperamos que a proporção de intervaros qne corúenh,am o varor de 1.t, sejaa j.O exemplo a seguir ilustra o, .on""ià. discutidos. Exemplo z.1g: suponha que os comprimentos de jacarés adurtos de uma cerr it:;jil"#::;? ).*ï3 ::ï:;* pa","oni*r;;;#ïá"cia iguar a 0,0m2' Irma amostra de dez animais i"i;ïJ;ffüJ::lï:r',ïï,;'J Desejamos uma esrimativa para o po.arn"ìro d"*"aeg/;.""" , uora,ïï^S',lXl Íïlï?:jnr" de probabilidade de Ì é NormaÌ com médie variância oz/tO:0,001.r, poa"l_,o, pro""d., d" for_1.ffi:ïi:iti ff:;ï"iJ,'i:::""j:ïï:::1":ïr^t-3j:iiìu " out". uma estimativa por intervapara p' Isro é, construimos um intervaro ae,"onriann" n;;-;;ïi:3iiffiJïEstabelecendo 7 : gSVo obtemo, Ou tuU"tu da Normal zt/2 : 2s,475 : I,g6.Segue, então, que IC(p,nrr") : 1,69 - 1,96 I,63; I,751. Adotando a interpretação, mencionada. acima,- de que em 100 intervalosconstruídos, 95 conteriam a verdadeira média, " â"" p"a"-J, orr", do intervaròobtido? De modo gerar, o qu" a urruiÀ",rt" conridìraâo é admitir que o intervarode confiança calculado e r- auqu"i".-liuon.,,, isto J, J"ï"ïru- a verdadeiramédia pr. Essa razão expri"u o n""*idade de, atem à" i-n-for_u, o intervalonumérico obtido, fornecei também o índi"€ de confiança que foi ut'izado. trA ampritude do intervaro de confianç a ê,.!.ad,a pela diferença entre oexrremo superior e inferior, isro é, X * ";;i:_"fX:;;'r-:;,tr- ;,;:,fr",o que craramente indica que era depende da confiança 7, do dásvio padrão o e do ':::::;";r::ostra n. É usual '" r"r".i. J" emi-amptitude, ";; o erro envorvido k::::;:":^*jll como a expressão da amplitude é influenciadaseus termo s ." 1."^rj":-1i.os o s aspec r", in," i,i "ol Ë í in ïï *, ; t-ï4ü" * qca-rrqaiq{-eentgmente â nmnlirrrÁ- ,:^ ,-;,-'ì '-' r ':l'11419ì rnarores rem maÌõÌ-podsÌbiliìladg d: ",lc4rf-uÌa -õ ""1affiffi]lffi;il:ï::ï#,ïg:.9,11fËo dã 0 a2,5 metros para a arrura médiaLde indivíduos adultos de uma cidaaei também um fator umeoruidelqlg! importante. Uma H a possib:l-idads_de ''-É 2.t I n 7,.1 1,,'.t' t i tt tttç,ãtt 1tt t r I n lt rwtlt t àlst,r,rciamento dos possíveis valores amqstrqis ep relaç{g !,péc!-ia populacional,. èuj' intervato de õontiança estamos obtendo. Dependendo do seu tamanho n, n êtrr,,stra pode fornecer um valor médio (ro6r) muito influenciado pelos valores 'ex tt'cttros. Com relaçãq- à.-amostra, temos uma clara intuição de que,-Ilg4!-tg 119igr ftrr scu tory.qnhd -uior- seú-4 gggllld-4{q d-9-!l&fn+S1r-o-,45l9_1Í,"-"1' Note que, pelrr expreísao da amplitude, para uma mesma variabilidade o e confiança 'y, Vr,l,,rc, maiores de n piOduzem intervalos menores e, poftanto, mais informatiVOS. pgr'cxemplo, para a-altura média de indivíduos, o intervalo 0 a 2,5 metros é tlrcnos informativo. do que o intervalo I,3 a 1,7 metros' Il.rcntplo 7.19: A, vida média de baterias automotivas de uma certa marca estí gcrrclo estudada. Baseado em estudos similares, com outras marcas' é possível rucluritir que a vida dessas baterias segue a distribuição Normal com desvio padrilo llLr 4,5 meses. De qual tamanho deverá ser a amostra, para que a amplitucle do irrtcrvalo de90vo de confiança para a vida média seja de 3 meses? l'trra calcular o valor de n, consideramos a equação: v/n: o 2 x zr12 t- :3'" vn L,64 (1 : 90Vo) e o :4,5 temos 2 zrpo _ 2 x 1,6_4 x 4,5 : 4t,g2. 33 Como o valor de n precisa ser um número inteiro, escolhemos o maior inteiro que contém (4,92)2, obìendo n:25. Dessa forma, a amplitude do intervalo a ser construído seiá ligeiramente menor do que 3 e, portanto, o intervalo será mnis C'om os valores de z-,12: informativo. pelo A aplicação do Teorema Central do Limite permite a obtenção dc iltervalos de confianç a para P, guando a distribuição das variáveis aleatórias' que constituem a amostra, não segue um modelo Normal. Neste caso, o intervalg construído terá um coeficiente de confianç a aproximadamente igual a 7, sendo que esta aproximação melhora à medida que aumenta o tamanho da amostra' Exemplo 7.20: IJmprovedor de acesso à Internet está monitorando a duraçãto do tempo das conexões de seus clientes' com o objetivo de dimensionar seus ecluipamentos. São desconhecidas a média e a distribuição de probabilidade desse tempo, mas o desvio padrão, por analogia a outros serviços, é considerado igual a Capftuta 7: I4ferêncla Eshilrricu - 3. Um grupo de 15 al fefruis.a sobre o T,9.:1" curso de Vererindria Íbi sorreado e Ë:iïï:HÍxï::*:i:.Ji:,,ï,;,;il;ï,:ï:ïïïlJqïì:ïïH,: "ïf"* avariânciasegundo os esrimador.rl, ,, r, 3, 2 e ãl : @ediana -d: (.;;;ï" --,ïï,ïtr' rì!:sz:{ÉGá, o' ^;H";ffi1;ïÍ: Ii :::l* : ;; il*ï:::::":!*;mli",:*":,,1*r:*ii""?ffiï:iï::::,i:5. Estatísticas do Dena rtq,-o^,^ , :--" wrrrrlrôl'amédiade x. o" moto-ti'"t" #-:i:mento de Trânsit oseguinteriã"t;;'oo""oïf ::"mi;l?ïÏ::.ïil|ïilH:irï* o l.::rlle_ a probabiridade de a médi- uragrama). uma b(2;0,3) ser rnferior à I. a amostral de 3 obser 7. sendo x uma;",:ï:: I -' sv J u,servações arearórjas de ,, " r,"irïál;:ffi,',,'.'":ïi;:;í*ïH,li;l*" uma amosra de ramanho8. Uma amostra de listados abaixo. n1l:t oot"tvações da i?t"ht:ix:trËúl1iïï";ïffi i'ãrr"':'f'";ïff ,rÍ,:ï::ïï b.XéBernouilic c.XéBinomiaÌcr 9. para uma Norma , ,o*' : 3 " P: o'5' ". pff!;;;:' 15, 10) colerou-se uma arnosrra de ramanho 25. calcuÌe: qF \ l')t'r'trk'io,r' b.t,(4,s<X<tr,11;, t. Ir(X { 4,T ou Ì > 5,1), l(1. lim l0 observações de uma variável seguindo o modeloNormal corn rnéctiu 3 c dcsvio padrão 2, qual será a probabilidade de a média amostral: :r. Ser superior a 1,5? b. Ser inferior a 0? c. Não se afastar da verdadeira média por mais de I unidade? I l. Trinta observações de uma Normal com média p e variância 36 são colctaclas, a. Calcule P(lX - pl < :) lr. Determine o valor de a tal que P(lX - pl > c) - 0,g. 12. Sendo a variável amostrada uma Normal de média p e variância 25, obtenht cl vaf or de P(lx - pl < z) nos casos de tamanho da amosrra igual a 2,20 c 60, Comente os resultados obtidos. 13. considere uma amostra de tamanho 30 de uma população Normal cle nrécliu p, e variância o2. Derermine p(lX - pl < r) nos casos em que o2é igunl u ló, 64 e 100. Qual a conclusão? 14. A duração do "tonner" de uma máquina de fotocópias pode ser moclelndo como Normal com média 15 e desvio padrão 2 (em milhares de cópias), pura uma amostra de 12 fotocopiadoras a duração do "tonner" será observncln g pergunta-se a probabilidade de, em média, durar: a. Menos de 16 mil cópias? b. Mais de 13 mil cópias? c. Entre 12 e 14 mil cópias? 15. uma máquina enche pacotes de café com um peso que se comporta como umir variável aleatória Normal de média 200 gramas e desvio padrão I0 grarnas. Uma amostra de 25 pacotes é sorteada e pergunta-se: a. Qual é o número esperado de pacotes da amostra com peso inferior a 205 gramas? b. Qual é a probabilidade de que o peso total dos pacotes da amostra rriro exceda 5125 gramas? 16. Para se ajustar a uma máquina, a correia deve ter entre 60 e 62 cm clc comprimento. Tendo em vista o processo de fabricação, o comprimento dcssas comeias pode ser considerado como uma variável aleatória cãm distr.ibuiçÍio Normal de média 60,7 cme desvio padrão 0,8 cm. pergunta-se: 238 fnpilulo 7; lnlt,rirtt,irt li,yttttl.t,tit,tt _ Ii. "' lïït ï"t#babilidade de uma correia' escothicJa ao acaso, poder ser b. Um i:,11r1.T::T:o_or,o"^ïu: coneias esrabelece um conrrote de ffi :' :i',n:" :#,tj: j l' *:::' " r " ;" ;;; ; ;;;;.ï' ïff : ï ï:.Jflã f ;; " ï" "" ff ï,t"':T:l l",TÍj' : f i r "ãïï* ;" ïï " ì #.iï: ""::, il' i tr.,i;i,"ïï:,;:::,"":::1:i::i,_" de uma ,ffitoria x com disrribu *:::l :: "ï:: : ï: ";, 1i.,: " " " ;; ; ï;' ; ô:' ôï'ï:ï* J: ï,ï#'"'ilw l.rrnilnnoffi,"ï,r::i,lïl;jïlo:?? o: probabilidad", u Àédiu urno,ú,não difiramédia da população por mais de ã unidades? 18. Seja X-N(p,,36). a'Para uma amostra rre tamanho 50, obtivemos média amostral 1g,5. co ^;1ïY,1""'::ï:,:"ri","ç2.s-rvo,ó;%;;;%';;."u"f, o""'o,'o' b' para uma confian ça de 94vo, """.,-ì'.í;;"ï;. ï" "onfiunça supondo trêrtamanhos de amostra 25,50 e 100 (admita que ,"J* i"-"ceram a mesmÂmédia amostral igual a lg,5). c. Comente sobre a precisão dos intervalos construídos em (a) e (b). 19.Interprete e comente as afirmações abaixo: "' niÍjide sarário iniciar pu.u r".e- formados em Economia esrá enrre 7 e b. "euanro dilï"":fr::i:ïi^^!-,1"?oi,^3ior é, aprobab'idade da médiaamostral estar próxima aa verOaaeira médiar,. ,0.ilifi,r#0"",f:,1ïïti1,ï:,1,:ll:ll",coresterol é uma variâvetalearória com Ílïï:Jf::T:ï*i:T:iT.1ï;;hJd"";;;#i:iï,iii-i;, ". :ïï,ïï"ïii ï: "1:.1,^,11, "* ; Ëd ffi;ï:l #Ëiï3e c o, e s tero,S: lSt"lqlll, c on stru a o i nterval o d; ã"iü; o J'r,;A :b. Se você desejasse diminuir " "_pfl,rã" à" irntervalo encontrado em a), quaisseriam suas alternativas? ,t;"ï""ï;ïi:"0;,:ïo::,,:.:i u. :.u, variâvet areatória com parâmerros i:ff#ï j:, j r :: "':*:::v' "r : :r ;rd'* ; ; ï'i' :J: ï*'ffi :i:ï *?:ïïJ.ï1T:"i"""ï:::::ï"-::'iã.!;"ï;iï;;'i'3ï:áïi?,"""*": lïï:ïtr"::ï:::j"_"^ j:i,umomédior;;;ï,:i,lá,ïi,;íï'."ï jfiïïff.ì :ut:1l9veis desse modelo e observa_", ;;;;tiJ"r".a. Quem seria um estimador Oo "on*.à médio paradesse tipo? ì todos os automóveis --- ,{+Fs 2iq 1 lt ti'tt'ít'itt,r h. Sc a arl-ìostra Íbrnccctt uln consumo médio dc 9,3 krn/l, construiÌ tllìì irrtcr.v0lo cle confianç d (94Vo) para a média de consumo desses cal'ros. r.. sc a arnplitude de um intervalo de confiança, construído a partir clessu atììostra, ó de 1,5; qual teria sido o coeficiente de confiança? !2. ( ) irrtcrv .aJo 135,21; 35,gg), com confian ça 957o foi construído a partir de uttra iilrìostra de tamanho 100, para a média p de uma população Normal cotlt rlcsvio padrão igual a 2. r. Qual o valor encontrado para a média dessa amostra? ll. Sc r-rtilizássemos essa mesma amostra, mas uma confiança de 900/o, qutl seria o novo intervalo de confiança? 2.ì. A dosagem de certa substância no sangue segue distribuição Normal corrr rrródia pr e desvio padrão l5 mg/I. se uma amostra de tamanho 25 fot colctaclu, clctermine: l. A probabilidade de lX - pl ser inferior a 5' lr. O ìntervalo para É, com confiança 98Vo, se temos Í otts= 98 mg/l' 2.1. Uma amostra de trinta dias do número de ocorrências policiais em um ccrto bairro de são Paulo, apresentou os seguintes resultados: '7,I1,8,9, 10, 14,6, B, 8,7, 8, 10, 10, 14,12,14, 12,g, r1,13,13, B, 6, 8, 13, 10, 14' 5' 14 c l0' a. Fazendo as suposições devidas, construa um intervalo de confiança pilrü n proporção de ãias violentos (com pelo menos 12 ocorrências). Use os dois enfoques e a confiança de 887o' b.Emu-ono(360dias)ecomamesmaconfiançadeBsTo,qualscriau estimativa do número de dias violentos nesse bairro2 c. Dê uma interpretação para os intervalos encontrados em (a)' 25. Antes de uma eleição , um determinado partido está interessado em estirnar u probabilidade p de eleitores favoráveis ao seu candidato. uma amostra piloto de tamanho 100 revelou que 60Vo dos eleitores eram favoráveis ao candidatO' a. Utilizando a informação da amostra piloto, determine o tamanho da amostra para que, com 0,g dá probabilidade, o erro cometido na estimação seja uo miximo 0,05. b. Se na amostra final, com o tamanho obtido em (a), observou-se que 5l% cltls eleitores eram favoráveis ao candidato, construa um intervalo de confiança para p. com confiança957o. 26. A análise de ocorrência de um mineral numa região é uma variável aleatória com média 4 e variânci a 312. A unidade de medida é porcentagem de mineral por unidade de volume' Para uma amostra de tamanho 20: 24Õ fnpltulo 7; ln.f'er?ncltt li,rttttí,t,ticrt - Ils a. Que dizer da distribuição de X? b. Que tamanho deveria ter a amostra para que p(8,5 < X < 4,5) : 9,967 27'? tempo de reação de uma pessoa a certadroga é considerado uma varlraleatória com média 5 minutos e desvio padrão 3 -i;";;;. Esse tempomedido em uma amostra de g0 pessou, "raolhidus, sern reoosicão na eirnrisão paulo. r"rg,rn,u-r;;;"ilffilff: ;'":"'t'tas' ïr p iç , cidade a. O tempo médio amostral ser inferior a# b. o tempo médio na amostra não diferir da verdadeira média por mais de 0, 28' o comprimento de certo tipo de eixo, produzi.do pela empresa Duroaço, :ï:"t""^nj::,:l1l'::t:9: n"ni para peça. A tei de pron"uirìá"ãe ;*#; :"ì?: ::;'"n"iï: ",: : 1".: : on I "" i g u., p órém admi," _, " qu " o ã;;;il ;ffi; Ë:ï::ll::: uT1. uTo:tr_a ateatórii a" róô -ã",*J"ãr.^";;"dJ;; comprimento médio de 4,52 milímetros. a. Construa um intervalo, com confiança 90Vo, desses eixos fabricados pela Durooçà. o. ?.:^r:l_11::ïï"nuo lur? o intervalo encontrado. Será que podemos di ::: ", 1il:.valo. enconrrado em (a) tem probabilidade ;ïíü;'"*";verdadeira média? 29' Numa pesquisa de mercado, desejamos estimar a proporção de pessoascompram o sabonete Bom_cheiro. ". 3.ï:j:f::*j::f::: fevem3s.cylher para que, com probabilidade 0,e; b. c. estimativa não se desvie do verdadei.o uuior;";"i;;;ï;ïi Se tivermos a informação adicional de que a aceitação do sabonete ,Bon.cheiro é no mínimo 0,g, qual deve ser entâo o tamanho da amostra?Decidimos colher uma amostra de tamanho g1. eual o erro máximo quecometemos com probabilidade 0,9? pata a média do compri d' Para a amostra de tamanho gl, qual a probabilidade de que o erro máximoseja 0,08? 30. ,iï::1"::-: :?:ti:: Llolajstriluição Bernouni de parâmetro p. uma 1ï"ï*:tatória.de tamanho 2 é retiradacom o qúj"ìr"ã ã"^;;;,_u, '^ r;rï;, 1ï,j;"?*":ï1T:g"l:,lo,proposros: fr,= i" "-' i,=-0,ã Xr * 0,2 xzl.obtenha a.distribuição amostralìesses estimador", "-'ií"nrã o" il ;Í;,ïsuas propriedades. 31. Sendo X- b(n: I},p: 0,5),pergunta_se: ì a' Para uma amostra de 2 observações dessa variável quar é,a probabilidade damédia amostral ser superior a 9? Justifique. '-t 5 I: r,'r, ti'lrr,r 241 h. l,ru'l Llrno amostra clc 1(X) obscrvações dessa variável qual é a probabilidade rlir rnóclia amostral ser supcrior a 4,72 Justifique' l,lrr.il cstimar a média das alturas (em metros) numa certa população, dois irrstitutos de pesquisa coletaram cada um a sua amostl'a e usaram estimadores rliÍcrontes. Os resultados estão na tabela abaixo: Tamanho Estimador Valor Observado lnstituto I nr :100 frt:X l-,68 lnstituto 2 nz:200 fir:(mar+mi.n)12 I,73 Núm. de viagens 0-2 0-1. e e+r 0+2 Probab. 0,1 0,2 0,2 0,4 0,1 Aprcsente justificativas ao responder as questões abaixo: rr. Você acha que o valor 1,73 está mais perto da verdadeira média por teÍ vindo de uma amostra maior? lr. A verdadeira média deve estar no intervalo 1,68 até 1',73? t'. lnclique qual das estimativas você preferiria usar' t-1.()tempodeemissãodeextratos,emsegundos,pelocaixaeletrônicodeum banco foi modelado segundo uma distribuição Exponencial com paÍâmetfo ll40.Parauma amostra aleatória de 50 clientes que solicitaram extratos: lu. Qual a probabilidade do segundo cliente sorteado na amostra demorar muis de 30 segundos na sua solicitação? ll. Determine a probabilidade de que o intervalo médio de emissão, entfc os clientes amostrados, seja inferior a 35 segundos? .ì.t. O tempo de espera, em minutos, na fila de votação numa certa zona eleitot'Ul com urna eletrônica, foi modelado segundo uma distribuição uniforrnc Contínua com valores entre 0 e 30. Para uma amostra aleatória de 100 eleitores, resPonda: a. Qual a probabilidade do último eleitor na amostra demorar mais dc 20 minutos? b.QualaprobabilidadedamédiadaamostraserinferioralSminutos? c. Você deseja pedir a um amigo que espere um tempo t pata lhe dar umtt carona. usando a média da amostra, qual deve ser o valor de t para niict perder a carona com probabilidade 0,8? 35. Admita que o número de viagens ao exterior é uma variável aleatória, com iì distribuição abaixo, sendo que o valor de I depende da profissão exercida' 0 € {2,3,4, ...}. 3. t:_ __ 246 Y assim. Você poderia ajudáJos e indicar co;"'';;;,,q. "'il'#";4. Deseja-se verificar se o número de falhas procedimento para ãecidir robr" -ur"it;õï ;r; # #3ij ïïr:::::t. ::,i"*:Yï":*T^:-11:1" g" uma moeda, são feiros 100 lançamentos d ïÍTr:"0"^ ïs é contado. Aceita_se oequitíbrio da moeda ,"'ffi:ii: eficiência do critério. uurslu(Js gn ï;:? lïiÌ:.j.il" conrrário, a moeda é consideraau ui.tuou. Discuta .--- ?'l'rrt,' l)(tr(t (t Médkr Pttpultu'lrtnttl 247 lrlirrlc a iD. em qualquer uma das :lrrsõcs discutidas acima: decisões. A figura, a seguir, resume fls É importante ter em mente que, para a argumentação anterior ficnr eO'rpleta, pr"iiru*o, determinar o valor r" e quantificar os erros associados às purrfu"ir conclusões. Observe que, sendo X uma variável aleatória, corremos o lis.,, de concluir incorretamente que o tratamento é eftcaz' Ou, de mOdO rcç,íproco, decidir que o tratamento não é eficiente quando ele é. Portanto, ó neccssário estudar e quantificar os possíveis erros associados à decisão tomada' As duas hipóieses sobre a eficácia do tratamento são denotadas por .Fí,, e 11,,. e, usualmente, denominadas hipótese nula e hipótese alternativa, t'cspectivamente. Assim, Ho : O tratamento náo ê eficaz; Ho : O tratamento é eficaz. Iìssas hipóteses coÍrespondem aos diferentes valores do parâmetÍo p et assim, , podemos reescrevê-las como: Ho : lJ : 18 versus Ho, : 11" : 14. Ashipótesesdelrnrclq4afolmaagima,semconte.r_-desigualdades,são t t' t r ,.1\íf,1, ;s ( ' ft t p lt u h t 8 ; l n|i, rl u c i t t li.r ft t t í,r t i t.t t : .1,t,,,1 t,.r t I t, número como a média do.s conteúdos engarrafados. Discuta um critérioaplicação de multas por diminuição do .oït",iOo enganafado. Um fabricante afirma que sua vacina previne g0Zo dos casosdoqnea,_Um grupo de médicos d"."oniiu que a vacina não é de uma tão efic 8.2 Teste para a Média populacional Vamos desenvolver as idéias gerais de testeinicialmente, que o modelo Normal é aãequado para osgerais serão comentadas ao final desta seção. de hipóteses supondo, dados Situações mais )ï ï"":* I ;,f "" : *,":::ï.::1ï ::: em res tar s e. a médi a p opu I ac i on ar(r[.r irl*),?,,!^o:^"i:::T-?re.os indivíduo, p".,"n""m à populaçr" #rïoJ::""t"ïI1 ::,;ï ::ï:_: j:: trl1l " t t, y1lo. qu" ..à,,".f il;;;õ;drr" ï" #;Hïffi : ;iiï,#1Y:":ï, 1- T:dt". popuracionar,,tli;;i";;',;"; ;*n'ï ;#i; :il:ï::: : -" ? ":,ï1 o'. n ã; ;; "ï;i; ;;;;,"* ïï , :'3L#" J*: ï "ï:ï;lï:l:ïii""i:f:i:r::1o-!:""u,,õ-.-;."-;;i'J::'ffi ïï:J:',ï:ïeficâcia do tratamento proposto. Pelas suposições feitas no Exemplo 8.1,, a concentração da substânciasegue um modero Normar com desvio pádrao o" o uniáuãrv*r Então, para otamanho de amostra iguar a 30, a média amostrar terá distribu içã,o N(p,, 36/30).Por ser uma variável aleatória, -t poderá apresentar uuro.", maiores que 14,mesmo quando F: L4. De fato, sabemos. que p(X > 14 I tt : I4): 0,b pelasirretria da distribuição Normal. um critério que pode ,"rìtftruao, para decidirsrlrre o valor de pt,'ê determinar um varor crítico, digamos r., tarque, se x forturior que r", concluímg, ql"-l amostra pertence-à polpulação "com média p : Ig,rrrr scj., o tratamento não é eficaz. por ãutro lado, quando a média amostral forr.'i'a(ìr .tr igual ao varot .r,., concluímos que a amostra pertence à população comnÈrlirr 1t' : 14, sendo o rraramento considerado eficaz,.ii;;;;p, como x é umavgri:ivt'l irlcatória contínua, em termos probabilísticos, poddfnos incluir a ,t"nolr;níaiífi fr *iií'rlplã,*Ú-nq's-,99mqq-o-usol:.4n4teggvccmpostas' ustas últimas podem ainãì-s-er-õraJiiriCáOas õõmó ünj!4érái; õs--b-i,t-atèÌaií cle ominadas tfi_grd-"úod*'sr_ainã-a se, úJ'l "ad ó 'jiqt r iJ q-u-i,t-atOtnig clependendo do interesse do pstu-do' No caso do tratamento ser eficaz, é razoâvel assumirmos que ele foi capaz de fazer com que os indivíduos da amostra mudassem para uma população cuja média é inferiór a 18 unidades/ml, caso contrário, se o tratamento é ineficaz, p, não se alteraria. Assim, as hipóteses de interesse seriam escritas como Ho i F: IB versus Ho : 1t' {-18, Nesta situação, temos--o l:e! te Qe lipó1eses unilateral' 248 '{"ç' eapftulo 8: Ittlt'r0ncfu lilttttít;tiut; Tt:,rtt:.r dc IIil IEIF' ,\.J ??,rlr' l\tï(t (t Méilfu Pqnldt'ilurttl 249 _se o tratamento produz algum efeito, se,ia ele 18), devemos construir um tustu*de hipóíeses L Ho i F:78 versus Ho,: l-t# Ig., Por conveniência técnica' sempre, deixamos a igualdad) na hipótese nula.os dois erros que podem ser cometido " g/ ," rèahzar um testehipóteses são: _ I (i) Rejeitar a hipótese .ÉIo, quando tal hipótese é verdadeira, e ,"t'"\ (ii) Não rejeitaia hipótese ã, quando eia deveria ,"r."i"i,uau. Note que nenhum erro é cometido e a conclusão é correta, quando rejeitamos e ela é falsa, ou, quando decidimos aceitâ-ra, no caso dela ser verdadeira. Ao rcometido em (i) denominamos erro do tipo I enquanto que ao erro emdenominamos erro do tipo 1L A figura, a seguir, ,".r,n" u, porriu"r, situações: Figura g.I: Erros associados a testes de hipóteses. como veremos- adiante, uma parte importante do teste de hipóteses controlar a probabilidade de cometermos o ".ro do tipo I. Essa probabilidade denotada por a, sendo B a probabilidade de erro do tipã U. tsto e, a: P(erro tipo I) : P(rejeitar Hol Hoverdadeira); 0 : P(erro tipo II) : p(não rejeitar H,l Hofalsa). Considerando as hipóteses I1u : 7_r : seguinte interpretação para os erros: rv : P(concluir que o tratamento é, eficazquando na verdade ele não é); {) : p(conctuir que o tratamento não é efrcazquando na verdade ele é)' A situação ideal é aquela em que ambas as probabilidades, a e B, são 1rr(rximas de zero' Entretantó, é fárcrl ver que à medida que diminuímos rvn a plrbabilidade de erro tipo II tende aaumentár' Identifique, na Figura 8'2, as áreas rclativas a a e B e veia como, dependendo do posicionamento de tr", a diminuição tlir írrea correspondente a a implica em um aumento da área correSpondente a B' l,cvando isso em conta, devemìs cuidar para que, .ao definir as hipóteses' o erro rrrais importante a ser evitado seja o erro áo tipo t A sua p19p1b!!idad19 lgnos o - rrorne de nível de slg!19ryçLa-do-teste' Pata verificarmos (p < 18) ou danoso (p ) 14 xc 18 RrBiAo rt, Rri"içoo i R ção Figura 8.2: Representação gráfica dos erros a e P' supondo a conhecido, vamos descrever çomo determinar o valor crítico :r;,.. Inicialmente, note que com z - lú(0,1). Portanto, dado a obtemos z"natabeladaNormal e calculamos r" da seguinte forma: a: P(errotipo I) : P(rejeitar Hol Houeldadeirl)' X-u ,"-18',: P(X 1r"lF: 18) : '(;mt u6, : P(z 12"), t---' Sadio ( 11, ) IB versus H, : F < 18, temos 250 i - _n"_79L4--' 6/Jn Por exempl o, paraa : 0,05 ternos, Capltuln 8: Inïbrênt:ia Ettttttí,rtit,tt: Tt,rtet ile I ) r,. : L8 * z"+) \/Bo 0,05:p(Z<2.)è2,. logo, r" : 18 - 1,64#õ: 16,20. Umavez colhida a amostra, se a estimativa.7'o6ré tal que ro6, { l :"#,::::j^t::,:::::la concluindo que o rratamenro é, efrcaz.A regiãopelo conjunto dos números reais menor", qu" 16,20 éo"no.i#ii:i:;r;:Rejeição ou Região crítica e representada por RC. Assim, RC:{r €lR:e<16,20}. Denominam os Região de Aceitação (RA) aocomplementar de RC. ,s; ::n;',.:"lj:ll l:-:".i. i",,r'nu-, iï'zl; : r r,;;; q ue perrenceRC, rejeitamos 11o ao nível de significânci--v' vJvrlqr'vò rro 4u rlv o l lfl cia a:0,05. Graficamente a situaçãopode ser visualizada na Figura 8.31 "- que as curvas reDresenrâm q rÌicÍriL,,i^ã^p ta a distribuição i:,ï'!ï;*"::,,::,:oi:i?lerinidap'ln-ri-:il;;ilï;i:;::;;:ïï::H" (p : L4 para a curva Sadio). Resido d( R!eiçào2220 18 ì,,;, Fígara 8.3: Representação grdfica da região de rejeíçãp_ unilateral. Sadio ( 11" ) r-- -- 251 A construção de testes de hipóteses lilg1erylq é feilt !-9 ryr-4xeira similqr È . - gpurr"nodu poru à "^o- üni!a19-gJ, -eIq9la,qug. qgqla, devem-oq-c-qpriderar gJng ãïsino de ilejeiçãq-c-oú'peúà-!ç- dueq-pgger-4qj-u1tas,-Pari, "l:T{:T,i: ã.1 I'ttte pilr(t u Média Poptrlü'hurtrl ,ãitf,,nt,o que p; é uma "óntiútôiôntróciaa e que as hipóteses nula e alternativa ãtlo cxpressas como A l{cgião Cryyga' serâdadapsr-- RC;fut eR ic í-{,", Ptt-g) 16}* e, piìra um valor a fixado, determinamos os números Íc1 e :x', de modo que P(N<ïctoL4X>r"r):a' Dirda a simetria da densidade Normal, distribuímos a massa a igualmente entfe as cluas partes da Região de Rejeição' Isto é, P(X < r,,): P(X > r"") : A í'igura a seguir ilustra, graficamente, a escolha dos valores críticos. x", lro x', Figura 8.4: Representação grdftca da região de reieição'bilateral' Nopróximoexemplo,faremosumtestedehipótesesbilateral calcularemos a probabilidade do erro tipo II' Ho i F: [Loi Ho : p.f po. a 2 o -e2 Distribuição de X sob Hs -!iç|r 256 Co p ít u I t t {l : I n /i' rê n c fu !i:t kt I lst i r t t :,1'e ;t I r,r t I t: I I i prl t e ses sabemos que o merhor estimador para p .é, a proporção amostral p cudistribuição pode ser bem aproximada por um modelo Normal, isto é, admitimos ì-N(p,p(t-p)/"). Dado que o teste é bilateral, a Região Críticaé da forma RC: {r e R l, < p", ou r > p.r}. Para a: 0,03; os valores pc1 tr p", são calculados através de P(ì < P.,lHo) : ry " P(ì ) p.,lHò :ry Sob a hipótese Ho,p:0,40 e, portanto,,remos â _ lf{4ã,\*00). Assim, P(ì < p.rlH,): pç3;!#-. _p",_9iaor \/o,24l4oo \/o244ool : 0,015 . Da tabela da l/(0, 1) segue que p". - 0.40 Jd24M- -L)Lt' As11m, obtemos p.1 : 0,842. De forma anáIoga encontramo s p.z :0,4b3 eregião crítica será dada por RC : {r e JR lr < 0,84T ou r } 0,458}. A amostra forneceu i,t, . .L20/400: 0,300 que pertence à região crítica. Dessa l"::*:: :t" lTo q qu,". o h ip ó te s e nu I a de ve . ; ."r, ; ;;;"-",;"J; :" ;Z;', isto é,o relatório da companhia não está correto. Exercícios da Seção 8.2: 1. uma variável aleatória tem distribuição Normar e desvio padrão iguar a 12.Estamos testando se sua média é igual ou é diferente de2õe coletamos umaamostra de 100 varores dessa variável, obtendo uma média a-;r;;i;';:;"'" a. Formule as hipóteses. b. ob-tenha a região críticae dê a conclusão do teste,{ara os seguintes níveis desigìificânci a: I!o, J%, 4Vo, 6Vo.e gTo. ,ú '- * "" "" a -- @ 8,)'l'tslt: pdrct 4 Médla ltoPulnthmrl !. lrara uma variável ateatória com densidade Normal e desvio padrão 5' o teste cla rrróclia lt : Llcontra Lt = 14, t"y"i região crítica aa{1.99r '{r € R : o >. 12} 'iÌráÌ uma amostra de iamanho 25. Deteimine as probabilidades dos erros tipo I oIL .ì. urn estudo foi desenvolvido para avaliar o salário de empregadas domésticas ntr cidade de são p"rl;. roràÍn sorteadas e entrevistadas 200 trabalhadoras. Admitaqueooesviopadrãodessavariávelnacidadeéde0,8salários mínimos' ^ Áiotrìh.icãn rlo el ' é possível fazgrn. Você conhece a distribuição d stimador X? Se não alguma suPosição? b. Deseja_s" tesài se a média é igual a 3 salários mínimos ou é menor. Formule as hiPóteses adequadas' c.Paraumníveldesignificânciade3Eo,constfl]aareg|áocrítica. d. Se u u*orr.u foï"""u média de 2'5 salários mínimos' qual seria a conclusão? 4.oconsumomédiodegasolinanumcertotipodeautomóveléde15km/litro, segundo ir.,ror-uço* "da montadora. uma revista especializada verificou o "oïro-o em 25 à"..", veículos, escolhidos ao acaso, e constatou consumo médio de 14,3 km/litro. Admita que o consumo siga o modelo Normal com variância igual 9 (km/litro)2' a. Teste, uo niu"i-J" signíficânciade 6vo, a afirmação da montadora de que o média o" "onrrr-o iiguut a 15 km/litro, contra a alternativa de ser igu^l ' 14 km/litro. b. Determine a probabilidade do erro tipo II' 5.Avidamédiadeumaamostradel00lâmpadasdecertamarcaé1615horas. por similaridade com outros processos de fabricação, supomos o desvio padrão igual a 120 horas. úilizando a:57o, desejamos testar se a duração média de todas as lâmpadas dessa marca é igual oo é dif"t"nte de 1600 horas' Qual é a conclusão? o"t".rrrin" também u pÃuuuitiaade do erro tipo II, se a média fosse 1620 horas' 6.Umcriadortemconstatadoumaproporçãodelr}vodorebanhocomverminosc, O veterinário uri"à a dieta dos animáir e acredita que a doença diminuiu de intensidade.Umexameeml00cabeçasdorebanho,escolhidasaoacaso' indicousdelas"o-u"''ninose'AoníveldeïZo,hâindíciosdequea proPorção diminuiu? 258 Capltulo 8: l4ferência E$ntí,ttlcet; Te,rtes rle Ilipríte 8'3 Teste para a Média com variância Desconhecida os testes de hipóteses e intervalos de confiança para média, q :::"r'"ï:Tï'^:j: iq": pressupõem .qu: o valor da uuriãn"iu popuru.ionaiconhecido' Apesar de ser um caso particular, existem várias ,tró.ilrïï;ï ;ïi.ï:Í: :3ï:i:,: Tlïl"]..lly exe3nro, nump.rocesso indusrriar, se puderassegurar que uma certa máquina fornece *"àidu, "o- fr""irão const :ïi:"1ï:,,:T1l11iL1gconhecida.. uma ourra situação sËria aquela empodemos utirizar resultados enconrrados em outros trabarhos, ;:Ë"ff#lïi ::ff:ïï,:: :'-,.1,::1":.:l:",1*:, que manrenham alguma similaridade com oproblema de interesse. Entretanto, 'no caso mais g"rul, q#i;'#; ::ilolinformação sobre a variância da variável . areatória q,r" ;J; sendo estudada,precisamos contornar essa dificurdade. Ìnicialmente, ryanterqnos a suposição doque a variável aleatória de interesse tem distribuição úrmal.b."e!" não Normalserá comentado no final da seção. -- --5*" ^ rvrr'*r' v- i;;]!*s'V"lo.,l*ï: 1"'*"hecido, ele precisa ser estimado. supondo :ï: ""'y in1^ï:l !:?r:r::"ju.r:p.r"::ntada pero veror de variáveis aleatóriagffi:;;:ï:ï#:nfilizqt n ri-oll^^*tr ^^.:,-, r - ,ïilJ;'l',"ïi Capítulo 7 , é, a vafiãncia amosrra( S, : çiXl _ nX211çn_ lt) Definindo agora avariável ouA.onìjI padroniZàda T: X-l' -X-'p -{-Lr x-À, /S'/, t S/Jd{q;l vemos que T também é uma variâver ur"ìt-,:riu. Entretanto, apesar de x terdistribuição Normar, o denominador envolve a variâver areatóriL's2, que fará comque a função densidade de ? seja diferente da Normal. Esta náva densidade, quepode ser deduzida teoricamente, é denomi \gjq t de stqde4t er* pura-"tro tem o\e\?de-slqusdcJiher4qde-nest{íaso"ú"íponoã"ãïã"i"ËrãËïï;;;;;:- 1' A notação utìlizqda Le!-4 !1,-1,e, devido a "ompte*ia"à" au sua funçãodensidade, as probabilidades são ouiiau, de taberas consìruídas numericamente. Aexemplo da Normal, o modelo t-student tem densidade em forma de sino,gnlrqtaItto as-cau-das tem 4narol mq$,s3 qUe A_ry(0, f) (veja a fig"r" S.Zl. ^^-..^_^Y,11" x911f--9Ì9r se o tamanho 4a [qrostra aqruenta., a dp1.1s-idadçJ.sndent çorvgJge par-? a Noirnal p4drão. porìsia razã,o, as taberas conriruioa, se limitama valores de gr-auìTel-iueraaáe menores ou iguais a r20.p;;; graus superioresa 120, as probabilidades são obtidas da tabela da distriÀição Normal e - ll. | 'l\'ste l,(tftt (t Mfulirt utttt Vttri{lncit Dcst.orthcte:itkt .4 259 reprcsentados por "oo" na tabela do Apêndice A. Tal fato é r:rirrsistência do estimador 52 para o2, que faz com que a rrlrltrxime de Z àmedida que aumenta o tamanho da amostra' conseqüência da quantidade ? se Figura 8.7: Densidade t- Student. Diferentemente do teste de hipóteses, construído para o caso em qUC S variância é conhecida, a região crítica envolverá agora o termo,52, que é umA quantidade aleatória. Dessa forma, amostras diferentes podem fornecer regiões críticas distintas uma vez que, possivelmente' elas produzirão estimativas diferentes para o2. éS!-Uq, qguo{q u Jqi4fql41gq-dqqqouhesüa' optarçmos por utilizar na região crítica valores da qlantidade padronizadaT. Apresentamos esse procedimento no próximo exemPlo' Exemplo 8.5; Deseja-se investigar se uma certa moléstia que ataca o rim altera o consumo de oxigênio desse órgão. Pata indivíduos sadios, admite-se que esse consumo tem distribuição Normal com média 12 cm3lmin' Os valores medidos em cinco pacientes com a moléstia foram: 14,4; 12,9;15,0; I3,7 e 13,5' Qual seria n concluìão, ao nível de lvo de significância? ?t 'u'o I : qti,'\ O teste de interesse é: Hn : Amoléstia não altera a média de consumo renal de oxigênio; Í1, : Indivíduos portadores da moléstia têm média alterada' 260 Capltttlo 8; lttferência Esrnrl,rricn; Trs,te,y rle iliyitere,r 1)ea Em termos da média populacional, estamos testando as hipóteses: Ho : p,:12 versLts Ho : pt f L2, e a região crítica é da forma nC:{t€Rlú {t1ou 1>tz}. Sendo o2 desconhecido, usaremos o estimador ^g2 : rixr - rxr,1çn _ quantidade ú discutida anteriormente. sendo n, u"rauíãlu, t",'o. x-tzt:uru-tu)' Logo, l\T. úr) :0, 0r/2 + tt : _ 4,604;P(T > úz) : 0,005 * tz - 4,604; sendo o varor 4,604 obtido da tabera da distribui ção t-student, com4 graus deliberdade. Assim, a região crítica.".áOuão po. RC : {te Rlú < _ 4,604 ou t } 4,604}. Sendo Ìobs :13,90 e s|tr:0,62; calculamos o valorpadronizado tor," : Ìon - 12 - 73,90 - 72wot)s - ;,JG: o,nrc:5,18' Portanto, como Í,6, 5 RC d""ioimos pera rejeição da hipótese nura, ou seja, amoléstia tem influência no consumo ,"rr'J^,neoio de oxigênìo ao nível de rvo. tr Intervalo de confiança para p, com variância desconhecida euando a variância é desconhecida, construímos intervaros de confiançapara a média popuracionar ut'izando o n'i"to t_irrilïi. ô'0."""0r_enro para aobtenção do inrervaro é semerh;;," ; desenvolvid" "J- ""pr,uro anrerior.Supondo uma amosrn ateatória ir,.|.",X,, obtida;; ;;; população comdistribuição Normal com média e variân"ìa'desconhecidas, temos que ru .qIF u..l'l'esle P(tr(t (t Méelkt t'ottt Varlllnrht I )ttctnrltcciiltt !{ 26l, {t Desta forma, fixando-se o coeficiente de confiança 'y (0 < 1. <. L) e utilizando a tabela da distribui çáo t--Student com n- L graus de iiberdade (ver Apêndice A)' podemos obter o valor t^,p tal que X-uP('t1p.ffi< trlz):"t' Logo, o intervalo com coeficiente de confiança 'y para É" com variâncin desconhecida, será dado Por q - S.rC(t",ì:lX- ht2 Jn;X+ hn76l Exemplo 8.6; Considerando o exemplo anterior, úfna vez que decidimos pela rejeição da hipótese "ri", e boa prática fornecer um intervalo de confiançâ pnrtt tt média populacional. Naquele exemplo foram obtidos Íut," :13,90 e S3r," = 0'67' ComT:0,g0obtemos,databeladadistribuiçãot-Studentcom4grausde . liberdade, tt12 :2,L32. Logo' IC(1t,90Vo) : [13,90 - 2,132J o,w I s;13,90 + z,tzzJí,w 1 s 1 : [tS,OO; l+,7I]1. deconfiançâ "i.on,.uOo não inclui o valor L2parapl' que foi a hipótese nula no E.;;;1" 8.5. Dessa forma, confirma-se a conclusão de rejeiçiio da hipótese f/, . Se a variável de interesse, além de ter variância desconhecida' não tiver densidade Normal, J n"""rrário utilizar técnicas não-paramétricas para 11 realizaçãodotestedemédia.Nãoapresentaremosessametodologiaaqui, entretanto, um caminho para contornar essa dificuld ade é, novamente' considernf um tamanho de amostra suficientemente grande' Neste câSo, é sabido que '52 se aproxima de oz de tal forma que o seu úo, jrintamerrte com.uma aplicação do Teorema Central do Limite, permite "on'iã"'ut -Í como tendo distribuiçio Normal, resultando em aproximações bastante satisfatórias do ponto de vista prático. 2()6 Capítulo B: Inferência Estatística: Testes de Hìfuóteses j I o nível descritivo nos fornece uma idéia da intensidade com a quaì estamosrejeitando, ou não, a hipótese nula. Dessa forma, tem papel importante do pontode vista exploratório, üma vez que pode nos fornecer indicações para pesquisas futuras. E Exercícios da Seção 8.4: l' Um pesquisador está, realizando um teste para a média e obteve nível descritivoigual a 0,035. Ele aceitará a hipótese nula para níveis de significância superiores ou inferiores à 0,035? 2. uma variável aleatória-tem distribuição Normal e desvio padrão igual a 10.urra amostra de 50 varores dessa variável forneceu média igual a 15,2. para cada um dos testes abaixo responda qual é o nível descritivo. ' t, H,, :1-l : 18 versus Ho i p : IJ.C/ h. Hu : &: 18 versus Ho: p, < IB. c. H,, : l-t: IB versus H, : pt I Ig. d. H,, : l_t: 17 versus Ho : p,: llr. 3. A resistência de um certo tipo de cabo de aço é uma variável areatória modelada pela distribuição Normal com desvio pádrao 6 kgf. uma amostra detamanho 25 desses cabos, escolhida ao acaso, fôrneceu meãia igual a 9,g kgf.Para o teste p : 13 contra & : 8, qual é o nível descritivo? eue conclusãovocê consideraria adequada? 8.5 Testes QuïQuadrado 267 4. Sorteamos, ao acaso, 12 observações de uma variável aleatória que segue o modelo Normal. Da amostra obtivemos média 21,7 e desvio padrão 5,5, Determine o nível descritivo do teste F:18 contra p > IB. 8.5 Testes Qui-Quadrado Apresentamos, nesta seção, três testes que utilizam o modelo Qui- Quadrado como estrutura probabilística e, por essa razão, são denominados, de Íbrma geral, Testes Qui-Quadrado. Iniciamos testando a adequabilidade de um modelo probabilístico para uma dada situação, depois discutimos o teste de independência entre duas variáveis e encerramos a seção com o teste de homogeneidade de subpopulações. Nas seções anteriores, nosso problema foi testar hipóteses sobre os parâmetros média e proporção. Em geral, as formas das distribuições de probabilidade eram conhecidas (ou seriam aproximadas) e tínhamos que decidir cluanto a aceitar uma ou outra hipótese, sobre o valor desse parâmetro. Em termos práticos, outra situação comum é termos observações de uma variável aleatória cuja distribuição na população é desconhecida. Nesse caso, uma das primeiras providências é tentar identificar o comportamento da variável com um modelo tcórico. Em algumas situações, é possível incorporar informações de outras variáveis que descrevam fenômenos aleatórios similares e tenham distribuição 'conhecida. Dessa forma, teríamos um candidato a modelo e nosso problema serin cstabelecer um procedimento para aceitárlo ou não. Existem, contudo, vÍlriOS outros casos em que não se tem a menor idéia do comportamento da variável, Uma das maneiras iniciais de análise é construir um diagrama, com as freqüências cle ocorrência, nos moldes do histograma. Dessa representação gtáfica, pode sair a sugestão de modelos adequados aos dados. Em qualquer caso, o modelo proposto pode ser testado através do chamado Teste de Aderência. Nesta seção, itpresentaremos um desses testes que usa a distribuição Qui-Quadrado, outros testes de aderência podem ser encontrados nas referências mencionadas na bibliograiia. Considere uma variável X para a qual temos uma amostra de valores e cleseja-se verificar a adequação ou não de um certo modelo probabilístico. Os valores observados da variável foram divididos em k categorias contendo, caclo ulra, um ou mais valores que são apresentados numa tabela de freqüência: Categoriit 1 2 3 h lìrect, Observarlit O1 O2 Or oÀ, 268 Capítulo 8: Inferência Estatística: Testes de Hipóteses Se X for discreta, as categorias são os próprios valores da variável, eventualmento agregando mais de um valor na mesma categoria. No caso contínuo, as categorias são definidas a partir de faixas de valores da variável. Do modelo que está sendo sugerido, calculamos as freqüências esperadas em cada uma das categorias. Assim, Categoria 1 2 tJ k Freq. Esperada e1 A2 93 êl'., se x seguir o modelo proposto, essas duas tabelas não devem ser muito discrepantes. o teste de aderência cria, então, o critério, pazá?èèiÇir se podemor aceitar ou não o modelo indicado. Em outras palavras, decidimo\ se os dadog amostrais oderem ao modelo ou não. As hipóteses do teste são: \ Ho: X segue o modelo proposto; I Ho: X não segue esse modelo. A quantidade que usaremos para tomar nossa decisão será baseada na diferença entre os valores esperados sob -F1, e aqueles observados na amostrô, Podemos dizer que a diferença oi - ei dá uma idéia da compatibilidade entre og valores observados e o modelo proposto. Assim, se as diferenças forem muito grandes, é razoixel admitir que o modelo não deve ser adequado. por outro lado, pequenas diferenças podem ser aceitas, pois estamos sempre sujeitos a flutuações, quando trabalhamos com variáveis aleatórias. Baseando-se nessa idéia intuitiva, a quantidade utilizada no teste será: o,:fg=_:,y . i:7 vx sendo que k representa o número de categoriaS, o; â freqüência observada e e4 q freqüência esperada para a categoriai. Para interpretar a expressão d" Q2, note que o termo o,i. - et indica g diferença, na categoria e, entre a freqüência observada e a esperada ou, em outraÉ palavras, o desvio em relação ao modelo proposto. Se, simplesmente, fizéssemoB a soma desses desvios para todas as categorias, obteríamos zero, pois o total dc dados é o mesmo. Para evitar isso, tomamos o quadrado dos desvios. Entretanto, por serem quantidades não negativas, sua soma poderia se tornar artificialmentc alta e, por essa razáo, é conveniente fazermos uma mudança de escala dividindo esses desvios ao quadrado pela freqüência esperada. Somando agora, para todae 8.5 Testes Qui-Quadrado irs categorias, obtemos a expressão de Q2 que é, assim, uma medida da d iscrepância que queremos quantificar. É possível demonstrar que, para um tamanho de amostra suficientemente grande, a distribuição de Q2 pode ser aproximada por um modelo Qui-Quadrado com parâmetro k - L, denominado de número de graus de liberdade da, rlistribuição. Essa distribuição é representada por X(r-1. O modelo Qui-Quadrndo ó contínuo e assume valores não negativos. Sua densidade tem uma expressão complexa de forma que probabilidades serão obtidas da tabela apresentada no Apêndice. A aproximação para o modelo Qui-Quadrado será melhor, se todas as l'r'cqüências esperadas forem ao menos iguais a 5. Se isto não acontecer pâra irlguma categoria, devemos combiná-la a uma outra de forma conveniente, glrantindo que todas as freqüências esperadas atendam a esse critério, lÌctomamos agora o Exemplo 8.2, construindo formalmente o teste de aderôncia. Iixcmplo 8.9; No Exemplo 8.2, definimos X como sendo o número de impactos ttttteriores à falha em um equipamento eletrônico. Uma amostra de 80 ensaios foi obtida, cada ensaio representando os testes feitos até a intemrpção por falha no r.rrluipamento, resultando 80 observações da variável de interesse. Pretende-se vcrificar se o modelo Geométrico com p : 0,4 ê adequado. O teste será: Ho:X-G(0,4); H,: X tem outra distribuição. A rlecisão será baseada no comportamento de Q2, definido acima. Considerando o lrrrnanho de amostra grande, a distribuição de Q2 pode ser aproximada pela Qui- (Juadrado, com número de graus de liberdade que depende de quantas categorias scriro estabelecidas. A região críticaé constituída de valores grandes de Q2, isto é, RC : {ta : u2 q,,}, r'orì'ì q(, sendo determinado pelo nível de significância do teste, ou seja, *: P(Q2 ) q,,lHu verdadeiro). Para determinar o valor observado de Q2, denotado por qf;,,", precisamos olrtcr as freqüências esperadas. Se 11, for verdadeiro, X segue o modclo (icotrótrico, isto é, P(X : k): pt':0,4 x 0,6È. Logo, lìreq. esperzrda clc rcsistôncia a À, impactos : 80 x Pl, : 80 x 0,4 x 0,6Â'. Nir tabcla, a seguir, ilpresentilnìos ns l'reqüências esperadas e os valores que foram obscrvados no teste cle resistênciit t'enlizaclo. 2ó9 270 Capítulo 8: Inferência Estatística: Testes de Hipóteses Impactos 0 1 2 3 4 mais de 4 Freq. observada 30 26 10 5 5 4 Freq. esperada 32,0 19,2 11,5 6,9 4rr 6,3 como a categoria correspondente ao valorZ tern--{eqüência esperada igual a 4,1 que é menor que 5, agregamos as duas últimas categorias formando a dos maiores de 3, a qual terâ a freqüência observada de g e.esperada de 10,4, Então, q1u,: (30 - 32,0)2 32,0 e6 - Le.2\2---tgp-+"'+ Quadrado, com 4 graus de liberdade. Temos, P(Q2 > q.l H.) - a + P( Q' > A.l H"): 0,0b. Consultando a tabela na linha correspondente a 4 graus de liberdade e na coluna de \Vo, o valor crítico será q" : 9,49 que é maior que o valor observado de 3,44, concluímos pela aceitação do modelo proposto. A próxima figura apresenta a densidade do modelo Xl coma região críticado teste. tr qí,"= e,q+ e,4e Fígura 8.11: Densidade X! e Região Crítica. Í (x) 8. 5 Testes Qui-Quadrado 27t Uma situação bastante comum é aquela em que desejainos testar se um& variável segue um certo modelo, mas desconhecemos.um ou mais parâmetros da distribuição. Sendo assim, vamos utilizar a amostra para chegarmos às estimativas dos parâmetros desconhecidos, isto é, utilizando as próprias observações que dispomos, vamos obter estimativas que serão consideradas como valores dos parâmetros desconhecidos. Nesses casos, o número de graus de liberdade se altera çtara k-I-e, com e representando o número de parâmetros que foram estimados. No próximo exemplo, ilustramos essa situação ao testar a aderência de um conjunto de observações a um modelo contínuo. Ilxemplo 8.10: Deseja-se verificar a afirmação de que a porcentagem de cinzas contidas em carvão, produzido por uma certa empresa, segue a distribuição Normal. Os dados, apresentados a seguir, representam a quantidade percentual de cinzas encontradas em 250 amostras de carvão analisadas em laboratório. Cinzas (em 7o) freq. observada 9,5 l- t-0,5 2 10,5 t- 11,5 5 rL,'l- L2,5 16 12,5 l- 13,5 42 13,5 l- 14,5 69 14,5 l- 15,5 51 15,5 l- 16,5 32 16,5 l- 17,5 .\tZ.) 17,5 t- 18,5 I 18,5 l- 19,5 1 (lrral decisão devemos tomar ao nível de significância de 4%o? Como desconhecemos a média e a variância da Normal que será testada, prccisamos, inicialmente, obter suas estimativas a partir da amostra. Os melhores cstimadores desses parâmetros são a média e a variância amostral, representados 1,,,r X e ,S2, respectivamente. Para calcularmos suas estimativas, tomamos o ponto rrróclio do intervalo como representante dos valores da respectiva classe. Entflo, lrrììos ì:Ía,"-I4,5; G2=s?t":2,7. l)cnominando por Õ n vnritlvel nlentóriui porcentagem de cinzas contidas no 'ì\ í,'6 ' 276 Capítulo 8: Inferência Estatística: Testes de Hipóteses Na construção da tabela de valores esperados, caso alguma casera tenha valor menor que 5, será necessário agrupar categorias. Este procedimento visa garantir uma melhor'aproximação para o uso do modelo Qui-euadrado para e2 . consideremos agora o chamado Teste de Homogeneidade. Esse testol consiste em verificar se uma variável aleatória se comporta de modo similar, ou homogêneo, em várias subpopulações. Apesar da mecânica de realizaçáo do testc ser semelhante a do Teste de Independência, uma distinção importante se refere à forma como as amostras são coletadas. No teste de homogeneidade, fixamos o tamanho da amostra em cada uma das subpo-pulações'e, então, selecionamos u amostra de cada r as subpopulações uma delas. Na tabela apresJiltaqa a seguir, as linh ; e, as colunas, os diferentes valor\s ou categorias , Subpopulações Valores da variável total de linha I ott otz TL1 2 ozt ozz TL2 total de coluna total Geral as represe da variável. Fara o cálculo dos valores esperados (supondo homogeneidade entre at subpopulações), utilizamos, para a casela (i,, j) , total da coluna j €i,.i : Tti " ,rur ,"rur O total de linha ni indica o tamanho da amostra da subpopulação i,, ao passo quê o quociente, total da coluna j dividido pelo total geral, representa a proporção dc ocorrências do valor da variável correspondente à coluna j. caso haje homogeneidade de comportamento da vàriável, esperamos que essa p.oporção seja a mesma, em todas as subpopulações. No próximo exemplo, apresentamog mais detalhes. Exemplo 8.12: Estamos interessados em saber se a preferência por certo tipo de Í'ilme se altera com o estado civil. Selecionamos pessoas em cada uma dag subpopulações: solteiro, casado, divorciado e viúvo. Os resultados estão na tabela a seguir: lJ. 5 Testes QuïQuadrado 277 Estado Civil \ Filme Policial Comédia Romance tam. amostra Solteiro 45 25 30 100 Casado 36 61 43 L40 Divorciado 39 36 35 110 Viúvo I4 19 L7 50 total 134 t41. t25 400 Na tabela anterior, a última coluna representa o tamanho da amostra sclecionada em cada subpopulação. Observe que esses valores foram fixados lntes da coleta ser realizada. As hipóteses a serem testadas são: Hu : Apreferência por certo tipo de filme é igual para qualquer estado civil; H; : Apreferência muda. A proporção dos indivíduos que preferem filmes policiais é 1341400. Se a variável Filme for homogênea entre as subpopulações de Estado Civil, devemos tcr essa mesma preferência por filmes policiais, para qualquer estado civil. Logo, o valor esperado de preferência pelo gênero Policial, na subpopulação dos solteiros, deve ser I00xL341400. Para as outras subpopulações, multiplicamos 1341400 pelos respectivos valores do tamanho de amostra, que são diferentes tìcsse exemplo. A tabela de freqüências esperadas é apresentada a seguir: Estado Civil \ Filme Policial Comódia Romance tam. amostra Solteiro 33,50 35,25 37,25 100 Casado 46,90 49,35 43,75 t40 Divorciado 36,85 38,78 34,37 110 Viúvo 16,75 L7.62 15,63 50 total 134 741 t25 400 Cirlculamos a quantidade Q2 damesma forma como fizemos anteriormente, isto é, virmos quantificar a "distância" entre os valores observados e aqueles esperados, sC houvesse homogeneidade. Assim, '' '- (oi,i - ei'.i)2 "-:LL;:r i:L et'i para um número grande de observações, a distribuição de Q2 é Qui- Quadrado com (r - 1) x (r - 1) graus de liberdade (r, número de linhas e s de colunas). A regiào crítica contém vnlores grandes de Q2, isto é, Cupítub 8: InJèrência Estatístiaa: Testes de Hipóteses RC:{u:w}q"}, corn qí, sendo determinado pelo nível de significância do teste, ou seja, a: P(Q2 ) q.lHo verdadeiro). Escolhendo a : 0,05 obtemos, da tabera da densidade eui-euadradocom 6 graus de liberdade, g" : I2,5g. portanto, -,, RC:{w:w>I2,59j. Para o valor observado de Ç2 temos: --\ Q?,,,. :(45 - 33,50)2 + (36 - 46'90)2 + ... -L (rL.- ,r,ur;,Y(,hs - 33J0 - -- 46p0 -t_ 'f Ë : 13,29. concluímos pela rejeição da hipótese nula, ou seja, a preferência de firmes não é, a mesma nas diferentes subpopulações definidas pelo estado civil. tr Exercícios da Seção 8.5: l. utilizando a tabela da distribuição eui-euadrado determine (aproxime se necessário): a. P(Xl > 14,70). b. P(x], > 3e). c. P(Xr2, < g). tl.P(L2<X?r<J0,2). c. O valor de a tal que P(Xl, ) a) : 6,95. f. O valor de b tal que p(Xl ) b) : 6,91. g. O valor de c tal que P(X], ( c) : g,g5. 2. um pediatra pretende avaliar se o sexo de bebês pode ser modelado por uma distribuição de Bernoulli, com p: 0,55 indicando a probabilidade de nascimento de meninas. Uma amostra.aleatória de 25 nasciÁ"nto. indicou l3 mcninas. a. Formule as hipóteses adequadas. b. Qual é a conclusão ao nível de significância de 5Vo? 27,\ 8.5 Testes QuïQuadrado 3. Quatro máquinas de grande porte trabalham de forma independente e, ao fim da jornada de trabalho, são vistoriadas pelo controle de qualidade. Caso necessitem, serão ajustadas. Das informações arquivadas pela empresa, sorteamos 22 dias e anotamos o número de máquinas que sofreram ajuste nesses dias. Os dados são apresentados na tabela abaixo. O engenheiro de manutenção pretende verificar se é adequado o modelo Binomial com n : 4 e probabilidade de ajuste p : 0,L Use um nível de significânci a de 4Vo. Ajustes diários 0 1 2 tJ 4 Freqüência 13 6 2 1 0 Para verificar a qualidade do processo de fabricação, cabos de aço são submetidos ao ensaio de tração até acontecer a ruptura. Os cabos têm 5 metros de'comprimento e deseja-se testar se o modelo Uniforme Contínuo é adequado. Para 30 cabos, sorteados ao acaso, obtivemos a seguinte tabela: Faixa freqüência 0l-L 7 r l-2 6 2 t-3 4 3t- 4 6 4l- 5 7 Qual é a decisão para uma probabilidade de erro tipo I de 0,02? Em um experimento para verificar a relação entre crises de asma e incidência de gripe, 150 crianças foram escolhidas, ao acaso, dentre aquelas acompanhadas pelo Posto de Saúde do bairro. Os dados referentes a uma semana são apresentados na tabela abaixo. Asma \ Gripe Sim Não Sim 27 34 Não 42 47 Você acha que as ocorrências de asma e gripe são independentes? Use a: 4Vo. A opinião sobre o atendimento de pacientes com AIDS em hospitais públicos foi estudada em duas cidades. Na cidade A, sorteou-se 150 usuários e, em B, 200. Com os resultados apresentados na tabela abaixo, você diria clue a opinião é a mesma nas duas cidades? Use a : \Vo. 279 4. 5. 6. Cidade \TtenAìmenro 7. 280 8.6 Exercícios Em uma facurdade, o desempenho esportivo dos alunos está sendo estudadopara dois cursos diferentes. oi cursos âe administ.uçao"l"orioiriu fo_"""rumamostras que estão represenradas abaixo. você acredtr; ;;;';; arunos dessesdois cursos têm o mesmo desempen ho, ao nível 4Vo? Ca píl u I o 8 ; l n I'e rô n c i tt El ttr I lt; t i er t :,1,t, ;i t e :t tI e I I i p(t I e.re s Cursos fDesernpen[õ Bom Regular Ruim Total ô{lmtnlsraçAo 65 70 45 180 Ecqnomia nÈ72t 10\ 20 150 1' Suponha que queiramos. testar Ho i k: 50 versus Ho :, ) 50, onde tt é amédia de uma variâver areatóriá úormal com desvio-padrão igual a 10.Extraída uma amostra de n:36 erementos da popuração, observou-seT obs : bB. Faça o teste utilizando os níveis lVo,2Vo, Sà à tO E". 2'uma fábrica de automóveis anuncia que seus caÍros consomem, em média, r0litros de gasolina por 100 quilômetroï, com desvio padrão de 0,g litros. umarevista desconfia que o consumo é maior e resolve tËrtu, "rru afirmação. paratal, analisa 35 automóveis dessa marca, obtendo "on,o "oàrumo médio 10,2litros por 100 quilômetros. considerando que o "on.uÁo siga o modeloNormal, o que a revista pode concluir sob.e o anúncio ão-nau.i"u ao nível de7Vo? Qual o erro tipo II só a média for 10,6? ---- ** 'J 3' uma máquina deve produzir peças com diâmet ro de 2cm. Entretanto, variaçõesaconrecem e vamos. assumir que o diâmerro d"rr", ;;;;, ,igu o modeloNormal com variância iguar u b,09 cm2. para t"rtu, ,"'a'iìaquinu está bemregulada, uma amostra de 100 peças é coletada. a. Formule o problema como um teste de hipóteses. b. Qual seria a região críticase a : 0,02? c' se a região de aceitação fosse {r e JR r l,gb í r { 2,0s}, qual seria onível de significância do teste? N"rr" caso, determine a probabilidade doerro tipo II se 7_r : 1,95 cm. d. Se para essa amostrã,Ì ort.s : L,g4:qual a decisão em (b)? E em (c)? =!:FF ll.(t lixcrclcirts 4. O atual tempo de travessia com balsas entre santos e Guarujá é considerndo uma variável aleatória com distribuição Normal de média l0 minutos e desvio padrão 3 minutos. Uma nova balsa vai entrar em operação e desconfia-se qUc será mais lenta que as anteriores, isto é, haverá aumento na média especificadn no modelo acima. a. Especifique as hipóteses em discussão' b. Interprete os erros tipo I e tipo II' c. Para uma amostr a de 20 tempos de travessia com a nova balsa, obtenha tt região críticaconsiderando um nível de 57o' d. Calcule a probabilidade do erro tipo II, se a nova balsa demora, em média, 2 minutos a mais que as anteriores para completar a travessia. 5. O nível de colesterol no sangue é uma variável com distribuição Normal, de média p desconhecida e desvio-padrão o = 60 mg/100 ml' a. Suponha que várias amostras de tamanho n são escolhidas ao acaso desttt população. Para cada indivíduo, o nível de colesterol é obtido e a média de "uãu urrru das amostras é calculada. Qual deve ser o valor de n para que apenas lOVo das médias amostrais excedam a média populacional ern l0 unidades ou mais? b. Teste a hipótese de que p:260, contra a alternativa de que p > 260com base numa amostra de 50 pacientes, em que se observou uma méclin amostral Í,"," :268. Utilize um nível de 5Vo' c. Qual deve ser o tamanho da amostra, escolhida na população acima, paro que o intervalo de confianç a para 1t tenhaum comprimento de 30 unidades? Use 'Y :997o ' d. Para o teste especificado em (b), calcule a probabilidade B para o erro de tipo II, se o valor real de p for igual a790' 6. Suponhamos que o tempo de cura para um doente tratado pelo método A obàdeça a uma distribuição Normal, com média de 7 dias e desvio-padráo de2 dias. Um novo tratamento B é proposto com a finalidade de dimjnuir o tempo de cura desse tipo de paciente. Em um experimento clínico, 25 pacientes com.0 doença receberam o nouo tratamento B e ãbservou-se que a média do tempO de restabelecimento para eles foi de 6 dias. ' a. Sabendo que o novo tratamento não influi na variância, identifique as hipóteses adequadas e teste-as, considerando um nível de significânciit a:0102. b' construa um intervalo de confianç a ('Y : 95vo) para a verdadeira média da distribuição do tempo de cura sob o tratamento B' 281 28() Capítulo B: Inferência Estatística: Testes de Hipóteses 23. o crescimento de-bebês, durante o primeiro mês de vida, pode ser modeladopela distribuição Normar. Admita que, em média, um crescimento de 5centímetros ou mais seja considerado satisfatório. Deseja-se verificar se ocrescimento de bebês de famílias em um bairro da periferia de são paulo acompanha o padrão esperado. para tanto, 10 recém-nascidos na região foram sorteados e sua altura acompanhada, fornecendo as seguintes medidas de crescimento em centímetros: 5,03; 5,02;4,95;4,96;5,01; igl; q,gO;4,9I;4,90 e 4,93. a. Que hipóteses estão sendo testadas? b. Qual é o estimador a ser utilizado para testar as hipóteses em (a) e qual é a sua distribuição? c. se a região crítica^construída é {i e IR : I <--g.g7}, encontre o valor de a.Qualaconclusão? )- d. Qual seria a região críticae a conclusão se a : Sh"t 24, Aporcentagem anual média da receita municipar kpr.guau em saneamento básico em pequenos municípios de um estado tem sido ívo 6d^ituque esseíndice se comporte segundo um modelo Normal). o governo pretende melhorar esse índice e' para isso, ofereceu alguns incentivos. para verificar aeficácia dessa atitude, sorteou 10 cidades e observou as porcentagens investidas no último ano. os resultados foram (em porcentagem) g, 10, 9, 11,8, 12, 16, 9, lr e 12. os dados trazem evidência de merhoria, ao nível de 2To? caso altere a média, dê um intervaro de confiança para anova média. 25. Alguns cientistas acreditam que em média 50|,o dosmateriais expelidos por erupções vulcânicas são constituídos de enxofre. Seja X a massa de enxofrecontida a cada 2 quilos de material vulcânico. Acúita-se que essa variâvel rrão tem distribuição Normal. uma amostra de 100 caixas de 2 quilos desse rruterial forneceu Ër, : 98 (em kg; " flrf : 100 (em kg2).i:r l:1 a. Qual a distribuição de X? Indique as suposições feiras. lr. Formule as hipóteses e obtenha a região críti.u p*u a : 5vo. c. Qual a conclusão do teste? d. Qual é a probabiridade do erro tipo II, se os vurcões experem 52vo de enxofre? 26. Deseja-se verificar se o modelo uniforme Discreto com valores de 0 a 5 pode ser usado para modelar o número de reclamações que chegam por hora a umacentral de Atendimento ao consumidor. o sorteiò ae tío períodos de uma hora forneceu os seguintes dados: 8.6 Exercícios 287 Reclamações 0 1 2 tr) 4 5 Freqüência 8 tôÒt) 28 24 16 12 Formule as hipóteses testadas e dê a conclusão ao nível de 5Vo de significância, 27. rJma indústria registra, em cada semana, o número de dias em que ocofrem acidentes de trabalho. Para uma amostra de 200 semanas, verifique se os dados apresentados a seguir, aderem ao modelo Binomial com parâmetros n : 5 e p : 0,2 (use nível de significância de lj%o). No. de dias com acidentes 0 1 2 tJ 4 5 Freqüência 64 56 40 24 8 8 28. O número de chegadas de clientes a um banco foi anotado minuto a minuto para uma amostra de 7O períodos (de um minuto). Os dados foram os seguintes: No. Chegadas 0 1 2 qJ 4 5 6 mais de 6 Freqüência I 15 77 11 7 5 4 2 O modelo de Poisson foi proposto para modelar essas chegadas, qual a suu opinião? 29. O tempo residual do efeito de um agrotóxico está sendo analisado. Estudos anteriores, com produtos similares, indicam que o modelo Exponencial cOm média de 3 dias poderia ser adequado. Qual a conclusão, ao nível 57o, se Ll análise em laboratório de uma amostra de 300 aplicações do agrotóxico forneceu os seguintes tempos residuais: Faixas de Tempo 10, 1) r,2) [2,3) [3,4) t4,5) [5,6) [6, oo) Freqüência B9 60 43 40 25 22 2L 30. O preço unitário de mudas de laranjeira (em reais), em atacadistas especializados, é uma variável aleatória que se pretende modelar pela Normal. Com base nos clados apresentados na tabela a seguir, teste a hipótese de que o 288 Capítulo 8: Inferência Estatística: Testes de Hipóteses modelo Normal é, significância de 5Vo. adequado a esse caso, considerando um nível de 3L. Usando os dados abai entre o número de filhos tal fato considerando u formular as hipóteses). Renda \ Filhos 0 1 2 >2 menos de 2000 15 27 50 43 2000 a 5000 25 37 l2 8 5000 ou mais 8 T3 9 10 32.8m uma escola de ensino médio, o desempenho dos alunos em matemática e física foi observado (ver tabela a seguir) para testar se existe dependência entre as duas disciplinas. Física \ Matemática Notas Altas Notas Regulares Notas Baixas Notas Altas 46 77 22 Notas Regulares 47 r43 5B Notas Baixas 29 72 40 calcule o nível descritivo. Qual a decisão, ao nível de significânci a2vo ? 33. Acredita-se que o empenho de estudantes universitários muda no decorrer do curso. Para investigar essa afirmação, decidiu-se estudar a relação entre ano de curso e aprovação em disciplinas. Os pesquisadores obtiveram os registros de 186 estudantes universitários, selecionados aleatoriamente, dentre a totalidade de alunos de uma certa instituição de ensino superior. Foram consideradas 3 Faixas de Preço Freqüência 0,50; 0,60) 23 0,60 0,65) 36 0,65; 0,70) 64 0,70; 0,75) 95 0,75; 0,80) L02 i 0,80; 0,85 71 0,85 0,90) 4ú 0,90; 1,00) .-14 xo, verifique descritivam$nte e o rendimento familiar ({m r m nível de sienificância Ne : se existe dependência eais). Em seguida, teste 17o. (Não esqueça de 8.6 Exercícios disciplinas básicas em cada ano. Os resultados obtidos foram apresentados na tabela a seguir. Aprovação\ Ano I 2 J 4 Todas 6 5 7 l0 Duas l0 l6 T9 t8 Uma 23 20 t5 7 Nenhuma t5 7 6 2 a. Quantifique o grau de associação entre aprovação e ano cursado. b. Teste a hipótese de que as duas variáveis são independentes, ao nível de significânciade 57o. c. Obtenha o nível descritivo. 34. Quatro grupos de pacientes com úlcera duodenal foram submetidos a diferentes cirurgias caracterizadas pela porcentagem de tecido gástrico removido. A tabela apresentada a seguir contém dados referentes à classificação dos pacientes quanto à severidade de uma seqüela indesejável da cirurgia. Cirurgia\ Seqüela Nenhuma Pouca Moderada Total Y+D (OVo) 61 28 7 96 Y+A(25Vo) 68 23 13 t04 V+H (507o) 58 40 12 110 G+R(75Vo) 53 38 6 97 Verificar se existe associação entre a porcentagem de tecido gástrico removido e a severidade da seqüela. Utilize o nível descritivo. 35. Investiga-se, para um certo produto, a fidelidade (alta, média e baixa) de seus consumidores. Em uma amostra de 200 homens e 200 mulheres, foram classificados como tendo alto grau de fidelidade 120 homens e 80 mulheres, enquanto com grau médio, 50 mulheres e 50 homens. Os dados fornecem evidências (use a= 27o) de possíveis diferenças de grau de fidelidade entre os sexos? Indique o teste realizado. .Ì6. Um levantamento inicial sugere que o núrnero de filhos depende da rendn familiar dos pais. Para confirmar essa suspeita, amostras de famílias foram coletadas, em cada classe social, e o número de filhos em cada família foi contado. Verificlue utravés de um teste de hipóteses se a variável tem 289 resumidos e são 290 Capítulo 8: Inferência Estatística: Testes de Hipóteses comportamento diferente em cada uma das subpopulações estudadas (use nível de significância de l%o). 37. Deseja-se comparar o grau de instrução dos hapitantes de quatro cidades brasileiras que têm aproximadamente o mesmo tpmanho populacional. uma amostra de 100 habitantes foi sorteada em cada iidade e o nível educacional das con foi observado. Dos resultados pessoas r l D r . lj cl apÌesq clusão podemos tirar, usando o nível descritivo na tabela abaixo, Cidade\ Instrução Fundamental Médio Suderior Pós Graduação A 26 65 I 1 B 10 46 30 L4 C 17t,rJ 22 5 0 D 55 40 2 tr) que 38. A reação ao tratamento por quimioterapia foi estudada em quatro grupos de pacientes com câncer. Retirou-se uma amostra de pacientes de cada grupo o classificou-se a reação em três categorias: pouca, média e alta. Teste, ao nível de 2Vo, se todos Òs tipos de câncer reagem da mesma maneira. Câncer\ Reação Pouca Média Alta Total Tipo I 51 tttJ r-, 16 100 Tipo II 58 29 13 100 Tipo III 48 42 30 L20 Tipo IV 26 38 16 80 39. um índice sobre qualidade de vida foi observado em uma amostra de 400 idosos. Os dados são apresentados a seguir. Faixas [0, r0) r0,20) lzu,3u) 30,40) 140,45) 45,50) Freq. 7 15 32 55 48 60 Faixas [50,55) 55,65) lbb, íu) 70,75) 175,85) 185, t00l Frcq. 55 56 28 20 18 6 Classe\ Filhos 0 I 2 J >3 Baixa 15 27 40 64 54 Média 25 27 28 L2 8 Alta 10 25 15 8 2 8.6 Exercícios a. Teste se a média do índice é ou não igual a 50. b. Com base no item (a), verifique se o modelo Normal é adequado para este índice. Como ficaria sua resposta sem utilizar a informação do item (a)? 40. As tabelas a seguir contêm o número de pessoas segundo origem e opinião a respeito do aborto. 29t Masculino Orieem\ Opinião A favor Contra Capital l-0 45 Interior 18 90 Feminino Origem\ Opinião A tavor uontra Capital 55 40 Interior 22 20 a. Para cada sexo, verifique se origem e opinião são independentes. b. Combine as informações em uma única tabela desconsiderando sexo e teste novamente a independência das variáveis- c. Discuta os resultados obtidos em (a) e (b). 41. (Use o computador) Considerando os dados do arquivo cancer.txt descrito no Exercício 24 do Capítulo 1, defina dois grupos: um de pacientes jovens,.com idades inferiores a 54 anos, e um de pacientes idosos, com idades superiores a 54 anos. Os grupos deverão conter I9l e lTl pacientes. Considere a variável nitrogênio na uréia (l/). a. Construa um box-plot para a variável ltr, para cada um dos gnipos etórios e compare-os descritivamente. Com base nos gráficos, existem indicações de que a idade está influenciando a concentração de nitrogênio na uréia? f. É Oe interesse verificar se a média populacional da variável .lü para os pacientes idosos é superior a 15. Supondo que o modelo Normal com desvio padrão o: 7 é adequado, qual a conclusão que pode ser tirada, para um nível de significância e :0,001? c. Considerando agora o grupo de pacientes mais jovens, verifique se a médiar populacional para l/ é menor que 15. Suponha que o desvio padrão populacional é conhecido igual a 5 e que o modelo Normal é adequndo. Obtenha o nível descritivo. d. Com base nos resultados dos itens (b) e (c), discuta o comportamento das' médias da variável .A/ para os dois grupos de pacientes. 42. (Use o computador) Suponha que os dados do arquivo areas.txt (ver descriçf,o no Exercício 25, Capítulo 1) corresponde a uma amostra de vdrios crnpreendimentos de umiì nìesma empreiteira. Segundo o memorial descritivo do empreenclimerrto, as uniclacles devem ter área total igual a 50 m2, independentemente do bloco. Iintretnnto, suspeita-se que as unidades do bloco B não satisl'azem s essn especiÍ'icitçÍio. 296 Capítulo 9: Tópicos Especiais medidas tomadas antes e após uma dada intervenção. Para ilustrar esta situação, considere o Exemplo 9.1 em que medimos o rendimento com a gasolina tradicional e depois com o novo tipo de combustível. Essa é uma típica situação em que o teste ú - pareado deve ser utilizado. Neste caso, é de se esperar que exista alguma correlação entre as observações tomadab em uma mesma unidade experimental. As medidas tomadas antes e após a intervenção realizada serão representadas pelas variáveis aleatórias Xo eY, respectivamente. Desta forma, o efeito produzido pode ser representado, ppra o z-ésimo indivíduo, pela variável Di : Y - X;. Supondo, para i : I, ... ,n,iJ Du - N(Ab,o'o), queremos testar as hipóteses: \ ) Ho : Fo: 0 (a intervenção nib Produz efeito) Ho : pD # 0 (a intervenção p\duziu algum efeito), sendo que a hipótese alternativa pode também ser unilateral. O parâmetro po é estimado pela média amostral D e, como usualmente não temos informação sobre dp, estimamos seu valor por S2p, dado por si:#Dro,-D)'. O teste de hipóteses é realizadoutilizando-se a quantidade r:D-lto_ solt/ã c1ue, sob f/,, segue uma distribuição ú-Student com n - 1 graus de liberdade. O teste segue os mesmos passos discutidos no capítulo anterior. Exemplo9.3.'No Exemplq 9.1, o rendimento foi'representado por Xt eYpara o automóvel 'i, respectivamente antes e após o novo combustível. Os valores observados, em km/I,' junto com as diferenças Di:Y- X;, para os 12 automóveis são apresentados na tabela a seguir. Autom. 2 3 4 5 6 7 8 9 10 1 T2 Após (Y) Iro 8,8 9,9 9,5 11,6 9,1 10,6 10,8 L3,4 t0,ti 10,5 l I,4 Antes (X ) 8,1 7,9 6,8 7.8 7,6 7,9 5,7 ó14 E'0 9,5 8,0 6,8 D:Y-X 3,5 0,9 J'I Ltl 4,0 t,2 4,9 2,4 5,4 1.1 2,5 4.0 .il 9.2 Comparação de Duas Médias Os dados de consumo, antes a após o novo combustível, podem sêf visualizados através de gráficos box-plot, apresentados a seguir, de onde podemos notar indicações de que o rendimento é, aparentemente, maior após o uso do novo combustível. Depois Para podermos verificar se o rendimento é de fato superior, precisamos proceder ao teste: Ho : Fo: 0 (o novo combustível não aumenta o rendimento); Ho, : po > 0 (o novo combustível aumenta o rendimento), com LLD representando o valor esperado da diferença de rendimento, isto é, po:E(Y-X). Estaremos assumindo que a distribuìção de Di:Yi-X,i, para'í : I, ... ,12, é Normal com média pD evariãncia o2o. Com os dados observados, obtemos ã,6" : 2,9 e estimamos oã por s2D ru : 2 14' Logo, sob f/o' tubr :ut'", P :''' . o' : 6148. so,,o,l{n r,551\/12 Com a : 0,05 e utilizando a tabela da distribuição Ú-Student com I I graus de liberdade, obtemos Í,, resolvendo a equação P(T > Ú,,) : 0,05. Obtemos t,,: I,796 e como t,,t* ) ú,,, concluímos que o novo combustível é eficaz nA 297 €14 E5 o c .Ë 12õco cc =- 298 similares. 2q9 melhora do rendimento, acafretando diminuição do consumo pere oveículo considerado no experimento. caso 2. Amostras independentes com variâncias conhecidas Consideramos agora o teste relacionado com a situação em quc ql ::in;1,ï T:1t1'^* jf: populações independ-entes, quando o, .orrrrpuvariâncias são conhecidas. A obtenção dà informaçã; ;;rp.t;';.ïË variância populacional pode ser obtido de estudos anteriores ou experimc; A ('t,nt!ì(t|(tção dct lhms Méllt,t Pol)tllnçoes, :u]tts varrauvr.ò ò4v rasqrr ,rrïr" u* g1g/elo .-^-Áõ 2lu,,,r,,rs; admitir que estas duas populações se comportam confc ii:Ï."ï,::Ïiïffi, ;;; ;;. õ";;;; t ;, variáveis areatórias representando a ttrrr.ircterística de interesse'em "ádu o*u das populações. Segue, .qotruilo,, q:í,:: Capítulo t);'ftíplrct comparar dois sl foram selecionadog i ,E E I E ó) F- Exemplo 9.4: Vimos no Exemplo 9.2 que, para operacionais, dois grupos independentes de estuãantes tempo necessário parurcalizar a tarefa foi anotado. Os dados obtidos foram os seguintes (em minutos): Grupo Tempo 182 185 193 175 184 tg2 92 76 76 90 97 90 175 173 I t78 162 179 t64 182 I 86 93 100 115 85 80 90 86 auxiliar eco GruPos [.)rrir's medidas descritivas podem ser calculadas para auxiliar na comparaçõo' tr utilizando a motivação fornecida pelo exemplo anterior, poderrtot{a realizer -';'ilã; geral. Suponitu .1,," desejamos comparar .düN9 rru-:- llaSô- ;ì ;;ì;;'n*. -"'ii"à'ra'cias sao" i guais u um t :,*: iZ ̂ *: ̂ 1:i1'j:i; A inspeção visual dos dados sugere que o Grupo B tende tarefa num tempo inferior àquele observãdo puru o Grupo A. para análise- inicial, podemos construir gráficos bàx_ptot puru'o, g*po, lado a lado conforme a figura u,"gui.. Podemos observar que' para os alunos considerados, o novo sisteffiê _:ï:ï:":1t_:r,::::",i1ior_ facilidade de aprendizâdo , "urlut"rirado aqui pelo Note que o valor da mediana do Grupo B é inferior ao do Grupo A, mas ointervalo enrre o primeiro. e .o. rerceiro quaitil é pró;i;;;;;u o. dois grupos,dando a idéia de que a variabilidade do tempo de aprendizaão é semerhante pareambos os sistemas operacionais. E importante ressaltar que, para podermos concluir que o novo sistema éde fato eficaz, precisamos "*trupàlu, as conclusões anteriores para toda apopulação de crianças com idade entre g e 12 anos. Isto pode r", r"ito, realizando o teste de hipóteses que será descrito em seguida u.rr" "*"Àpr,"- A B tempo de execüção de certa tarefa, u.u u", qu " o Uo*'_pioì;;;ô;;Ë Ëãsensivelmente mais baixo. ;:ìïi lïJï:ï:ïuï" .àï"'."****"ã; il 9e;:' ;":'"'' a3"'a'à11: 1''1'Íï:: ïlìï:}Jr""ïlï tiï, .:Ïï;;-i'', ::.,ï, "), representando amostras areatóri âs, --^r-^^ r^ ^*^stf0:ffi';:,fi':.i]uïïl'ou, populações. Deve ser noiado que os ramanhos de amostrit 'il 1 a't72 podem, eventualmente, ser iguais' Queremos testar -F1, : As médias populacionais são iguais; f/" : As médias populacionais não são iguais' listas hipóteses podem ser traduzidas em termo s de pq e 1t2: Ho : 11,1 -- 1-tz', H': t-tt, * l.tz. 300 Capítulo 9: Tópicos Especiais Se a suspeita sobre a diferença entre as médias é de que a médiade umapopulação é maior (ou menor) do que a média da outra, podemos reescrever f/" como /-r1 > ttz (ou ltt < ttò e proceder ao teste unilateral. como estamos interessados em determinar se a diferença é estatisticamente significante, podemos ainda reescrever as hipóteses em termos de l"O : Itt - F2, isto é, .., Ho:P'p-Q; H."rtto+í, o que sugere trabalharmos com o estimador de p,p: D:X-Y. Comas suposições feitas, temos a--1 X.i - N(pr,o'), [.,: I,2,..., n1; Y.- N(1"r,of;\, i: L,2,..., n2. independência dessas variáveis, D terâ ) : po e quanto à variância, temos: distribuição Normal com Pela E(D Var(D) : Var(X - Y) : Var(X) + Var(y) : or" +ú:rr(!*1\Tt1 rL2 "\r, ,,)' Note que a independência entre as amostras foi necessá ria para obter essavariância, uma vez que a covariância entre as médias amostrais é zero. com estas informações, procedemos ao teste de hipóteses do modo usuar. caso não saibamos qual é a distrìbuição da característica nu foprruçao podemos,para'amostras de tamanho grande, lãnçar mão do Teorema Central do Limite etrabalhar, de modo aproximado, com a distribuição Normal. Exemplo 9.5.' continuando o Exemplo 9.4, sejam Tr e Tz variáveis aleatórias representando os tempos de aprendi zado para os grupos A e B, respectivamente. Tendo em vista que nL: n2: 15, as amostras áu5. ,"rf""iío,populações são os conjuntos de variáveis aleatórias independentes(TIJ,'.. ,4,rs) e (Tz,!, ... ,T2Js). Além disso, assuma que informações adicionais fornecidas pelas empresas indicam que a variabilidade dos tempos deaprendizado é a mesma para ambos os sistemas operacionais e iguar o oi : 19min. Logo, para i : I,2,...,15, 9.2 Comparação de Duas Médias Tu - N(Pt,100); ' Tzr - l/(p2, 100). Queremos testar H, : Tempo médio é igual para ambos os sistemas ; .F1, : Aprendizado do novo sistem a é, emmédia, mais rápido. As hfnóteses podem ser formulad^ti,t:i : *, Ho:FtlFz, ou, equivalentemente, I HoiFo:FL-Fz:0; Ho:l-ID-ltt-ttz)0. A região críticaserá dada por RC : {d, €.IR : d > d,"} e o estimador de p,p ser6 dado por D :Tt -72, com 30t 15 DT'',n :_1 ^15 15 5- ?o,u .i-1 e 1, : - '-15 ' Pela suposição de que os tempos seguem o modelo Normal e, lembrando que as amostras são independentes, segue que a distribuição de D é Normal com média p,p e variãncia var(D) : var(Tt) + var(72): # * # : # : 13,88. Utilizamos agora o procedimento usual para testes de hipóteses, fixando a : 0,05 e encontrando um valor crítico d. tal que P(rejeitar H"l H"verdadeira) : P(D € RC I po:0) Consultando a tabela da distribuição Normal padrão, obtemos 2,, : L,64. Logo, d,:L,64x3,65:5,99. Então, R.C : {rJ e R l íí > 5,99}. 306 Calítulo 9: Tópícos Especiais Para ambas as populações, temos a mesma variância o2 (desconhecida). Suponha que nosso interesse é testar HoiFX:lJyi Hu: Fx * t"v. Novamente, consideramôs o estimador D definido pela difeíençaX -Y. Dada a independência entre as amostras, segue imediatamente l6e /1 1\ ,/Var(D\:o2I:-+:-lr/' \nt "'/( Além disso, considerando também a normalidade do, ludor, segue que e consequentemente, Como a variância populacional o2 é desconhecida, precisará ser estimada. Tendo em vista que S| e ,5| são ambos estimadores não viciados dessa variância, usaremos como estimativa para o2 umacombinação deles, dada por: 'nl n2 Díx.u-N)'+DVi-T)' :-1 ;-1 ,J- L D - N(p,x - py,o21t1n1+ rln2)). D-(pt-pv): ^' Arln 1\ o 1/Lln1* If n2 nL+n2-2 Note que S! é :uma média ponderada entre 5| e,Sfl, com ponderação dada por nt-I c nz- 1. Dessa forma, estaremos utilizando para estimar o2, toda a informação disponível nas duas amostras. Além disso, pode-se mostrar que ,9"2 É não viciado para o2. Da mesma forma que na Seção 8.3 do Capítulo 8, o uso do estimador ,9ul nos leva a trabalhar com a distribuição ú-Student, isto é, D-(pr-pv)T_ s"\ÃFTTTM 9.2 Comparação de Duas Médias 307 tem, sob f/,, distribuição t-Student com nr * nz - 2 graus de liberdade Dada a hipótese alternativa apresentada, procedemos ao teste bilateral dn forma usual, isto é, fixado a encontra-se o valor ú, tal que a: P(rejeitar Ho I Il,verdadeira) :P(7 1-t"ouT>t"lH"). A quantidade ú" é então obtida da tabela da distribuição ú-Student, com nt I nz - 2 graus de liberdade. A região crítica para o teste é dada por RC :{t e m. : t 1 - t" ou t > t"}. Uma vez obtidas as amostras, substituindo as estimativas de D e S" na expresSãO de ?, obtemos o valor úo6". Rejeitamos f/o se úo6" pertencer à região crítica. Exemplo 9.8: Para o Exemplo 9.7, podemos escrever as hipóteses de interesse como Ho i Fx: py (os dois métodos são equivalentes); Ho: Px * l.tv, Çom p,y e púy representando, respectivamente, o tempo médio populacional pafn alunos da turma J e da turma Á. As amostras forneceram os seguintes valOres: nt: l4,Totts:11157 e sl"u": 4,L; n2 : L3,Tot " :15,38 e szy"u" : 4,3 ' Então, ãot," -25,',0" Como a hipótese alternativa apresentada é bilateral, a região crítica tem a íbrma RC : {t e m :t 1. -t" ou t) Í"}.Logo, parao-:0,01temos 0,01 : P(rejeitar Ho I H"verdadeira) :P(7 1-t.ou T>t"lH"). l)a tabela da distribuição ú-Student com 25 graus de liberdade, obtemos 1,,, : 2,79. Conseqüentemente, :Íolts -Tot,r: LIr57 - 15,38 : (rr-Dtï*"*(n, -t)tï*":6 -3,81 ; _ L3 x 4,I +_L2 x 4,3 : 4.2 25 .ï08 Ct plt tt I o g : 7'ó pi uts Esltet:itt ltt RC: {te m.:t1_2,7g out}2,Tg}. Utilizando as estimativas calculadas temos, sob I1o, -3,81 \/4,2(rlL4 + 1/13) I Ique pertence à região crítica e, assim, concluímos que os métodos de fato diferem, a um nível de significânciade LVo. tr . dult" -: í t?*"(rlu + Tlnz) : _4,93; Caso 38: Amostras independentes com variâncias desçÁnhecidas e diferentes/o teste para o caso em que as variâncias são/esconhecidas e desiguais é consideramos as mesmas hipóteses apresentadas no\ quantidade a ser usada para o teste será i s ?dés teoricamente mais envolvente. Assim, sem "nfru. em maiores detalhes, r \cu.o 3A, só qu", ugoru, 4 ,\ r: D-(t"x-ttv) í sk/", + sl,ln2 A exemplo do caso anterior, ú também tem distribuição ú-student, mas os graus de liberdade z são corrigidos pela expressão (s'"1"t A seqüência do teste é similar àquela apresentada nos casos anteriores. Na Tabela 9.1 mostramos um resumo dos testes considerados nesta seção. Encerramos esta seção, considerando a situação em que a característica de interesse não se comporta segundo um modelo Normal. Novìmente, a alternativa será coletar uma amostra de tamanho grande o suficiente, a fim de utilizar o Teorema Central do Limite e obter distribuições amostrais aproximadamente Normais. como um exemplo desse procedimento, vamos desenvolver o teste para n igualdade de duas proporções. 'j ,tr-tÊ. Ctttttpuruç{lo de Duets Mérlilt,r :'{ a.2 30e) Tabela 9.1: Comparação de médias para duas populagões, Exemplo 9.9.' Num estudo sobre doenças infantis, desejamos investigar se a incidência de casos de contaminação por vermes é afetada pela idade. Dois grupos de crianças, um com idades de 2 a 4 anos (Grupo I) e outro, com idades de 7 a 9 anos (Grupo II) foram escolhidos para serem examinados quanto iì ocorrência de vermes. Os dados são apresentados a seguir: 3t0 Cttpítu\o g:'l'ópit tts l!,rpeciuis Grupo Amostra Proporção comVerãJnõG I 720 0,095 II 260 0,103 Para saber se as duas faixas etárias acima têm o mesmo comportamento, quanto aincidência dessa doença, podemos rearizar ; Ã;jJ,r,ïnot"r". "nuàtu.nooproporções. / tr ' Considere que desejamos verificar o .o-ponlmento de uma certacaracterística em duas popurações. se a amostra for suficientemente grandesabemos, pelo Teorema central do Limite, que a distribuição de probabilidade daproporção amostral tem um comportamento aproxim qbamente igual ao modeloNormal. Na comparação de proiorções "n., á;;r/d;Ës, usaremos comoestimador a diferença enrre as respectivas propgíções u,norr.uir. ìvão ã oiïr"ìïverificar que ela será um estimadoinao viesaoo 4Jr*""* diferença entre asproporções populacionais. \ população, teremos d'as proporções amostrais independentes e a diferença entreelas também terá distribuiçãó aproximadamente Normal. Assim, se o interesse étestar: Ho : pt : Ih versus Ho i pt # h, então o estimador a ser utilizado será fr, - fr, cuja distribuição será aproximadapela Normal cujos parâmetros são obtiioì, considerando-r" u, relações: E(6r-fr):pt-pz; Var(fi - fr) : Var(f1) +var(f2) - nQ - or) * m(L - m) .TL1 D2 Note que, para calcular a ^variância, a independência entre as amostras garantiu aindependência entre ft " fr e, portanto, a covariância entre eres se anulou.Sendo a hipótese nula verdadeira, as proporções populacionais são iguais.Denotando seu valor comum por p, isto é pr : p2: p, foO"*os obter umestimador para p através da ponderação dos "rir*uããr"r'não viciad., ã ; ,:Dessa forma, obtemos ^ -ntfr.+n2fr,Yp--nrTíz' -!-F t).2 (:(,tnpurilçtlo de Duen Médhts Srrlrstituindo os valores de p1 e Pz Porfl,na exptessão da V ar(f1 - fr), podemos cscrever, sob fIo, Pt -Pz - N(0,1). F,,(L -F)Gln, + Iln2) l)irrir concluir o teste, calculamos a quantidadê zotts, substituindo bt e Íi por suas crrrrespondentes estimativas. Verificamos se zobs peftence à região crítica, que nO clso bilateral é dada por RC :{z e IR l, 1 r", ou z > z"r}. l)aclo um nível de significância a, os valores zct e zc2 são obtidos da tabela dt tlistribuição Normal padrão. Como procedimento alternativo, podemos também usáÌr o nível descritivo para decidir sobre a aceitaçáo ou não de Ho. Iìxemplo 9.10: Parao Exemplo 9.9, testaremos Ho: pt - p2 versus Ho: Pt # Pz, com p1 e p2 representando as proporções de crianças com verminosg nn população dos grupos I e I I, respectivamente. Pelas informações recebidns, rt4 - I20, nz : 260, fior,, :0,085 e frob" :0,103' Logo, sob 'FIo 120 x 0,085 +260 x 0,103 : ç,097; 120 +260 e também, Fnr,"(L -\r,",,,)(Llu * rlnz): 0,097 x 0,903 x (LlL20 + L1260) :0,0011' Segue então que Pt-Pz - t/(0,1). Para a: 0,08 os valores zct e zc2 são calculados através das expressões P((it -DlJo,o}Lt 1 z.,lH,) :0,04; P( (6t - D I Jo,ooLL ) z",l Ho) : o,o4 . .1u nt itot," * Trz ?2ot'"::rltobs n1 I n2 .t tó Capítulo 9: Tópicos Especiais Método X (antigo) Y (novo) 29,9 29,8 29,9 29,7 29,9 29,8 29,9 29,9 30,1 29,9 30,0 30,0 29,6 30,4 29,9 29,8 29,8 30,4 29,8 30,5 29,6 29,3 29,4 30,3 29,9 29,7 30,3 30,4 29,L 30,0 ) Algumas medidas descritivas foram calculadas, sendo do6" : 29,g3 mm, úubr:29,89 mm, r'*ou":0,03 mm2 " tï*:0,19 mm2. Na figura que segue, apresentamos os respectivos gráficos box-plot, que sugerem vari diferentes entre os dois métodos. Antigo Métodosde Prodqão Entreternto, para podermos tirar uma conclusão.objetiva, precisamos testar a hipótese de igualdade de variâncias. E E E tho o E Íqo E 3t79.3 Testes para Variância Vamos construir agora o teste de igualdade de populações, representadas por X ë Y, tais que Y - N(p", o|). Desejamos testar as hipóteses H": o2y : oï i H": o2y * "ï. Utilizaremos a quantidade F : Sïf S?, baseada nas amostras X1 ,...,X,n, a Yt,...,Yn", obtidas das populações de interesse; cujas variâncias estão sendo comparadas. Sob a hipótese f/r, pode ser mostrado que .F segue o modelo de Fisher-Snedecor, que é caracterizado pelos graus de liberdade associados às quantidades presentes no numerador e nO denominador de tr', no caso, nt - L e rlz - 1, respectivamente. Para n distribuição de Fisher-Snedecor, utilizaremos a notação F(a,b), sendo ae bos graus de liberdade. L Figura 9.2: Dístribuição de Fisher- Snedecor. Probabilidades baseadas na distribuição de Fisher-Snedecor têm de ser calculadas computacionalmente e são obtidas em planilhas eletrônicas e variâncias de duas x - N(p,x,ol) e P(F , f") com 318 Capítulo 9: Tópicos Especiais programas estatísticos. Para valores selecionados de n1 e nz, tabelas podem ser consultadas e, em geral, são construídas de forma a fornecer, para uma dada probabilidade, o valor /" conforme mostrado na Figura 9.2. No Apêndice A, apresentamos tabelas dessa distribuição para probabilidades iguais a 0,05 e 0,95. Assim, para um nível de significância a pré-fixado, podemos obter os valores ft e fz tais que P(F < fi ou F'V fz) : o, \ \ \ F-F(nr-L n2-L). A região crítiça para o teste bilateral é dada por RC : {/ e re : f < hou f {f})', \_ Portanto, se .f,1" e RC , rejeitamos a hipótese de igualdade das variâncias. Exemplo 9.14: Yoltando ao exemplo anterior, queremos testar se as variâncias do diâmetro das esferas produzidas pelos métodos antigo (X) e novo (Y) são iguais ou não. Isto é, H": o!: oï ; H,r: o2a I "ï . Note que as hipóteses podem, de forma equivalente, ser expressas como _2 H. : y{ : L; oï _2 n, , "] 1t. o'Y Sob a hipótese Ho, temos que q2 F:#-F(L4,I4).' Dí/ Logo, fixando a : 0,10 determinamos a região crítica do teste, de modo que P(F <,/r):0,05 e P(F > lz):0,05, Dada a forma das tabelas de Fisher- Snedecor apresentadas no Apêndice A, precisamos determinar fi e /2 tais que 9.3 Testes para Variância 3le P(F >"ft) : 1 - P(F < /r) : 1" - 0'05 = 0,95; P(F>/z) :0,05. Essas quantidades estão representadas nas figuras a seguir. Da tabela da distribuição de Fisher-Snedecor' com 14 graus de liberdade parn o numerador e 14 graus de liberdade para o denominador, obtemos que "fi = 0,403 c lz:2,484' Logo, RC :{/ e m.* : / < 0,403 ou Í > 2,484}' Para os dados disponíveis, temos que fobs : t'*"0"/tï"u": 0,03/0,19 : 0,158 € RC. Portanto, confirmando as evidências fornecidas pela análise descritiv&, concluímos ao nível a: L07o que existem diferenças em termos dA homogeneidade dos diâmetros das esferas, dependendo do método utilizado. tr Uma peculiaridade aparece no caso de testes unilaterais, uma vez que tl lorma da região crítica depende de qual quantidade é considerada no numerador tla expressão de F. Para esses casos, a representação das hipóteses de interesse crn teimos de frações evita possíveis confusões na construção de tr.. O exemplo, A scguir, ilustra esse procedimento. Ilxemplo 9.15: lJm fabricante de panetones costuma vender produtos de segunde tlualidade (no que diz respeito ao formato) a preços reduzidos. Para panetones de .i{)0 gro*or, súspeita-se que o procluto de segunda qualidade apresente maior vuriabilidade no que sc referc ilo peso. Para tanto, 26 panetones de primeirn tlualiclade e 20 de segundo tivcram seus pesos aferidos. Denotaremos esses pesos 320 Capítulo 9: Tópicos Especiais por X1 , .., , X26 e Yr, ... ,Yzo, respectivamente. Foram calculados os valores das variâncias amostrais, sendo dados por sï,ô :0,29 e szru" - 0,73. As hipóteses de interesse são: H" : ozy : oï versus Ho: oï < "? . Para determinar a região crítica e a quantidade F corretamente, reescrevemos as hipóteses como n, : o2* I ol,, : L versus H" : o2* I ol, < L . A construção de f' deve considerar a escolha darazão de variâncias nas hipóteses, no caso com as quantidades relacionadas a X no numerador, isto é, F : Sr*lS?, i l e a região crítica será da forma RC : {/ e re | f < ï"}. Sob a hipótese nula, .F - F(25,19), e para a:0,05 obtemos, da tabela da distribuição Fisher-Snedecor, f. : 0,495. Como f obs : t'*.0"/ tïr" : 0,2g 10,73: 0,356 ; temos Que .fol., € RC e, portanto, concluímos que os panetones classificados cotto de segunda qualidade apresentam pesos com maior variabilidade do que os panetones de primeira qualidade. tr Itrxcrcícios da Seção 9.3: l. Supondo X - F(a,b), encontre r" tal que: a. P(X ) r,,) :0,05 com a : 18, b : 3. b, P(X ) r,.) - 0,05 com a : 3,ó : 18. c. P(X , r,,) :0,05 com a : 180, b : I92. d. P(X ; r,') :0,95 com a,:5,b : 12. e. P(X > r,,) :0,95 com a : 30, b:40. 2. Umr linha de montagem produz peças cujos pesos, em gramas, obedecem ao modelo Normal com variância30 g2. os equipamentos foram modernizados e, pnrn verificar se o processo continua sob controle, foi tomada uma amostra de 9.4 Andlise de Variância 23 peças, que fornece\ s|tr:4O 82. Existem evidências indicando que A variância mudou, considerando a : I07o? 3. Uma panificadora produz determinado tipo de pão, cujo peso médio é de 190 g,ramas, com desvio padrão de 18 gramas. Devido a mudanças na política _-4ambral, que ocasionou aumento no preço do trigo, alguns ingredientes da f receita foram substituídos. Uma equipe do governo resolveu verificar se a ( variabilidade no peso do produto aumentou e escolheu, aleatoriamente, 16 ' unidades, medindo o peso de cada uma. O peso médio obtido da amostra foi de 102 gramas e o desvio padrão foi de 24,5 gramas. Qual a conclusão para a: I\Vo. 4. Para comparar o. grau de diversidade de duas populações primitivas, uma medida antropométrica foi obtida em fósseis coletados em sítios arqueológicos, fornecendo a tabela a seguir. Característica Sítio A (n: Sítio B (n :23) 321 Média(cm) L5,L2 Variância (cm2) 0,L24 L2,2L 0,184 O que pode ser concluído a respeito das variâncias? E das médias populacionais? 9.4 LnáÃise de Variância Consideramos nesta seção o caso de comparação de três ou mais populações, definidas por uma variável qualitativa (fator) através de testes com as correspondentes médias. Não abordaremos a situação com dois ou mais fatores neste texto e o leitor interessado poderá consultar as referências mencionadas na bibliografia. Iniciamos com o caso em que as amostras de cada população têm o mesmo tamanho. Exemplo 9.16: A gerência de um depósito que armazena cargas aéreas de pequeno porte está estudando o peso das cargas que chegam ao seu terminal no interior de São Paulo. Usualmente, o terminal recebe 4 tipos de cargas: doméstica (D), administrativa (A), equipamentos industriais (E) e outros tipos (O). Deseja'se verificar se, em média, existem diferenças entre os pesos dos 4 tipos de cargas, Ao longo de 1 mês, cargas foram colhidas aleatoriamente e seus pesos foram aferidos, fornecendo os dados (em kg): J26 Capítulo 9: Tópicos Especials alternativas podem ser utilizadas. Algumas delas envolvem aplicar urna transformação logarítmica ou quadrática aos dados. Esse assunto envolve técnicat mais avançadas e não será abordado nesse livro. A discussão sobre o comportamento dos erros e das somas de quadrados é resumida na Tabela 9.2 a seguir. Tabela 9.2: Tabela de Análise de Variância (ANOVA). A tabela ANovA fornece como subproduto um estimador para a variância populacional o2, baseado na suposiçãã de homocedasticidade. Nessg caso, a variância amostral para o z-ésimo grupo, s?:J.Ë(Y1-To7z," rn-If, pode ser usada para construir um estimador da variância populacional. Isto é feito combinandoessesvaloresatravésdamédiaponderadaa"if,...,S?, Knt "z - (m - r)sÏ+ "' + (rn - t)sfu D D&i - v-o)' " @:__Nç*_g. A expressão obtida para s! é a mesma que encontramos para eMD.Note ainda que a expressão de QMT também é um estimador para o2,uma vez que QMT: =rtQt ' S S-rrr" -Y\2 - q2Km-I Km-ILí?r''" ') -r' ou seja, QMT nada mais é do que a variância amostral s2 para uma amostrê corïposta pelo conjunto de todas ai observações dos K grupos combinados, E 9.4 Aruilise de Variância Exemplo 9.77: Para os dados apresentados no Exemplo 9.16, temos K : 4 grupos e nt:7 observações por grupo. Além disso, obtemos Yt:22rïi Tz:27,9; Ts:40,L e Ta:24,6. A média geral é Y:28,9' Cálculos intermediários podem ser, facilmente, feitos em uma planilha eletrônica ou calculadora fornecendo: 474 t t Yli : 24.672,42 " DT?: 3.b13,80.i:I j:r i:L Usando as fórmulas de cálculo apresentadas anteriormente, obtemos Ktnl( sQD : DLUS - *:Dfi : 24.672,42 - 7 x 3.513,80 : 75,82; i:r j:L i27 i.:t K sQE: *(DT? - KY'):7 x (3.513,80-4 x 28,86') =r.275,4U i:l It In SQT: D,DU\-*KYz :24.672,42-T x 4x 28,862:1.351,23. i:r j:l Uma vez calculadas duas das somas de quadrados acima, obtemos, sem dificuldade, a terceira. A tabela ANOVA é apresentada a seguir. Fonte de Graus de Variação Liberdade Soma de Quadrados Quadrado Médio F L.275,4L lgy : 452,,L4 W : L94,54 75,82 ff :3,,L6 Total 27 1.351,23 Através da distribuição de Fisher-Snedecor, com 3 e 24 graus de liberdade e, considerando a :\Vo, obtemos "f":3,009. Logo, como calculamos .f,,t,":L34r54 > /,, concluímos que, ao nível de significância de 5Vo, as médias de peso dos grupos são diferentes, confirmando as observações descritivas feitas Entre Dentro 3 24 trrnteriormente. 328 Grupos de tamanhos diferentes No desenvolvimento anterior, supomos que os 1( grupos têm todos o mesmo tamanho. Podemos considerar uma situação mais geral em que isto não acontece. Vamos denotar pot na o número de elementos do grupo e. Neste caso, o total de indivíduos nos K grupos será igual a n:nL*...1nx. Todos os resultados anteriores permanecem válidos, mas modificações algé são necessárias nas expressões que agora serão escritas da seguinte forma: Kni seD: It(0,,, - ro)r:i:t j:r K SQE : D"n(To - i':L Kni sQr : !!(ui -v),i:t j:r Fonte de Graus de Variação Liberdade Soma de Quadrado Quadrados Médio Entre Dentro K_T n- K SQE SQD Total n - I comF - F(K -I,n- K). i:r Kn;: I D,ul -,Y'. à:t j:l Note que, nesse caso, as médias geral e dos grupos são dadas por: por .I(niv::tDu" 'o i:l .i:7 o,: *,,\yi, i:r,...,K. A Tabela de Análise de Variância sofre poucas modificações, sendo dada SQT -"tt ncas 9.4 AnáIise de Variância 329 Exemplo 9.18: O volume de vendas, no ramo de vestuário, tem se mantido estóVOl de ano para ano, mas açredita-se que sofra mudança de um quadrimestre pere outro, dintro de um mesmo ano. Através de uma metodologia adequada, fOl criado um índice que reflete a quantidade vendida. Em cada um dos quadrimestre8 do ano, foram escolhidas aleatoriamente algumas empresas de mesmo porte e $ÇUS índices de venda foram calculados (ver abaixo)' Quadl Quad2 Quada3 114,7 L44,7 153,1 L44,7 173,4 L92,5 119,1 L54,2 745,5 r!3,7 L54,7 168,8 108,9 125,9 L4L,5 96,7 119,5 1.4r,2 87,6 155,7 189,6 L32,4 213,9 178,4 L56,2 208,6 159,0 O comportamento das vendas pode ser visualizado na próxima figura' RUI< tt ufi -1";Y'z1; i:t j:L i.:L F QME QME/QMD QMD .tJ0 Capítulo 9: Tópicos Especiais uma rápida avaliação dos box-prol mostra o primeiro quadrimestre com iï,T:ï::::índices. Os outros dois quadrimesrres apresenram vaÌores u,,, Oou"omais próximos. O modelo de análise.. de variância pode ser aplicado parasignificância estatística_das diferenças obs"ruaà^ oì.;"". a#;,-, : Lr, --8.,:r: L0 e ns -g. Faz"d; "r;;[;ì;r;;tï; H_^It : 1.14,7.; .Y?: LS',T; % : ios,s ;ï:;í;,;':"üïdisponíveis e a ajuda de uma planilhalletrônica obtemos 3n; J LruV; :604.207,68. i:L f f Y7:6tT.B5e,6B e cat a i, temos obtemos os dados i:r j__l Ilntiro, 3n;3 sQD : DDul -D"'Y?: 617'35e'6I - 604.207,68 : 13.332,00;L:L .:J:L 'i:7 I( sQE: D"rY? - rY' :604.207,68-27 x 747,9J2 : rJ.844,90;i:l c, com relação à variação total, SQT : 13.392,00 + 18.844,90 :26.676,90 . Com esses valores calculados, construímos a tabela ANOVA: liÌrnte de Variação Graus de Liberdade Soma de Quadrados Quadrado Médio F Entre Dentro 73.344,90 13.332,00 13.s44,90 2 13.332,00 24 2 24 :6.672,45 trffi : r2,0L : 555,50 Total 26 26.676,90 c) teste l'ornece o valor r1b": L2,01 que deve ser comparado com o varor crÍticoobtido de uma distribuição Fisher-snedecor com 2 e 24 graus de Iiberdade,Considerarrdo cv: 5Vo,.^obtemos .f..- 8,40J. Tendo "rn uï.io gue í,r,, ) ír,corrcluímos que existe diferença nas médias de venda dos quadrimestres. tr 9.4 Análise de Variância 331 Exercícios da Seção 9.4: 1. Três diferentes bancos possuem agências de mesmo porte em uma avenida movimentada de Salvador, BA. Para testar se essas agências têm movimento médio equivalente, foi escolhida uma semana típica de trabalho e o desempenho, nesses dias, foi registrado. Os dados obtidos, em milhares de reais, óstão apresentados na tabela a seguir: Banco 2 146,4 r99,2 179,,5 98,4 263,7 L94,3 r73,7 227,2 246,5 203,,4 289,8 111,8 L27,,4 275,0 265,6 Qual seria a sua conclusão ao nível a : 57o? 2. Uma agência de empregos deseja verificar o grau de satisfação de seus clientes. Para tanto, escolheu aleatoriamente domicflios de famílias de bairros classe A, B e C, que fizeram uso da agência e solicitou que um questionário fosse . preenchido pela pessoa responsável na família. Os questionários foram devidamente codificados, a fim de fornecer um índice de satisfação que varia de 1 a 5 (totalmente satisfeito). Os resultados estão apresentados a seguir. Qual seria sua conclusão, considerando a : 0,05? Classe B 1,5 2,8 L,7 3,1 2,7 2,4 2r5 3. A fim de verificar o efeito de quatro tipos de propaganda de uma determinada marca de goma de mascar, crianças foram atribuídas aleatoriamente a cada uma de 4 salas que mostravam desenhos animados, com intervalos regulares em que as correspondentes propagandas eram inseridas. Após a sessão, as CA 2,7 3,7 4,3 4,6 3,4 4,7 2,9 3,5 4,5 3,8 4,0 4,r 2,3 4,2 2,5 3,5 2,5 4,2 .736 "%!Flit|IF- Matematicamente, temos que resolver o sistema de equações p: LrtAn - nrA :1 - TLï' Exemplo 9.20: Yimos, no Exemplo 9.19, que o diagrama de dispersão sugere uma reta pode ser utilizada para representar o efeito da concentração de uma certe substância no pasto (X), no ganho de peso bovinos (Y). Para obtermos essa reta, precisamos calcular as estimativas de â e B. Dos dados fornecidos obtemos: -q -!!-n : r5,D*nru: 785,55; D"?: 163,39;r i.:l à:t Logo, p: n, Lt&t - nI Ai:t 785,55-15x2,70x16,14 as derivadas de SQ(a,0) em relação a a e B. Deixamos aslpontas a cargo dq leitor, apresentando aqui a solução para o sistema que fornecer/ os estimadores d; mínimos quadrados para a e B. Temos /À-f,a:A_pr; \ D"7i:r Tl, st-, Lx:í. - nr'i:l 163,39 -I5x2,702 ã : U - pT : 16,1.4 - 2,44 x 2,70 : 9,55. Portanto, dado X : {rit à reta ajustada fornece valores f,, dados por 0r, : ã +B rn: 9,55 * 2,44ri. A figura a seguir mostra os dados originais e a reta ajustada. O gráfico sugere que o modelo de regressão linear simples apresenta um ajuste adequado aos dados. L6,L4. -*.!qlFF 9,.í rtegres,rrT u Llnea r,lhrpler Modelo0: }j:al€it caso Ifl seja rejeitada, o modelo é 337 25 El .Y 8zoo ÍL oIt €rs tr (É (5 10 5 0 01234567 Concentração (mg/l) A interpretação dos valores estimados é feita da seguinte forma. O ganhO de peso esperado em bovinos que não recebem a substância X é 9,55kg (obtidO substituindo ri:0 na equação calculada acima). Por outro lado, um aumento de 1 mg/l na concentração de X implica em um ganho médio esperado de2,44kg. Testes de hipóteses, envolvendo os parâmetros do modelo de regressãO linear simples, baseiam-se na decomposição da variação total, discutida na Seção anterior. O principal teste de interesse é verificar se a covariável influencia na resposta, o que é equivalente a testar Hoi0:0versusH":Bl0' Caso 11o não seja rejeitada, adotamos o modelo :2144; i : l, ... ,Tt', i: 7r... )n.Modelol:\:a+PXilei, Através do Modelo 0 obtemos a soma de quadrados total, dada por --r .ï.ï8 Cttpftulo 9: T'ópicrts lislteciuis ser = D@, _ a)r, li:l / clue contém a variação total contida nos dados. Por outro lffo, o Modelo 1 gera a soma de quadrados residual \ seRes : f,@o - ã -ì *,)' , i:I clue contém a variação dos dados não explicada por esse modelo. A diferença cntre as duas somas de quadrados fornece a soma de quadrados da regressão, tlada por SeReg : SeT - SeRes :3' * D,fr, - *)r. i:l Para estabelecer os graus de liberdade associados às somas de quadrados, precisamos levar em conta as estimativas envolvidas em suas expressões. Assim, sQT envolve a média g, e assim, temos n - 1 graus de liberdade associados a essa quantidade; sQRes envolve duas estimativas, â "p, d" forma que teremosn - 2 graus de liberdade. Para a SQReg, restam n - I - (" - 2): 1 grau de liberdade. Consequentemente, definimos os quadrados médios por QMT:H -s',QMRes:H e QMReg:tQl"t. Seguindo os passos da seção anterior, utilizamos F_ QMReg QMRes para testar as hipóteses de interesse. Pode ser mostrado que .F tem distribuição de Fisher-Snedecorcom \en- 2 graus de liberdade, isto é, F - F(1, n-2). Em resumo, da mesma forma que na seção anterior, podemos apresentar as informações apresentadas em uma tabela ANOVA, específica para o modelo Y:a*?Xe*e;,dadapor ,=qF 9. 5 Il a g re s são l,in esr,S/rrryrle,r Fonte de Grnus de Variação Llberdade Soma de Quadrado FQuadrados Médio "*-*ru .ï.19 Regressão 1 Residual n - 2 SQReg QMReg QMReg/QMRes SQRes QMRes Total n-I SQT Exemplo 9.21: (Continuação dos Exemplos 9.19 e 9.20) No estudo da relação entre ganho de peso de bovinos (X) " a concentração de uma substância (Y), estabelecemos uma reta de regressão. Para verificar a evidência estatística do modelo realizamos um teste de hipóteses: Ho:B:g versus H":0*0' os valores de QMReg e QMRes podem ser calculados com o uso de uma planilha eletrônica, conforme a tabela seguinte @u-ã- Br,i)2 / _\o \rr - r)" 1 2 t t) 4 5 6 7 8 I 10 11 L2 13 t4 15 0,4r 0,39 1,65 L,L2 0,01 0,1-5 0,05 0,30 0,45 0,15 0,26 0,40 0,56 2,98 r,20 6,25 4,84 4,4L 4,00 2,89 L,44 0,49 0,04 0,09 0,64 1,69 3,24 5,29 7,84 10,89 Total 10,09 54,04 .140 ( | t p ít tt I t t 9 ;'liipi t't t,r lh pcc i t t i s Com base nos valores apresentados na última linha da tabel ) \:'o'' 327,73; ^z-SQReg : 0 \(ri - r), : 2,442 x 54,04 : i:l n, SQRes : D@o - ã -Ê "ò, : 10,09 .i:1, A tabela de ANOVA para o modelo de regressão proposto é dada por: Fonte de Variação Graus de Soma de Liberdade euaeÌrados Quadrado Médio F Regressão Residual 327,73 10,09 327,73 0,78 472,471 13 Total t4 331,92 Para a:0,05 obtemos, da distribuição de Fisher-snedecor com I e 13 graus delìbetdade, f": 4,667. Como fob,:4i,2,47 ) f", rejeitu*o, u hipótese 11, econcluímos que existem evidências estatísticas de que a concentração dasubstância X,de fato, altera o ganho de peso dos bovinos. tr Bxercícios da Seção 9.5: 1. um estudo deseja avaliar o efeito de determinado treinamento no tempo dereação de atletas submetidos a um certo estímulo. o treinamento consiste narepetição de um movimento e foi utilizada uma amostra de 37 atletas. paracada atleta foi atribuído um certo número de repetiçàãs (x) e, então, foimedido o tempo de reação ()'), em milisegundà.. Ü-u reta de mínimosquadrados foi ajustada aos dados, fornecendo a equação ffi : 80,5 - 0,90r;, i : I, ... ,n., Interprete as estimativas de a e B . 2. Para verificar o efeito da variável x sobre a variâver y, foi realizado umexperimento que forne^cel -os.far9s (u,?lo) dados por (ã;'13,S), (Z; àl,ij','(5;15,9), (2; I2,8),^,(9; 29,6), (T; Zg,5),' \S: t+,i1, ìãi áS,Sl, (B; 32,6),(2;L2,0). e (1; 4,6). obtenha aretìajustada. construa o diagrama de dispersão, baseando-se nos pares de valores iornecidos e, em ,"guiou, desenhe a retaajustada. Baseando-se apenas no gráfico, você diria que o"ajuste é adequado? :2 It rÊ F** .t Ê I ìi!: l: 'li ().(t li.rerrício,t Para verificar se existe relação entre a renda número de filhos, foi coletada uma amostra resultados obtidos estão na tabela a seguir: familiar (em salários rnínimos) e o de 8 famílias em uma ciditde, Os 141 3. Família 1 Renda 12 14 15 LT FilhosS22I a. Que conclusões podem ser tiradas, baseando-se em um diagrarna de dispersão e no coeficiente de correlação? b. Calcule a reta de mínimos quadrados e interprete os parâmetros. Veril'iquo se a renda influi no número de filhos, utilizando a : \Vo. 9.6 Exercícios 1. A seqüência de operações executadas por um operário para realizar uma ccrtt tarefa está sendo estudada. Para tanto, 9 operários foram sorteados e mediu-se o tempo necessário, em minutos, para que cada um realizasse a tarefa, cotÌl os dois tipos de seqüências. Suponha que o modelo Normal é adequado. Operário 23 27 34 43 1000 Atual Nova 24 25 2t 23 27 22 23 28 26 28 29 28 27 24 26 25 22 23 Baseando-se nos dados fornecidos, você diria que houve diminuição no tempo médio para a realizaçáo da tarefa? Use o : 57o. 2.Para se aferir o consumo de combustível, entre duas marcas de automóveis com mesmas características, escolheu-se 8 carros de cada marca e anotou-se o consumo após 100 quilômetros percorridos em uma estrada. Os resultados estão abaixo: Marca Consumo (krr/l) xwx 9,5 9,4 YWY 9,0 9,3 9,6 9,1 9,3 9,9 9,8 10,1 8,6 8,1 8,3 8,9 8,8 7,9 Fazendo as suposições necessárias, verifique se marcas é o mesmo. Use a :57o. Admita que variabilidade. 3. O desempenho em duas classes de Estatística está resultado dos dez melhores alunos de cada turma. o consumo médio dzrs cluns as marcas tenham a mesrnit sendo comparado através do - 346 Capítulo 9: Tópicos Especiais l exames feitos em diversos pacientes, escol(idos ao acaso, que, após serem avaliados por um dos aparelhos, tiveram \us casos estudados em maior profundidade. Desse modo, foi possível quàntificar o número de falsos positivos ou falsos negativos advindos do uso do aparelho. Em outras palavras, foi possível saber o número diagnosticado falsamente pelo aparelho como tendo ou não a doença. Seguem as informações obtidas: Aparelho Total Positivos Negativos Falsos positivos Falsos negativos I r20 85 11 10 t4 2 135 90 27 72 6 a. Teste se os dois aparelhos produzem a mesma proporção de diagnósticos falsos. Use a :4Vo. b. Dentre os que estão efetivamente doentes, isto é, os positivos e falsos negativos, teste se o aparelho 2 erra menos. Use a : 4Vo. c; Com base nas decisões tomadas nos dois itens anteriores, que aparelho seria mais aconselhável utilizar? Queremos comparar três hospitais, através da satisfação demonstrada por pacientes quanto ao atendimento, durante o período de internação. Para tanto, foram selecionados, aleatoriamente, pacientes com grau de enfermidade semelhante. Cada paciente preencheu um questionário e as respostas geraram índices variando de 0 a 100, indicando o grau de satisfação. Os resultados foram: Hospital 9.6 Exercícios pesos dos pacientes, tomados no início e no final do tratamento. Os dados obtidos foram (em kg): Número do paciente 45 910 347 Início 80 Final 78 r04 94 95 87 62 70 B0 r02 60 7t 82 94 58 78 84 65 78 80 L6. a. Baseando-se nos dados apresentados, teste a igualdade das variâncias para os hospitais A e B. Use a : 0,10. b. Teste se as médias populacionais são iguais. Qual sua conclusão? Use a : 0,05. 17. Pacientes resolveram processar a clínica de emagrecimento Linha Fina sob a alcgação de que o tratamento empregado não contribui para a diminuiçiro do peso. O advogado de defesa contratou um estatístico que selecionou, nleltoriamente, l0 prontuírrios que continham inlbnnaçiio a respeito dos a. Faça uma análise descritiva para os dados e obtenha uma conclusão preliminar. b. Verifique se a conclusão do item anterior tem suporte estatístico. Formule as hipóteses adequadas e encontre a região crítica correspondente a a:0,05. 18. Uma linha de montagem utiliza robôs para a realização das tarefas necessárias para a montagem de um produto. Os técnicos acreditam que é necessário umn programação diferente para garantir a qualidade do produto final, mas suspeitam que o tempo necessário para completar o processo pode aumentar, Para verificar essa suspeita, 12 robôs foram selecionados e o tempo necessário para a montagem do produto foi medido, considerando-se a programação usuül e a nova proposta. Os tempos observados (em minutos) para cada unidndc foram medidos, produzindo a tabela a seguir' Tipo de Identificação do Robô Programação 1 2 3 4 5 6 7 8 9 10 11 12 Usual 80 90 93 92 75 92 72 87 90 86 78 97 Nova 100 85 90 702 90 99 97 95 100 94 89 98 a. Faça uma análise descritiva adequada a estes dados. O que pode ser dito, baseando-se nessa análise? b. Existe diferença para os diferentes tipos de programação? c. Construa um intervalo de confiança de confiança com 'Y : 95 Vo para t diferença das médias populacionais dos tempos de montagem do produto. 19. O custo de manutenção de treminhões movidos a gasolina e a diesel são dados abaixo para duas amostras aleatórias de 10 treminhões de cada tipo. Os veículos considerados trafegam sob as mesmas condições em uma mesmiÌ área. A Tamanho da amostra Média amostral Variância amostral 10 15 13 80,7 59,0 72,3 113,3 L0t,4 10d,5 rí8 Cupftnlo 9: 'l'ópicos lltperlalt Combustível Gasolina Diesel L4p7 8,gg a. Quais são as hipóteses necessárias para construir um intervalo de confianç6, para a diferença das médias dos custos? b. Verifique se as variâncias dos dois grupos são semelhantes. c. Teste-a igualdade de médias dos dois grupos, considerando a : ïVo. 20. (Use o computador) Uma loja de departamentos está interessada em saber sg existem diferenças entre as quantias médias faturadas, através de três formag de pagamento: dinheiro (D), cheque (C) e cartão de crédito (CC), Um levantamento das vendas (em milhares de reais), em um dado período de tempo, foi feito, produzindo os dados na tabela a seguir. Formas de Pagamento CC 56,00 80,90 73,25 20,50 5r,29 56,65 37,37 40,95 123,2t 29,64 72,65 56,50 132,47 37,29 60,32 44,65 60,00 40,64 CD a. Calcule algumas medidas descritivas (média, variância, etc.) e, nelas, discuta se existem evidências de diferenças. b. Assumindo que as variâncias são iguais para os três grupos, estatisticamente as médias populacionais para verificar se diferenças. Use a : 0,05. 21. Quatro diferentes espécies de milho foram produzidas em laboratório. Deseja- se testar, a um nível de significância a:ívo, se existe diferença estatisticamente significativa entre as produtividades. Para tanto, foram montados 34 canteiros, plantando-se neles o mesmo número de sementes e garantindo-se a todos as mesmas condições de fertilidade, irrigação e exposição à luz solar. Após um período de tempo pré-especificado, a produção de cada canteiro, em kg, foi obtida. os resultados observados baseado compare existem 5,05 10,99 15;00-ÌÍ-1--876- 4.r7 t2,72 g,g5 2,94 5,00 JÇlr 9.6 llxcrcícios sofreram um tratamento disponibilizadas: I 90,56 13,28 34e inicial, e as seguintes informações foram Espécies 23 10 8 83,63 l_6,55 86,40 95,7L 74,27 13,23 ni Ti S? O que plode ser concluído com base na tabela? 22. (ÍJse o computador) o custo mensal de manutenção de determinado tipo de automóvel (excluindo-se combustível e trocas de óleo) está sendo analisado em ionçao da idade do veículo. Nove automóveis fabricados em diferentes elnos tiveram o custo averiguado' Os dados obtidos foram: Idade do veículo (anos) L2 Custo mensal (reais) 8 13 34567 18 20 24 26 29 89 32 37 a. Faça um gráfico de dispersão e calcule o coeficiente de correlação' comente o resultado. b.Ajustearetaderegressãopelométododemínimosquadrados.Comovocê interPretaria o coeficiente B? 23.VerifiqueSeérazoâve|considerarummodeloderegressãolinear relacionando u, noà, de Inglês (Y) e Português (X)' segundo os dados apresentados na tabela a seguii. Suaconclusão deve ser baseada no coeficiente dè correlação e no ajuste da reta de regressão' lnas s,s s,r 7,0 2,5 6,0 4,0 5,0 5,5 5,0 6,57,,0 4,5 8,5 3,5 24.(Useocomputador)Umaindústriasubmeteseusnovosoperáriosaumtestc de aptidão (;ç; e;á; meses depois mede a produtividade destes operários (Y)' Os rãsultados estão na tabela a seguir Notas Inglês Português 9,5 6,5 9,0 4,5 t10 Operário A C Aptidão (X) Produtividade (I') 22 45 15 25 25 .7 I a. Faça o gráfico de dispersão e calcule o coeficiente de correlação. Comente o resultado. b. Ajuste a reta de regressão e trace-a no gráfico de dispersão. eual a interpretação para os coeficientes a e B? c. Verifique estatisticamente se a produtividade é influenciada pela aptidão. Use a : 0,05. d. Para um indivíduo com aptidão igual a 20, qual seria a produtividade esperada? 25. Um estudo pretende avaliar o efeito da obesidade na pressão sangüínea. Para tanto, foram avaliados os pesos para 6 indivíduos e construída a variâvel X representando a razão entre os pesos real e ideal. Estudos indicam que um modelo de regressão linear simples é adequado para essa situação. os dados obtidos foram: Indivíduo Razão (X ) Pressão sistólica (Y) L,23 L29 I,42 130 1,35 133 a. Construa a variável auxiliar d, : r - r. b.Ajuste aretay: al0d. c. Qual a interpretação para o na reta obtida em (b)? d. Qual a pressão sistólica esperada para indivíduos com razão peso real/peso ideal igual a I,25? 26. Estuda-se a relação linear entre duas variáveis x e Y. uma amostra de 20 pares dessas variáveis forneceu os seguintes valores: 20 20 20 20 20 Dq :600, f sl : 2.150, D*? : 18.662, Dy? : 235.270, D*oyo : 65.92t .i:L i=t i-_7 i:t i:7 Determine a correlação e ajuste uma reta aos dados. 27. um estudo foi conduzido para verificar se as pessoas estimam os próprios pesos corretamente. No experimento realizado, 15 pessoas foram selecionadas 19 40 18 30 22 tt .) L) 9.(t litten:ícitts ''--t#- -: .ï.í / ao acaso e a cada uma delas perguntou-se os pesos' que depois foram aferidos em balanças devidamente calibradas' Os resultados são apresentados a seguir' O que pode ser concluído a partir dos dados? 2g. A quantidade de chuva é um fator importante na produtividade agrícola' Para medir esse efeito, foram anotadas, para 8 regiões diferentes produtoras de soja, o índice pluviométrico e a produção do último ano' Chuva (mm) 120 140 r22 150 115 190 130 118 Produção (ton) 40 46 45 tF7 tJl 25 54 ttJt-, 30 5557 1,67 139 1,65 1,56 136 L34 a. Faça um gráfico de dispersão e calcule o coeficiente de correlação. Comente o resultado. b. Ajuste a reta de regressão. Como você interpretaria o coeficiente B? c. utilizando a reta ajustada no item (c), encontre a produção esperada parit uma região com índice pluviométrico igual a l-60 mm' d. É adequado utilizar o modelo ajustado para calcular a produção em um0 região cujo índice pluviométrico é igual a 30 mm? Comente' ,29. (Use o computador) Para os dados do arquivo areas.txt (vejaExercício 25 do Capítulo 1), suponha que os apartamentos são classificados como de andar baúo, para a unidadã situada entre os 1s ao 6q andares (inclusive); intermediário, se o apartamento se encontra do 7q ao 72e andar e de andar alto, se estiver situado acima do l2e andar. Suspeita-se que apartamentos de andares mais baixos podem não ter o tamanho especificado no memorial descritivo' a. Construa histogramas para as medidas de área da sala para cada um dos grupos formadãs (andar baixo, intermediário e alto). Discuta se o modelo Normal é adequado para essa situação b. Dependendo de cada uma das três categorias de andar criadas, construa unl grá^fico box-plot para as áreas da sala e discuta se a localização interl'ere com o tamanho da sala' c. Usando um modelo de análise de variância, verifique se existem evidências estatísticas que dêem suporte à conclusão apresentada no item (b)' Utilize um nível de significância a : 0,01- D Indivíduo 6 789 13 t4 92 75 45 63 98 74 44 Peso 1 4 70 /c) 10 t2 Estimado I ì t tl t tl ttt tr.., t, t (.)t t t (. )t t, tt I r, t, l,' a. il U Fdo{hots@ooÉN 3NOOS 6FNoG .j cì oi rt at ll',,,,1,,, .I lìtlt, l,tt 6OÉdO$n€ Fddd(ddN N-oFod({r.ì ómddN.-.Or-, "i ri 6 oo- oì ...: ÕÌ _i <$$<96(ìrí) p I R R e g 3 È g 3 I I g P g : G È- Ë-t g-ã. Ë -9. ã :' Ê á ;' .; Ã- -' õ È *' d cì + ri Fi di o -. .? s o N @ o - c)'r+ ; = Ã' à.i o o c c rí iì ò õ i-' ó < t s t q s t n n LÕ ur É r € F o o 6 N N ó 3 3 R 3 ã 3 3 q + x-3-8-€- ì. R- :-; -ôó9N@s-cQ!F- q :' :' ì' .' "ì' + + ;- -' *' rr ao- o: 9 I i l : i : : : > = IôÔ É 6ó O { 6@ O 6 d o F o € - €o : sl' óÓ 6 O N s N' 6 É $ @ N € - ^ - d- ï- ô-'ó- { t- --'i. q'1 a a'- -1 l-- :' 3 ::õ- *- è' ã- ; -' cì.ì íi ct + d d d € N o @ 6 9 I = : : : : :'Ìoo €dNÓ6€aONOn6- õ ç n ì ò; ó qì N-ô-o-'1 \r't \o- c\didcì{€N6-NtgN6oN d:FììcìNiroooooootÌ 6N 60 o sl o so s c{ s 6 N s Ë E N: g ff 3 Ç ãÈìï I Cf i sNB B eâg qR à s x s * - - € o o -q o o s @ 6 s o N 6 ï ó ;i : ij iì X X X ;] : S y J Sr 9 o9 \ € s 6 o 6 õ N 6ã g ã' s ;' ï' â ;- ;' ì i l- ï- i ;-.'- -'- 3 3 3- 3- 3- ì 5 S 5 5 ;. : : È. : 5 ;. J Ì $€ \o 6@toÌ@h-NïQONNOg€O6.È R $ r 5 * Ê È e R id.{q R R ã t; Ë H ì.H.qì.€.$ i ë Ë g 3 à x ì 3 5d I Ë p * d ri ti Ç ì ì -i o' ;' ; ã ;' ;' ;' ;- ;- rt ct ci dì ci c,. F" c, o. o. rj ri ci c,. c,. e,. ^ pnFÍNN66O696NNN_óóFú{ s.s.;.È.Ìj R $ s n o o.; i\ = i\ õ Ê b +, F.g-ã È R R S p Ë F N È Ë g ã *; ;; ;'+ ï- ì;-;- S;;- 3-.'- S S S :-:.:. 1-N-.ì ôÌ cì.ì cì cì cì õì cì cì cì ôi ôi.ì ^ì -h-NOO@g-s6FN ú { ï{j Ìi õ õ q ô I ã 3 X 835 S SR PP Rll]9 Ír}q !eq!'q' o @ N@6ONO-6@diÉN .-- d + c, d "ì N. N. ã "ì ", -s. j. i "8. i. n 5 i. Ì. s i 3 3 3 i. s. : :. s 3 s 3 F. $. Ï. YôN6NNN6Óôó6r@6o;;+õóÃ3H$3fl NìHìËËiËìqËõ3ìsR33R; Ë ï'i S ì:'l- I-l- X-i-s cì.ì cì.ì "ì.ì N- ".- ";.;;: I.I ï.I.ï i: ì.I:.:.:. Ës:tì[**.3*s3ì:.: 3ïs3:33ÈiÈ3s$È**3ãs:.Ii Í9PN6OOOoN9N--O9Oïô6-ts ã s s : õ ; s È B à È R \ I i i : È. { q s. ì i i R Ë. fl p. â. à. g. ë. * S Ë Sd ôì cì ôì ôr'-j -j -' Ë Ê s. F Ë * 3- i- i- ï- i F Ë Ë :- Ë È- Ì r F ;. Ë ; F ; 3 Ë È ;:,,:,; - dre - -::-:==ciroeèiirNÁõóoooí)'''r'r 1 € 3 s s 5 s s g P s ã 3 ì õ I 8-3.S-3 * ã E Ë d $-R-S "?':ìì. õ- :'li- ;' ;'+ ;'d G :' ;' ;'Ë' : É É g i ! : > e 3 I R I ::l ll OF s 3 3 € 3 g s s ã;; ã õ ü ã-;-J-;; ã õ ü;- ã-;-J-J- J;i o 3-o-o-ai {- -,1';';';'i';';';-9- IFJdioìct'icìcìì-ì <i t 6o-N'---; 'Ì o- NO o- c1 o sn n-NÍ-O66 ..1 ô- vl c.L o: €. Õi o: NN@669== --o€o{o€Í- o- €- c.r 6: o- a\ @- oNr@@6OO Èó6OFdoq ;ÉFRdNNN prfì Nx \ 0) fu .2 o o E U' c)t- o o õE o 'ìJ (J fu I'5 o C)-o o ÌO .!I f -o L .9o ã33[ii3ì3]iIIÈiÌ33Ì]ÌiI3Ë! rï; ; Ë Ë R{RR 6\ c{ ô\\t ô\ to ô\o ô\o N @ÓNÈ o- o..o- o- 90ôó NNN€ dddd 6666 ooôõ oôóN 6- O- 6- !'ì oooo ddctd o66@ ddo-d ô@óó NNNN dddd FNO<t oppp. f !?9egorooooê. 39R9:::993 * 9=@-o€o6oGH ì3.ì{iA$.3Aàs --oooooddd \o QSu?-N@È€oQB 3õRXSf,FRRR rô .jddddddddd s \N!66O6€oNË tG3833;;;;\o dddddddddó :e oors@ïN6@NÁ =ïN-OOO6G6:í vlÌÍÌtï!oooh dddddddddo' :P o!ì.N-N6oNFoa^ !!@NN€999€9(!' o-c!a!NNNNNNN €o ddddddddcio' ;9 @NNsN-oo66ô()ÌooooooNN = --F- ï dddddddddd lL Fflórta€h@6O a_ I - lt U*- È U* I \ () f F .2 o U+ q C) L o õ ì c C) (J f+ tJl{ o ìO . !1" l -o'Ë .2 o olo- 6o \o€ Oo Oì .ô- ï-ôNS!oFô^ó@N€6ONONOF9 à ã. 3. 3. 3. 3. 3- 3. 3. 3. E g. 3- 3. g 3 3 5 S ë 3 s €OONFO6óóNú Ë Ë,Ë Ë g. BB gsss g.B3ssgBx.g. g.*. 333333s333È33333333.ii3 €6!ïóoNN^--ï-ooo66@N€Y oooooooóó.ió6q6, vì !ì o o ri iri õ õ ii 3-3-fi 3 3 ü il Ë il fi üo d d d d d d d d d d o' á ã à ã ã ã- ã l>l :,r à- i. $. Ë. s. ã. s. s. g. 8. g. B. g. s â g B Ë Ë Ë È Ë Hd d d d d d d d o a o' ó o' ã' ã. ;. ;- ;- ;. ;- ;- o- ft fr bìììì3sssËüË33333;;ffËiiiisiisiiSSSSSS5SSSi @@óNNNNN \\NNN€9€€9N N N N N N N N r o ir r e o i.r & iì à à À (ì èr d d o'o- o'b'o- ã ;' ;-ã ;- ;- ;. ;- ;-ã ã ;. ã ;. ;. n9N@6OFfloç6- ( d.ì ii n ci RÈ R & g 3 3 B B RS ôo €F@NN@o-€-.1\o-o: oo<to6 €6NF9ó 6OO-€N oìF at+ìd ôFdOqO ô6óeó€oo +6rN-oOa o- -- ô' ci .j .j cì cìo,.o F:s.s.à.{s.3.u---oooF_d oo doçoots@6 g 6ô $: (ì :i Ëôo *óRo;- ê\9oì:?ô"- OS6€X@OOÈNo- - ; n r ci ii R R F R R R g g e B g R S ddddrl op snorc .1.ía \ ,'lpítrtlit t, ,'l: 'lìtlrlrtt I )istt ilnrir;tttt Ii ::3eRãËRfiRRRRRtt!sI ; g ;. ã-.s. $. t. q. Ë fi. t $. F F,-a e e- ; .8- s- ì- 3- 3- ü' g' Ë' s' *' q :' I : i : I Ë []i t i t- -:. s. t a'fl s.'H. n's. t Ê- qrË ã i €- 8- È- s- q : ï. : I : : : : I r n;gË s.* ì.\ e ã.;n fi.flS-F-h-Ë-È Ë Èã H'H'Ë'H'e'e'ë'â-Ë'qR'I s s, H s Ë â.ï i. 5. Q. s. ç ç €. 5 e à s a- ã- ã- F- il- ã :. u' ï Ì : : i : : : I R Ë *. ã. s. Ë. ë- Ë- S. €. Ì. q. ì. g. {. $- €- Q- 5- q- ë- -s' ã' ã' H' A :* ;' =" i i i : I I- â Ë s'i aeã.q.ï*.s.$.i.i.È.€-Eç-s-ì-s-*-ç-€-Ë ë €'F'e'e';'ãr I = n *.8.3- 3. s. s. ë. ï. $. ì. i. s.3. s- E q- e- =- *- E s- q ï::::::::1 I = I A Ë.3. s- Ë- Ë. ã- ì 'p= r. ì. ì- ì- =- i- 3- 5' E- e' q' E' q::::::::: i I : Ê S 3 ã Ë s g ã-ç-e-+-8.i.ï S-ì-3-3 3 3-5-q'E'ì'q-g s'S'E3'{'ã':" I : F. F, e. s. --. t Ë. Ë. ã. ã- è. i. ì. F- q i ï : t e- s i' : : : : : : : : : : : I = s. s ã. à. s. Ë- s- s. Ë- ã- e e. s. *. ;. *. ç. *. ì. e- ì. ë. E ì- s- 3- : ï l- l 1 : : I = ;; * i s n s s Ë ã.ã Ë â.€ ë. ë.ì.ì-ì-ï-r-q{-*-ì-$-?'ç's'i' q'$'$' I = ji*:',is r.s s s s.ã.ã.ã.s.e.Ç.ç.€.ã s ?-;-?ï-*-ì-i-i-E e'ï'q' I = , n R à il. S. s. 5. Ë. Ë. g. Ë. Ë. $. Ë- H- È- s- ã- ã' H' Ë' ã' Ê' €' ë- * * : : : : : I E a*tf'ek ei.ai.i+if : :'.'. :Ì:$i.3:ã: ï : : : : : I p, i;í RrR ã. ã ã. *. a*. a*- 45. a=*. Ë-.!- n-€, g.$ È' g- :*t :,ï : i I I : - Ë. fi. n s. n t ã- 3. :. ã. il. $. B. a Ë. s- Ë- ã- $- s- 3- 3 3- 5- S- Ë' ì' 3' 3' i A { n ' Ë. { : s t Ê Ë F { Ê ã H- H- â- =- ã' ã' â' i Ì * : : : Ì f : : : : : ï I ^ Ê. =., R i R R { R Ë. Ë R R Ë Ë- R â R R- R Ê { Ë' Ë R Ë' Ê â { Ë i 3 1 : - p i R -Ë.. F, R F. I i i R R R a È, a n R R R R- R R R i I i 3' i i F' R Ë - ; u * u u aH.R,*aËã.Ë.Ë.È.ì.RP*i.iRR{-s,{-{Ë-[{R-{RR - E l. Ë. È. e. E Ë. Ë. ì E 3. 3- E Ê. E E E- Ë Ë Ë E Ë i ! r' x i ì Ì Ì : : :. t69::::::::::>ÈÈÉ' a!. p.!- =.É. iËr = :. :,É : Ë^ iË. iËn ii_ =.,. -,1. l,,,ut f i f f I : :ï s.-du.'üË'âË Ë.Ë- iï :i:B:f 1; . t t :,:'ï':,,ï a 3 : : Ir ã:g *. i aé. aia u. s aè. a=à Ë. â à : i :. È : : Ê ã .ã- ë. Ë- È- â d- -'rl - ! --i o o x'o - P =l'l gii'p:':': : 54 s p'x p'x l'* I g g B e o il .lJ 5 \ o fu .eb ctEl+o lç" b lor Elzllri lo*lO ol>P lr O)lrr I L'-lg;loTtIE, IP Ë l?" loll-c l.e ll!l6)Ir lo lrõ l(, t: l-o ll-l+ lú! lo ropDurruoueP oP ePDPreqll ap snotc I B ò( : 5 s : s fì :I 9. ;: :. a :- : ;lÈ-l =l ;l ;l ;l :l -81 :l :l :lcl JI *l :l;l -'l 'l 8 L' Oo E- P(l)o E' P; oE: c) !ogT::L ::=o; o3E ..::::: ut, =lô oL() ,-. \ \ () f C' .9 o \U q) E tn () l- o o I o L,, oT 0) cv, I l- q)c .2 u- o-o o ro . !1" f -o'tr ,2 o t ,il il F iï I roPoultuouap op apopJaqtl ap snDrc Apêndice B Respostas dos Exercícios Observações: 1. Nos exercícios de seção a resposta será, na maioria das vezes, acompanhadA de indicações da resolução. 2. Paru os exercícios de fim de capítulo exercícios ímpares. 3. Os exercícios de computação e de apresentadas. 4. Pequenas diferenças em algumas aproximações e casas decimais utilizadas. 5. Para não tornar muito extenso esse omitidos na apresentação das respostas. serão apresentadas as respostas para os demonstração não terão suas respostas respostas poderão refletir diferentes apêndice, os gráficos solicitados foram 361
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved