Lei dos Grandes Números

A teoria da Probabilidade, algo tão presente quando se trata de discussões estatísticas, estuda a chance de determinado evento acontecer. Esse tipo de lógica tem diversas utilidades em nosso dia a dia, sendo uma delas a estimação de valores esperados para determinados eventos, e é aí que se encaixa a Lei dos Grandes Números.

Vejamos a um exemplo.

Suponha que uma determinada cidade tenha dois hospitais. Destes, no maior hospital, nascem cerca de 45 bebês por dia, por outro lado, no menor, nascem 15 por dia, em média. Em geral, 50% dos recém-nascidos são do sexo masculino, porém, essa porcentagem varia entre um dia e outro, sendo às vezes maior, e outras menor.

Durante um período de um ano, ambos os hospitais coletaram os dados dos dias em que mais de 60% das crianças nascidas foram do sexo masculino. Em qual hospital você acha que foram observados mais desses dias?

– No maior hospital
– No menor hospital
– Aproximadamente iguais

Neste experimento, proposto por Tversky e Kahneman, por muitas vezes a resposta mais observada é a terceira, porém, a resposta correta é a segunda opção, “no menor hospital”. Isso se deve justamente à Lei dos Grandes Números.

Mas afinal, o que esse teorema nos diz? Segundo a Lei dos Grandes Números, quanto mais vezes um experimento se repete, a probabilidade de determinado evento acontecer se aproxima da probabilidade esperada. Relacionando isso com o exemplo acima, quanto mais bebês nascem por dia em um hospital, maior é a chance de que o número de bebês do sexo masculino se aproxime da probabilidade esperada de 50%. Por esse motivo é mais provável que o hospital menor tenha registrado mais dias com mais de 60% dos recém-nascidos sendo garotos, já que tem uma média de 15 nascimentos contra 50 do outro hospital.

A Lei dos Grandes Números é muito utilizado em diversos experimentos científicos, e também em áreas como economia, agricultura, engenharia de produção e diversos outros tipos de negócios.

Esse tipo de teoria expõe a importância do uso de algumas técnicas estatísticas na realização de experimentos. Uma das técnicas que pode auxiliar nesse sentido, é a amostragem, uma vez que calcula o número de vezes que um experimento deve ser repetido para que se obtenha um valor que realmente represente a população de estudo.

Falácia da Disponibilidade

Heurísticas são estratégias que têm como característica ignorar parcelas de informação visando tornar a tomada de decisão mais fácil e rápida. Normalmente nós utilizamos heurísticas inconscientemente, e elas costumam ser úteis, viabilizando escolhas adequadas em situações que exigem julgamento ágil. Contudo, em algumas situações, as heurísticas podem induzir a erros de avaliação e percepção, levando a decisões e/ou julgamentos errados. Existem diversas heurísticas que costumamos usar quando tomamos decisões. Como mais um exemplo da nossa série de vieses cognitivos, abordaremos hoje, a heurística da disponibilidade.

Considere as seguintes causas de morte nos estados unidos entre 1990 e 2000:
– Doenças Cardíacas
– Cigarro
– Acidentes de Carro
– Armas de Fogo
– Drogas Ilícitas

Em qual ordem você arranjaria as causas de maneira a representar do maior para o menor a frequência na qual ocorrem?

Já tem a sua resposta? Primeiramente, liderando as causas de morte, tem as Doenças Cardíacas, com média de 729.000 mortes anuais, em seguida o cigarro, com 435.000 mortes por ano. Já na terceira posição, vem os acidentes de carro, que causaram 43.000 por ano. Em penúltimo lugar, 29.000 mortes anuais, causadas por armas de fogo e por último, drogas ilícitas, que foi a causa de morte de 17.000 pessoas.
A heurística da disponibilidade está relacionada com a alta probabilidade que associamos à eventos que acessamos com facilidade na memória. A questão é que não necessariamente aquilo que lembramos com maior facilidade é aquilo que mais ocorre. No geral, guardamos e lembramos melhor de informações específicas, chamativas, que nos provoquem alguma emoção ou que possam ser imaginadas com facilidade.

Por exemplo, muitas pessoas preferem viajar de carro ao invés de avião por medo de quedas ou acidentes. No entanto, estatisticamente, a chance de acontecer um acidente de carro é muito maior do que um acidente de avião. Mas a notícia da queda de um avião é mais marcante, e no geral, lembramos com maior facilidade do que um acidente de carro.

Os problemas relacionados a heurística da disponibilidade surgem quando nós julgamos a frequência de um evento com base em informações que não refletem a frequência real dele. Usualmente, acabamos tirando conclusões generalizadas com base em uma amostra pequena, não representativa, mas fácil de lembrar.

Falácia da Conjunção

O ser humano está constantemente cometendo erros. Dentre eles estão os vieses cognitivos, fenômenos que interferem na interpretação dos acontecimentos e influenciam negativamente a tomada de decisões. Dando sequência ao último post, em que foi abordada a Falácia do Apostador, trataremos hoje da Falácia da Conjunção.

Suponha a existência de uma mulher chamada Linda. Linda tem 31 anos, solteira, sincera e muito inteligente. Ela formou em Filosofia, quando estudante se preocupava muito com questões de discriminação e justiça social, e participava de protestos contra armas nucleares. O que é mais provável?

  1. Linda ser uma bancária.
  2. Linda ser uma bancária e ativa no movimento feminista.

Já tem sua resposta? Bom, a questão tratada acima foi proposta pelos psicólogos Daniel Kahneman e Amos Tversky, que observaram que grande parte das respostas avaliam que Linda ser uma bancária ativa no movimento feminista é mais provável que ela ser apenas uma bancária.

Essa alternativa, mesmo parecendo intuitivamente correta, está errada. Refletindo por um momento sobre isso a resposta é clara: em todos os casos em que Linda é uma bancária ativa no movimento feminista, ela é necessariamente uma bancária, mas ainda existe a possibilidade de que ela seja uma bancária sem ser ativa no movimento feminista. Em outras palavras, sempre que a segunda opção estiver correta, a primeira também vai estar, mas existe chance da primeira opção ser a correta sem que a segunda também seja.

Isso é a Falácia da Conjunção, quando adicionando mais detalhes a uma história, ela parecer ser mais plausível, ao mesmo tempo que a probabilidade dela estar correta é necessariamente menor. Sabe qual é o pior de tudo? Nós fazemos isso constantemente, tanto no dia a dia, enquanto nós conversamos com amigos ou formamos nossas opiniões, quanto em momentos mais sérios, como em tomada de decisões.

Se algum amigo te falar que no próximo jogo do Brasil, o México vai abrir o placar, você pode atribuir uma probabilidade média a esse evento. Mas, se ao invés disso, você for informado que o México vai abrir o placar, seguido por um gol do Coutinho no início do segundo tempo, e um gol do Neymar pouco mais tarde, garantindo a vitória do Brasil e classificação nas quartas de finais, muitas pessoas vão atribuir uma probabilidade maior para esse evento do que ao primeiro. Quando isso ocorre em conversas entre amigos, não há dano. Mas, se o seu aconselhador de investimento te avisar que as ações da Apple vão cair, você pode não acreditar, mas se a história for aumentada, com uma história sobre uma baixa, seguida de uma recuperação e aumento após o anúncio do novo iPhone, essa é uma história menos provável que a primeira, porém mais fácil de acreditar por ter mais detalhes esperados, o que pode levar a tomadas equivocadas em decisões financeiras.

Qual a moral da história? E qual a relação disso com estatística? A lição é ter em mente que quando se trata de analisar algo desconhecido e fazer previsões, cada detalhe adicional é um peso novo, e deve ser levado em consideração. Para escapar da Falácia de Conjunção, precisamos estar sempre nos policiando e avaliando nossas escolhas. E nada melhor do que a estatística para nos ajudar a tomar decisões! Estudos estatísticos são controlados, conscientes, e devem ter sempre todos os fatores influentes meticulosamente e matematicamente avaliados. Não há dúvidas de que quando se trata de se libertar da Falácia da Conjunção, a estatística tem muito a contribuir.

 

O engano da aleatoriedade

Já aconteceu de você escutar duas músicas seguidas do mesmo artista no modo aleatório? Ou perceber que algumas músicas tocam com uma frequência maior do que outras? Em razão disso, muitos alegam que o modo aleatório não é de fato aleatório. Porém, na verdade, estão bem enganados e há duas explicações para isso.

A primeira justificativa é o fenômeno cognitivo conhecido como apofenia, que afirma que as pessoas estão constantemente buscando padrões em coisas aleatórias, logo, se no modo aleatório escutam músicas seguidas de um mesmo gênero ou artista, acreditam que há um padrão e não uma aleatoriedade. Entretanto, justamente por ser aleatório, a chance de repetir o mesmo artista em sequência existe, uma vez que os eventos são independentes. O que nos leva para a outra justificativa, a falácia do apostador, em que o indivíduo tende a acreditar que a probabilidade de um evento acontecer aumenta a medida que se repete o experimento sem que haja a ocorrência deste evento. Para exemplificar este engano, suponha que sejam realizados 6 lançamentos de uma moeda e que ocorra cara em todos, diante disso, nós tendemos a acreditar que a probabilidade do próximo lançamento ser coroa é maior, dado que este resultado ainda não aconteceu.

Por conta de todas estas queixas, tanto o Itunes quanto o Spotify desenvolveram um algoritmo que torna esse modo de reprodução menos aleatório, para que assim, na percepção de seus usuários, pareça ser aleatório. Contudo, segundo relato dado por Mattias Johansson em 2015, engenheiro de software do Spotify na época, é muito difícil criar algo que se pareça genuinamente aleatório e que, ainda hoje, as pessoas constantemente se questionam sobre a aleatoriedade da reprodução das músicas.

Dados que representam

É bem comum se deparar com pesquisas de satisfação em restaurantes, lojas ou receber emails com questionário online. Sem contar as abordagens que acontecem na rua solicitando participação em pesquisa. Isso se dá pela necessidade do empresário em conhecer o cliente ou do pesquisador em levantar dados para seus estudos. Porém, muitas das vezes, essas informações não são coletadas da maneira mais adequada.

Um dos equívocos mais comuns quando se faz uma pesquisa é a realização da coleta de dados de forma viesada, isto é, com uma espécie de erro sistemático ou uma tendenciosidade, e a partir disso tirar conclusões a respeito de característica de toda a população. Os materiais coletados dessa forma são chamados não representativos, isto é, não refletem a população como um todo, mas apenas as pessoas que participaram do estudo.

Suponha que precisa fazer uma pesquisa a respeito da experiência das pessoas que utilizam transporte público coletivo. Na amostragem por conveniência, que é um exemplo de viés, são selecionados os elementos da população que sejam mais acessíveis. Neste caso, utilizando esse tipo de coleta, bastaria ir à parada de ônibus mais próxima e pedir às pessoas lá presentes que respondessem a pesquisa.

E por que isso não seria o mais adequado? Considere que nesse caso o objetivo fosse analisar a satisfação dos usuários em relação ao tempo de espera, caso a parada em que a pesquisa tenha sido feita seja localizada na parte central da cidade, onde consequentemente passa uma maior quantidade de ônibus, logo, as pessoas em sua maioria estarão satisfeitas. Mas essa informação não pode ser expandida como a opinião geral de todos os usuários, uma vez que os que utilizam paradas mais afastadas podem não ter o mesmo nível de satisfação.

Para que seja possível obter informações que viabilizem a generalização das conclusões, deve-se realizar uma amostra probabilística. Para isso, é preciso ter conhecimento de toda a população e definir aleatoriamente a amostra, de forma que qualquer elemento tenha a mesma probabilidade de ser selecionado.

A Estatística ao Longo da História – Parte II

George Box, um garoto que aos 16 anos largou a escola para ser assistente de um químico em uma usina de esgoto, também foi um dos que se tornaram estatísticos acidentalmente. Tudo começou quando, por ser assistente químico foi chamado a Porton Down, um parque científico, onde fez parte dos estudos acerca dos efeitos dos venenos, como o gás de mostarda.
Ele tinha tido contato com um livro de um grande estatístico da época, Ronald Fisher, e mesmo tendo dificuldade em compreender todas as ideias propostas no livro, teve a ciência de que para o sucesso do experimento era necessário um estatístico. Ao expor isso aos seus superiores, eles alegaram que ele deveria ser capaz de fazer, uma vez que tinha lido o livro. Foi aí que ele entrou em contato com o Fisher para que ele o ajudasse e assim conseguiram realizar os experimentos.
Depois da Segunda Guerra Mundial, George Box se formou em matemática e estatística, também recebeu PhD da Universidade de Londres. Ele foi responsável pela publicação dos livros “Statistics for Experimenters”, “An Accidental Statistician”, entre outros. Sem contar, ser conhecido por diversos testes estatísticos em que foi um dos responsáveis pelo estudo.

A Estatística ao Longo da História

As guerras são capazes de mudar o cenário dos países envolvidos, e mais, o plano de vida de muitos cidadãos. Para Claus Mober, não foi diferente. Um judeu, nascido em Berlim em 1922, que fugiu para a Grã-Bretanha em 1936, aos 13 anos. Depois de alguns anos lá, o Primeiro-Ministro da época por medo de haver espiões entre os refugiados decidiu mandá-los para um campo de internamento em Huyton 

Os judeus se desenvolveram neste campo de internamento, abriram café, fizeram concertos. Lá ele teve a oportunidade de conhecer o diretor de um escritório de estatística e se tornar seu assistente. Meses depois foi liberado do campo, por ser muito novo, e se formou em Estatística na London School of Economics. Por ter feito a graduação em excelência e ter um alemão fluente, ele conseguiu trabalho em um grupo ultrassecreto que visitou os locais de bombardeio da Força Aérea Real para descobrir se os relatórios dos pilotos sobre os danos causados correspondiam à realidade. Anos depois entre 1967 a 1978, foi chefe do serviço estatístico do governo britânico. 

Claus Moser que tinha um sonho de ser pianista, planejava estudar comércio e administrar hotéis, se tornou estatístico por ter sido colocado na prisão. E ele é apenas um dos que jamais se tornariam estatísticos se não fosse pela guerra.

Referência:

http://www.economist.com/news/christmas-specials/21636589-how-statisticians-changed-war-and-war-changed-statistics-they-also-served

A importância da estatística em diferentes campos

 

A estatística desempenha um papel vital em todos os campos da atividade humana. Sendo de extrema importância na determinação de renda per capita, desemprego, taxa de crescimento populacional, habitação, escolaridade instalações médicas, e entre outros aspectos.

Por ser uma ciência extremamente ampla, ela mantém uma posição central em quase todos os campos, como a indústria, comércio, negócios, física, química, economia, matemática, biologia, botânica, psicologia, astronomia e por aí vai. Segue alguns exemplos de aplicação:

(1) Negócios:

O uso da estatística desempenha um papel importante nos negócios. Um empresário de sucesso deve ser muito rápido e preciso na tomada de decisões. Ele sabe o que seus clientes querem, ele deve, portanto, saber como otimizar sua produção e vendas.

A estatística ajuda o empresário a planejar a produção de acordo com o gosto dos clientes, a qualidade dos produtos também pode ser verificada de forma mais eficiente usando métodos estatísticos. Assim, a maior parte das atividades empresariais são com base em informações estatísticas. Ele pode tomar decisões corretas sobre a localização dos negócios, marketing dos produtos, recursos financeiros.

(2) Em Economia:

A economia depende em grande parte de estatística. Contas de renda nacional são indicadores de múltiplos propósitos para os economistas e administradores. E para preparar essas contas, são necessários alguns métodos estatísticos.

Na economia, esses métodos são utilizados para coletar, analisar os dados e testar hipóteses. Para assim observar a relação entre oferta e demanda, as importações e exportações, a taxa de inflação, a renda per capita e outros fatores que requerem bons conhecimentos de estatística.

(3) Em Matemática:

Os métodos das ciências naturais são os mais confiáveis, mas as conclusões deles são apenas prováveis, porque baseiam-se em evidências incompletas.

Estatística é o ramo da matemática aplicada que ajuda a descrever essas medidas com mais precisão. O grande número de métodos estatísticos como médias de probabilidade, dispersões, estimativa são usados em matemática e diferentes técnicas de matemática pura como integração, diferenciação e álgebra são usadas em estatística.

(4) Em Bancos:

Os bancos fazem uso das estatísticas para uma série de propósitos. Eles trabalham com base no princípio de que todas as pessoas que depositam seu dinheiro nos bancos não irão retirá-lo logo em seguida. Assim, há o lucro além dos depósitos em si, pois através desse dinheiro, são feitos empréstimos com juros. Para um bom rendimento são necessárias abordagens estatísticas baseadas na probabilidade de estimar o número de depositantes e suas reivindicações para um determinado dia.

(5) Na Gestão do Estado (Administração):

As estatísticas são essenciais para um país. Diferentes políticas do governo são baseadas nelas. Os dados estatísticos são agora amplamente utilizados na tomada de todas as decisões administrativas.

Suponha que o governo quer revisar as escalas de remuneração dos empregados em vista de um aumento no custo de vida, métodos estatísticos serão usados ​​para determinar o aumento do custo de vida. A preparação dos orçamentos federais e provinciais depende principalmente das estatísticas, pois ajuda na estimativa das despesas e receitas esperadas de diferentes fontes.

(6) Em Contabilidade e Auditoria:

A contabilidade é impossível sem exatidão. Mas para fins de tomada de decisão, tanta precisão não é essencial e a decisão pode ser tomada com base na aproximação, usando a estatística. A correção dos valores de ativos correntes é feita com base no poder de compra do dinheiro ou no valor atual do mesmo.

Na auditoria as técnicas de amostragem são comumente usadas. Um auditor determina o tamanho da amostra do livro a ser auditado com base no erro.

(7) Em Ciências Naturais e Sociais:

A estatística desempenha um papel vital em quase todas as ciências naturais e sociais. Métodos estatísticos são comumente utilizados para analisar os resultados das experiências, testando o seu significado nas mais diversas áreas do conhecimento.

(8) Em Astronomia:

A astronomia é um dos ramos mais antigos do estudo estatístico. Trata-se da medição de distância, tamanhos, massas e densidades de corpos celestes por meio de observações. Durante estas medições os erros são inevitáveis ​​assim que as medições mais prováveis ​​são fundadas usando métodos estatísticos.

Exemplo: Medição da distância da lua à terra. Desde os velhos tempos os astrônomos têm usado métodos estatísticos como método de mínimos quadrados para encontrar os movimentos das estrelas.