ESTATÍSTICA

Disciplina: Estatística e Probabilidade

CORRELAÇÃO

Introdução, Diagrama de Dispersão. Um Exemplo de uma Falsa Correlação. Coeficiente de Correlação

Introdução:

É comum olharmos para Dados Pareados [pares ordenados do tipo (a,b), com a e b, respectivamente, pertencentes aos conjuntos A e B], por uma rápida inspeção ou mesmo plotando (Diagrama de Dispersão: será visto mais adiante!) as duas Séries de Dados correspondentes a duas Variáveis Quantitativas X e Y, deduzirmos que X e Y estariam Correlacionados baseando-se na Propriedade de que, em geral, quando o valor x cresce observamos que o valor Y , também, cresce - ou que quando x cresce, em geral, y decresce. Toda via, esta correlação pode ser falsa: Isto porque existiria uma Terceira variável Z que esta sim explicaria o comportamento APARENTEMENTE correlacionado das variáveis X e Y.

Isto que acabamos de explanar está presente de forma muito didática no Livro "Introdução à Bioestatística" da Autora Sônia Vieira e que por esta razão apresentaremos na Íntegra. Os nossos comentários serão aparte no intuito de salientar os pontos mais importantes dentro do objetivo desta Página.

A seguir apresentamos o Capítulo 5 do livro mencionado acima o qual trata de Correlação entre Variáveis Quantitativas.

Muito importante entender a parte que colocamos em destaque (sublinhada) acima. Um fenêmeno em estudo para duas Variáveis Aleatórias X e Y até pode ser uma relação de causa e efeito, isto é, Y como função matemática de X: y(X) e ou X como função matemática de y: x(Y) em que quando o valor x cresce, observa-se que Y SEMPRE cresce - função Não-Decrescente (ou que Y SEMPRE decresce - função Não- Crescente). As Variáveis não seriam mais Aleatórias, mas sim se tratando de um Problema Determinístico (Não Probabilístico) onde se saberia com certeza de que um acrécimo no valor de x IMPLICARIA num acréscimo no valor de y (isso, considerando Y como função matemática de X). À luz da Estatística não mudaria nada, pois que a relação se comprovaria - Até em se tratando (mais tarde) de Regressão, o que se conseguiria é um função que descreveria este fenômeno, mas que ainda haveriam de existir ERROS entre o valor de y(X) e o Y*(X) calculado dado a função escolhida no modelo de regreção. tendo-se como critério de ajuste o Método dos Mínimos QuadradosNeste Problema supostamente tido como determinístico, ter-se-ia uma Forte Correlação entre X e Y e que o Coefiente de Correlação certamente igual a 1 para função não-decrescente (e -1, para função não-crescente). O Diagrama de Dispersão seria o Gráfico da Função y(X) ou da Função x(Y)! Observa-se que este para problema determinístico dado o Grafico mencionado, a Função de Ajuste Y*(X) poderia ser obtida, por exemplo, por Métodos da Disciplina da Matemática Computacional denominada de "Cálculo Numéro" sendo um destes o Método o de Interpolação Polinomial ou um outro tipo de função Interpoladora.

Vejamos um segundo estudo exemplo segundo a Tabela 5.2  abaixo. O que se tem a dizer com respeito às Variáveis em questão x="Consumo individual de proteínas" e y="Coeficiente de Natalidade"?

Um Exemplo de uma Falsa Correlação: A autora procura mostra com este exemplo que mesmo os valores das duas variáveis aleatórias variando no mesmo sentido, não devemos sermos precipitados em afirmar a existência de uma possível Correlação. Leia com mais atenção o que sublinhamos em vermelho e aceite a idéia de que uma outra variável z="Qualidade de Vida" é que explicaria o fato de as outras duas variáveis originais X e Y caminharem no mesmo sentido!

Estaremos Editando uma Página específica para tratar do Coeficiente de Correlação e, também, do Assunto REGRESSÃO. Uma Vídeo Aula será apresentada pra melhor explanar estes assuntos. Aguardem!

Ensino&Informação: Correlação (Variáveis Quantitativa e Qualitativa) - Introdução

Altamir Antonio Rosa AraldiCorrelação (Variáveis Quantitativa e Qualitativa) - Introdução

 

Publicado em 08 de jun de 2016

Esta Vídeo Aula faz um Esboço do que vai ser as Vídeo Aulas 01 e 02 onde na primeira trataremos da Correlação entre duas Variáveis Quantitativas X e Y numa Tabela de Dupla Entrada a definição de Correlação é dada e uma Síntese dos Dados pode ser mostrada em um Gráfico um Diagrama de Dispersão; 

 

Na segunda (02) Vídeo Aula trataremos da Correlação entre duas Variáveis Qualitativas (ou Categorizadas) em uma Tabela de Contingência e/ou a Distribuição Conjunta de Probabilidades e suas Distribuições Marginais e Graficamente para Síntese dos Dados são mostrados Histogramas Gráficos em Colunas (e/ou em Barras).

 

Nossa Revista: Ensino&Informação (no Facebook)

Tópicos em Estatísticas: Arquivo Formato ".PDF"

  A partir de 12 Set de 2020

Você é o Visitante de Número

(48) 8410.6510 /  faleconosco@ensinoeinformacao.com  /  Florianópolis - SC - Brasil

  • w-facebook
  • Twitter Clean
  • w-googleplus

® 2003 - 2018 Todos os direitos Reservados, ensinoeinformacao.com

Temos Uma versão desta Revista Especificamente para SmartPhones: Versão mais Enxuta somente com Vídeo Aulas e Eventos