Em uma pesquisa, sempre é necessário medir alguma característica dos componentes da população que está sendo estudada. No caso de um estudo sobre pessoas, podemos medir características como peso, altura, salário, sexo, tipo sanguíneo, entre outras medições dependendo do objetivo da análise. Matematicamente, essas características são tratadas por meio de variáveis.
A variável é uma estrutura matemática que assume valores dentro de um conjunto de resultados possíveis previamente estabelecido. A altura de uma pessoa, que pode variar de alguns centímetros ao nascer até um pouco mais de dois metros na idade adulta, pode ser entendida como uma variável, pois assume valores dentro de um espaço previamente estabelecido pela própria natureza. Se você já precisou resolver uma equação qualquer durante o seu tempo de escola, encontrar o valor de “X”, então já trabalhou com variáveis alguma vez na vida. O “X” para o qual você precisava encontrar um resultado era uma variável. Ocasionalmente, este resultado resolvia um problema real.
Atentar-se ao espaço de variação é muito importante ao trabalhar com variáveis. Você deve lembrar que em alguns problemas chegava-se a duas raízes de uma equação, “X1” e “X2”, e descartávamos uma delas quando era negativa. Em um problema de Geometria, por exemplo, não faz sentido um comprimento negativo. Descartamos uma das raízes da equação porque não pertence ao espaço de valores para o qual a variável foi definida pelo problema dado para resolução.
As variáveis com as quais trabalhamos na escola eram determinísticas, pois conseguíamos determinar o valor assumido por elas com certeza. Quando a variável assume valores de forma probabilística, ela é chamada de variável aleatória e seu espaço de variação é chamado de suporte. O suporte contém todos os valores possíveis da variável aleatória. A probabilidade de cada valor possível é dada por uma distribuição de probabilidade, função matemática (fórmula) que determina as probabilidades de todos os resultados possíveis de uma variável aleatória (veja o artigo Como aumentar a probabilidade de ganhar na Mega Sena).
No âmbito estatístico, existem algumas classificações para as variáveis que guiam as formas como elas são analisadas. As variáveis podem ser quantitativas, quando assumem valores numéricos (altura, salário), ou qualitativas, quando assumem valores não numéricos (sexo, grau de instrução, tipo sanguíneo). As variáveis quantitativas se subdividem em discretas, quando são passíveis de contagens (quantidade de pessoas em uma fila num determinado momento), ou contínuas, quando possuem infinitos fracionamentos (comprimento, peso, tempo). As variáveis qualitativas, também chamadas de categóricas, se subdividem em nominais, quando não há hierarquia entre as possibilidades (sexo, tipo sanguíneo), ou ordinais, quando há hierarquia entre as categorias (tamanho de roupa, que pode ser P, M, G, GG). As classificações estão resumidas na tabela abaixo:
Tipos de variáveis | Exemplos | |
Quantitativa | Discreta | Contagens em geral: números de filhos de uma família, de pessoas numa fila, de banheiros numa casa. |
Contínua | Peso, altura, comprimento, tempo. | |
Qualitativa | Nominal | Sexo, tipo sanguíneo, cor da pele. |
Ordinal | Grau de instrução, classe social. |
Quando fazemos uma pesquisa, geralmente obtemos uma amostra aleatória de alguns elementos da população objeto do estudo (não necessariamente pessoas, pode ser qualquer artigo elencável que tenha características mensuráveis), medimos as variáveis importantes e usamos métodos inferenciais para tirar conclusões sobre a população a partir desta amostra (veja o artigo O que é a Estatística?). Esse processo é amplamente replicado no método científico, o que faz o conceito de variável aleatória um dos mais elementares e importantes da Estatística.

Estatístico e cientista de dados. Apaixonado por aprender e compartilhar conhecimento nas áreas de estatística, economia, finanças e investimentos. Experiência com modelagem estatística e econométrica para a previsão de demanda no transporte rodoviário de passageiros e ferroviário de cargas; análise econômico-financeira de seguros ferroviários; planejamento amostral para pesquisas de campo e construção de modelos de Machine Learning para a análise de propensão de compra, risco de crédito e detecção de fraude.