Dentre os modelos de predição numéricos um dos mais simples é o de regressão linear. Neste modelo buscamos pela reta que melhor se ajusta ao dados. O objetivo é o de prever aproximadamente resultado que não estão presentes na amostra.

Nesta postagem, irei aplicar o modelo de regressão linear a um conjunto de dados encontrados no site Ourworldindata que relacionam o número de acidentes aéreos fatais com o passar dos anos. Você pode encontrar o programa e os dados usados no meu perfil do github.

O resultado é mostrado na figura 1. Na figura 1, vemos os dados representados por pontos vermelhos.

Figura 1

Aplicando o modelo diretamente a todo o conjunto de dados encontramos a linha reta azul na figura 2. Por meio dela temos uma noção aproximada dos números de acidentes por ano.

Figura 2

A maior utilidade desta ferramenta é prever (dentro de uma certa probabilidade) resultado que não foram dados pelo modelo inicialmente. Por exemplo, na figura 3 eu apaguei 20% dos pontos dos dados originais e apliquei o modelo para este conjunto reduzido de dados.

Figura 3

Suponha que eu esteja interessado nos dados que eu perdi, para obtê-los basta eu escolher um ano específico e tracar uma reta vertical até que ela toque a linha azul. Em seguida traçando uma linha horizontal a partir deste ponto até o local que cruza com o eixo das ordenadas, terei o valor aproximado do número de acidentes daquele ano. De fato, aplicando o modelo (a linha azul) para os dados que estavam faltando (veja figura 4) observamos que os dados estão razoavelmente próximos da reta.

Figura 4

É interessante mencionar que os resultados do modelo são apenas aproximações. É preciso verifica se os novos dados fazem sentido. Por exemplo, de acordo com o modelo, em 2017 o número de acidente por milhão de voos tende a zero e em 2018 esse número se torna negativo (o que claramente é um erro grotesco do modelo).



Visite: https://reserva.ink/361379

Sugestão de leitura: Data Science do Zero

Imagem de capa: Photo by Jonathan Borba from Pexels

Deixe um comentário

Tendência