Ciência de Dados: Aprendendo a Trabalhar com Pandas

Pandas é uma biblioteca em Python que permite trabalhar com grandes quantidades de dados de uma forma muito fácil: é possível carregar planilhas e tabelas, trabalhando-as do mesmo jeito que você trabalharia em um banco de dados SQL, é possível realizar todo tipo de análise estatística, inclusive produzindo belos gráficos e também é possível realizar atividades de geoprocessamento, trabalhando com dados georreferenciados, plotando mapas e realizando análises estatísticas em mapas.

Screenshot_20190809-081742_Firefox

Código de geoprocessamento em Pandas rodando na IDE Spyder

Instalando pandas

Nesta seção vamos ver como você pode instalar pandas em seu computador em casa ou no Google Colab, e como você pode usar Pandas dentro de um Jupyter notebook.

O tipo de dado básico em pandas é o DataFrame, que nada mais é do que uma tabela. Tudo o que você pode fazer com tabelas em softwares estatísticos como Statistica ou SPSS, você também pode fazer em Pandas com os DataFrames. A mesma coisa vale, se compararmos Pandas com SQL.

Links

Operações básicas com pandas

Nesta seção vamos ver como se faz algumas operações básicas com pandas: como eu carrego uma tabela, como eu opero com essa tabela usando a mesma filosofia que você usaria trabalhando com tabelas em SQL, como você pode fazer outras operações mais avançadas.

Links

Análise estatística com pandas

Nesta seção vamos ver como você faz análise estatística básica com pandas: cálculo de máximos mínimos, médias, desvio padrão e outros valores simples.

Links

Gráficos com pandas

Nesta seção vamos ver como você pode usar as capacidades gráficas de pandas e para fazer todos os tipos de gráficos que você normalmente faria numa planilha, como por exemplo: scatterplots, gráficos de barras, gráfico de pizza e assim por diante. Vamos ver também como você pode fazer algumas análises estatísticas mais avançadas.

Links

Geoprocessamento com pandas

Nesta seção vamos olhar para uma das características mais fantásticas de pandas: a capacidade de você realizar geoprocessamento. vamos ver como você carrega mapas, vamos ver como você correlaciona mapas com outras tabelas, como você trabalha com mapas de calor, com outros mapas de cores, como você pode trabalhar com intersecções de mapas e assim por diante. vamos ver também como você vai poder exportar os resultados de todo o processamento que você fez na forma de arquivos de forma, que vão ser carregados em outros softwares de geoprocessamento.

Links

Sobre o Autor

possui graduação em Ciências da Computação pela Universidade Federal de Santa Catarina (1989) e Doutorado Acadêmico (Dr. rer.nat.) em Ciências da Computação pela Universidade de Kaiserslautern (1996). Atualmente é professor Titular da Universidade Federal de Santa Catarina, onde é professor do Programa de Pós-graduação em Ciência da Computação e dos cursos de graduação em Ciências da Computação e Sistemas de Informação. Tem experiência nas áreas de Informática em Saúde, Processamento e Análise de Imagens e Engenharia Biomédica, com ênfase em Telemedicina, Telerradiologia, Sistemas de Auxílio ao Diagnóstico por Imagem e Processamento de Imagens Médicas, com foco nos seguintes temas: analise inteligente de imagens, DICOM, CBIR, informática médica, visão computacional e PACS. Coordena o Instituto Nacional de Ciência e Tecnologia para Convergência Digital - INCoD. Foi o criador e primeiro Coordenador do Núcleo de Telessaúde de Santa Catarina no âmbito do Programa Telessaúde Brasil do Ministério da Saúde e da OPAS - Organização Pan-Americana de Saúde e criador do Núcleo Santa Catarina da RUTE - Rede Universitária de Telemedicina.