Pandas é uma biblioteca em Python que permite trabalhar com grandes quantidades de dados de uma forma muito fácil: é possível carregar planilhas e tabelas, trabalhando-as do mesmo jeito que você trabalharia em um banco de dados SQL, é possível realizar todo tipo de análise estatística, inclusive produzindo belos gráficos e também é possível realizar atividades de geoprocessamento, trabalhando com dados georreferenciados, plotando mapas e realizando análises estatísticas em mapas.
Código de geoprocessamento em Pandas rodando na IDE Spyder
Contents
Instalando pandas
Nesta seção vamos ver como você pode instalar pandas em seu computador em casa ou no Google Colab, e como você pode usar Pandas dentro de um Jupyter notebook.
O tipo de dado básico em pandas é o DataFrame, que nada mais é do que uma tabela. Tudo o que você pode fazer com tabelas em softwares estatísticos como Statistica ou SPSS, você também pode fazer em Pandas com os DataFrames. A mesma coisa vale, se compararmos Pandas com SQL.
Links
Operações básicas com pandas
Nesta seção vamos ver como se faz algumas operações básicas com pandas: como eu carrego uma tabela, como eu opero com essa tabela usando a mesma filosofia que você usaria trabalhando com tabelas em SQL, como você pode fazer outras operações mais avançadas.
Links
- PyData::Essential basic functionality
- TowardsDataScience::23 great Pandas codes for Data Scientists
- https://www.tutorialspoint.com/python_pandas
- https://pandas.pydata.org/pandas-docs/stable/getting_started/basics.html
- Python for healthcare modelling and data science::Using Pandas to merge or lookup data
Análise estatística com pandas
Nesta seção vamos ver como você faz análise estatística básica com pandas: cálculo de máximos mínimos, médias, desvio padrão e outros valores simples.
Links
Gráficos com pandas
Nesta seção vamos ver como você pode usar as capacidades gráficas de pandas e para fazer todos os tipos de gráficos que você normalmente faria numa planilha, como por exemplo: scatterplots, gráficos de barras, gráfico de pizza e assim por diante. Vamos ver também como você pode fazer algumas análises estatísticas mais avançadas.
Links
- PyData::Visualização básica em Pandas
- PyData:: Livro de Receitas de Plotagem
- TowardsDataScience::A Guide to Pandas and Matplotlib for Data Exploration – este tutorial mostra também como usar Seaborn, uma biblioteca que estende matplotlib e ajuda a fazer gráficos mais sofisticados
- Datacamp::Python Seaborn Tutorial For Beginners
- PyData:: Seaborn
- Visualization with Seaborn do livro Python Data Science Handbook by Jake VanderPlas – excelente material didático, com Jupyter notebooks no Google Colab
- Muitos exemplos na https://python-graph-gallery.com/
Geoprocessamento com pandas
Nesta seção vamos olhar para uma das características mais fantásticas de pandas: a capacidade de você realizar geoprocessamento. vamos ver como você carrega mapas, vamos ver como você correlaciona mapas com outras tabelas, como você trabalha com mapas de calor, com outros mapas de cores, como você pode trabalhar com intersecções de mapas e assim por diante. vamos ver também como você vai poder exportar os resultados de todo o processamento que você fez na forma de arquivos de forma, que vão ser carregados em outros softwares de geoprocessamento.
Links
- Site com a documentação e tutoriais de GeoPandas
- Criando mapas
- Geocodificação – convertendo nomes de lugares em coordenadas geográficas
- Tutorial de como trabalhar com mapas em Python no ambiente Spyder. Este tutorial, além de ser bastante simples, também serve se você vai usar Jupyter notebooks e tem a vantagem de ser bem introdutório
- Medium::Essential geospatial Python libraries por Christoph Rieke
- Datacamp::Introduction to Geospatial Data in Python por Duong Wu. Este tutorial é muito bom, vai indo passo a passo desde a instalação de Pandas até a utilização com dados do furacão Florence.
- Curso completo de geoprocessamento automatizado com Python da universidade de Helsinki. Este é um curso online muito interessante, que inicia dando informações gerais sobre geoprocessamento, informações sobre pandas com python e depois vai entrando em detalhes das bibliotecas de geoprocessamento de pandas. Possui um GitHub associado.