8 Classificação do Uso e Cobertura do Solo

8.1 Uso vs. cobertura

Os termos “uso do solo” e “cobertura do solo” são frequentemente empregados de forma intercambiável, mas referem-se a dimensões distintas que devem ser conceitualmente separadas (Verburg et al., 2009). A cobertura do solo (land cover) descreve o material biofísico presente na superfície terrestre num dado momento. Floresta, pastagem, solo exposto, água e superfície impermeável são categorias de cobertura definidas por propriedades biofísicas mensuráveis (reflectância espectral, estrutura da vegetação, composição do substrato). O uso do solo (land use) descreve a função socioeconômica atribuída a essa superfície. Agricultura, pecuária, conservação, habitação e recreação são categorias de uso definidas pela atividade humana que se desenvolve sobre a cobertura.

A distinção é relevante porque uma mesma cobertura (gramínea) pode corresponder a usos distintos (pastagem extensiva, gramado urbano, campo de aviação, campo de futebol), e cada uso implica regime de manejo, intensidade de perturbação e trajetória futura completamente diferentes. Imagens de sensoriamento remoto detectam cobertura, não uso. A atribuição de uso requer informação complementar (cadastros fundiários, dados socioeconômicos, safras declaradas, conhecimento de campo). Sistemas de classificação como o MapBiomas adotam uma hierarquia que distingue níveis de cobertura (Nível 1, com classes como formações florestais, campestres, agropecuária) e níveis de uso (Nível 3, com classes como soja, cana-de-açúcar, pastagem plantada), sendo que os níveis de uso são derivados de cobertura com auxílio de dados auxiliares (calendário agrícola, altitude, precipitação).

8.2 Métodos de classificação

Os métodos de classificação de imagens de sensoriamento remoto dividem-se em duas grandes categorias. A classificação supervisionada utiliza amostras de treinamento (pixels ou segmentos cujo rótulo é conhecido) para treinar um algoritmo que aprende a relação entre a resposta espectral e as classes definidas, e então atribui cada pixel da imagem à classe mais provável. A classificação não supervisionada (K-means, ISODATA) agrupa automaticamente os pixels com base em similaridade espectral, sem conhecimento prévio das classes, e os clusters resultantes são posteriormente rotulados pelo analista.

Na classificação supervisionada, os algoritmos mais utilizados incluem o classificador de máxima verossimilhança (Maximum Likelihood), que assume distribuição gaussiana multivariada das classes, a árvore de decisão (Decision Tree), que segmenta o espaço espectral por limiares sucessivos, a floresta aleatória (Random Forest), que agrega múltiplas árvores de decisão para reduzir overfitting e estimar importância de variáveis, e as máquinas de vetores de suporte (Support Vector Machine), que buscam o hiperplano de separação ótima entre classes. Mais recentemente, redes neurais convolucionais (Convolutional Neural Networks, CNN) têm sido aplicadas a classificações de alta resolução com resultados promissores em paisagens tropicais, embora demandem grandes volumes de dados de treinamento. A Figura 8.1 sintetiza o fluxo de trabalho completo da classificação supervisionada.

Figura 8.1: Fluxo de trabalho da classificação supervisionada de uso e cobertura do solo, destacando o laço iterativo de refinamento.

A Figura 8.1 explicita uma propriedade frequentemente negligenciada na prática. O fluxo não é linear, mas iterativo. A seta que retorna da validação (acurácia insuficiente) para a coleta de amostras indica que o processo de classificação envolve múltiplos ciclos de refinamento, nos quais amostras de treinamento são adicionadas ou corrigidas, parâmetros do classificador são ajustados e a classificação é repetida até atingir a acurácia desejada. Em paisagens tropicais com alta variabilidade espectral, três a cinco iterações são comuns antes de se obter um mapa com acurácia global superior a 85%. A etapa de pós-processamento (filtro de moda, remoção de fragmentos menores que uma área mínima, generalização de bordas) é necessária para eliminar o ruído sal-e-pimenta (salt-and-pepper noise) inerente à classificação pixel-a-pixel, que cria falsas manchas de uma única célula que inflacionariam artificialmente as métricas de paisagem.

8.3 Classificação orientada a objetos

A classificação baseada em pixels trata cada célula isoladamente, desconsiderando o contexto espacial. A classificação orientada a objetos (Object-Based Image Analysis, OBIA) agrupa pixels espectralmente similares e espacialmente contíguos em segmentos (objetos) antes da classificação, numa etapa denominada segmentação. Cada objeto resultante possui atributos espectrais (média, desvio padrão de reflectância), geométricos (área, perímetro, compacidade, elongação) e contextuais (proporção de classes vizinhas, distância a feições) que são utilizados como variáveis de classificação.

A OBIA é particularmente vantajosa para imagens de alta resolução (sub-métrica a 5 m), nas quais a variabilidade espectral intra-classe é elevada e a classificação pixel-a-pixel produz resultados ruidosos. Um telhado cerâmico, por exemplo, contém pixels de tijolo claro e escuro, sombra e vegetação rasteira adjacente, que a classificação por pixel atribui a classes diferentes, enquanto a OBIA reconhece o conjunto como um único objeto “edificação” com base na forma, textura e contexto. Em paisagens tropicais, a OBIA tem sido empregada com sucesso para mapear fitofisionomias do Cerrado, distinguir estágios de regeneração em fragmentos de Mata Atlântica e classificar usos agrícolas diversificados.

8.4 Série temporal e classificação multitemporal

A incorporação da dimensão temporal à classificação amplia significativamente a capacidade discriminatória. Cultivos agrícolas com respostas espectrais similares numa data específica (milho e soja no início do ciclo, por exemplo, são ambos gramíneas/leguminosas verdes com NDVI similar) podem ser distinguidos pela assinatura fenológica ao longo de toda a estação de crescimento, conforme demonstra a Tabela 8.1.

Tabela 8.1: Separabilidade de classes de uso e cobertura por resposta espectral estática vs. assinatura temporal de NDVI. A coluna “estática” indica o grau de confusão numa única data, enquanto a coluna “temporal” mostra como o perfil fenológico permite discriminação.

Classe	Resposta espectral estática	Assinatura temporal (NDVI)
Soja	Média, confunde com milho	Pico em fev, senescência abrupta em abr
Milho	Média, confunde com soja	Pico em jan, senescência em mar
Cana-de-açúcar	Alta, confunde com floresta	Pico em mar–mai, corte abrupto (queda para 0,2)
Pastagem	Baixa a média	Amplitude sazonal moderada (0,3–0,6)
Floresta	Alta e estável (0,7–0,9)	Sem variação sazonal significativa
Solo exposto	Baixa e estável (< 0,2)	Sem variação sazonal

A Tabela 8.1 evidencia que a informação temporal resolve ambiguidades que a informação espectral estática não consegue resolver. Soja e milho, indistinguíveis numa única imagem, separam-se pelo deslocamento temporal do pico de NDVI (janeiro vs. fevereiro). Cana-de-açúcar e floresta, ambas com NDVI alto numa data qualquer, distinguem-se pelo evento de corte (queda abrupta de NDVI para valores inferiores a 0,2), que é ausente na floresta. Pastagem e vegetação campestre nativa, confusas em imagens estáticas, podem ser separadas pelo regime de manejo (a pastagem manejada mostra flutuações irregulares associadas a pastejo e roçagem, enquanto a vegetação nativa segue um ciclo sazonal regular).

O projeto MapBiomas utiliza classificação multitemporal em plataforma Google Earth Engine para gerar mapas anuais de uso e cobertura de todo o Brasil (1985–presente) com resolução de 30 m (Landsat). A metodologia emprega mosaicos médios anuais, séries temporais de NDVI, EVI e outras métricas fenológicas, e classificadores Random Forest treinados com amostras específicas para cada bioma, atingindo acurácias globais que variam entre 82% e 92% conforme o bioma e a classe.

8.5 Validação

A validação da classificação é etapa obrigatória e não pode ser suprimida por limitações de tempo ou recursos, pois sem validação o mapa temático é uma representação de confiabilidade desconhecida e as métricas de paisagem calculadas a partir dele carecem de significado quantitativo.

O procedimento padrão consiste em coletar amostras de referência (pontos cuja classe é determinada independentemente, por verificação em campo, interpretação visual de imagens de alta resolução ou consulta a bases oficiais) e comparar a classe atribuída pela classificação com a classe de referência. As amostras de referência devem ser independentes das amostras de treinamento (conjuntos separados), estratificadas por classe (para garantir representação adequada de classes raras) e georreferenciadas com precisão compatível com a resolução da imagem.

A matriz de confusão (confusion matrix ou error matrix) é a ferramenta fundamental de avaliação (Congalton, 1991). Dela derivam a acurácia global (proporção total de acertos), a acurácia do produtor (probabilidade de um ponto de referência de uma classe ser corretamente classificado, indicando erros de omissão), a acurácia do usuário (probabilidade de um pixel classificado numa classe corresponder à realidade, indicando erros de comissão) e o índice estatístico Kappa (\(\kappa\)).

\[ \kappa = \frac{p_o - p_e}{1 - p_e} \]

A formulação do Kappa penaliza estruturalmente sucessos espúrios obtidos por mera força majoritária de classes. Mecanisticamente, \(p_o\) denota a concordância observada empírica (fração direta de acertos na diagonal principal da matriz) e \(p_e\) engloba a concordância esperada unicamente ao acaso (produto das densidades marginais para cada classe avaliada). Exemplo de cálculo: Considere um mapeamento onde o classificador acertou 85% do arranjo (\(p_o = 0.85\)). Se a matriz revelar, pelas frequências marginais, que a distribuição aleatória acertaria 50% (\(p_e = 0.50\)), o desconto estrutural computa \((0.85 - 0.50) / (1 - 0.50) = 0.35 / 0.50 = 0.70\). O índice \(\kappa = 0.70\) isola o “mérito técnico” exclusivo do algoritmo acima do viés probabilístico. Valores de \(\kappa \ge 0.80\) certificam estabilidade robusta. Apesar de algumas restrições na literatura sobre excesso de penalização conservadora em biomas hiper-monótonos (ex: monoculturas sem falhas), a métrica permanece indispensável na filtragem de acurácias inflacionadas. Para subsidiar modelagens de escoamento hidrossedimentológico e fragmentação sem falsos alarmes, requer-se acurácia de usuário estrita (mínimo de 80%) em cada estrato principal.

Propagação de erros para métricas de paisagem

Um erro de classificação de 10% que converta sistematicamente “capoeira” em “pastagem” reduz a proporção de habitat florestal estimada, aumenta artificialmente o número de fragmentos e diminui a conectividade calculada. A acurácia da classificação de uso e cobertura é, portanto, o alicerce sobre o qual toda a análise quantitativa da paisagem se sustenta. A análise de sensibilidade das métricas de paisagem aos erros de classificação, embora raramente conduzida, é altamente recomendada para avaliar a robustez dos diagnósticos.

8.6 Desafios em paisagens tropicais

A classificação de paisagens tropicais enfrenta desafios específicos que limitam a acurácia e a resolução temática dos mapeamentos. A nebulosidade persistente limita a disponibilidade de cenas ópticas livres de nuvens, especialmente durante a estação chuvosa (4–6 meses na Amazônia, 3–5 meses na Zona da Mata), e pode inviabilizar a obtenção de imagens utilizáveis justamente no período de maior atividade vegetativa. A diversidade de fitofisionomias (no Cerrado, por exemplo, a transição contínua entre campo limpo, campo sujo, cerrado ralo, cerrado típico, cerrado denso e cerradão) dificulta a definição de limites de classe e reduz a separabilidade espectral entre formações adjacentes no gradiente. A dinâmica agrícola acelerada (dupla safra, safrinha, sistemas integrados lavoura-pecuária-floresta, ILPF) exige classificações multitemporais de alta frequência para capturar ciclos curtos que podem ser confundidos com mudanças de cobertura.

Estratégias para lidar com esses desafios incluem a integração de dados ópticos e SAR (radar penetra nuvens), a utilização de séries temporais densas com composição de melhores pixels (mediana, quantis), a adoção de sistemas de legenda hierárquicos (classificação em níveis progressivos de detalhe, nos quais classes incertas em níveis detalhados são agregadas em classes confiáveis em níveis superiores) e a validação em campo com georreferenciamento por GNSS de precisão.