Esta es una radiografía socioeconómica de Santa Cruz de la Sierra, desarrollada mediante algoritmos de ciencia de datos y análisis estadístico multivariado. Este modelo segmenta la ciudad utilizando la cartografía oficial y los microdatos originales del Censo de Población y Vivienda. Se procesó la información correspondiente a las áreas amanzanadas, lo que significa que el análisis refleja la realidad de cada manzano de forma individual.

Para lograr esta precisión, se utilizaron todas las variables censales disponibles, contemplando:

  • Características de la vivienda (acceso a electricidad, agua por cañería, alcantarillado, combustible para cocinar, etc.)
  • Niveles de educación
  • Acceso a salud
  • Actividad económica

A partir de esta data, se agrupó la mancha urbana en un espectro continuo de cinco niveles (A, B, C, D, E). La clasificación opera de forma similar a una escala de Likert socioeconómica: se despliega de manera gradual iniciando en el Nivel A, que concentra la mayor riqueza, formalidad y consolidación urbana, y desciende progresivamente hasta llegar al Nivel E, que representa los sectores de mayor pobreza, carencia de servicios básicos y expansión periférica.

Respaldo técnico y metodología: El desafío del procesamiento y origen de datos

Este estudio no es una simple visualización de datos generales; es el resultado de un extenso trabajo de ingeniería de datos y reconstrucción cartográfica. El mayor valor de este análisis reside en la unificación masiva de información: se extrajo, depuró e incorporó la ficha técnica de cada manzano de forma individual, integrando miles de registros dispersos en una sola base de datos maestra georreferenciada.

La construcción de los polígonos y la asignación de variables requirió un proceso de limpieza y validación técnica para asegurar que la información del Censo de Población y Vivienda 2024 se reflejara con precisión absoluta a nivel de calle. Toda la información base y la cartografía amanzanada pueden ser consultadas y verificadas en la fuente oficial: Geoportal del Instituto Nacional de Estadística (INE).

Modelado matemático y minería de datos

Para transformar datos crudos en inteligencia territorial, se aplicó un modelo estadístico multivariado estructurado en dos fases:

• Análisis de Componentes Principales (ACP): Se procesó el universo de variables censales por manzano (educación, salud, accesos a la caja de salud, actividad económica, vivienda, hogar y servicios básicos). El ACP redujo esta complejidad técnica en factores sintéticos que explican la varianza socioeconómica.

• Clustering K-Means: Se ejecutó un algoritmo de agrupamiento no supervisado que segmentó automáticamente la mancha urbana en 5 estratos con la máxima homogeneidad interna, asegurando que cada manzano esté clasificado por su similitud estadística real y no por criterios subjetivos.

Escala socioeconómica

La clasificación opera en un gradiente continuo de consolidación urbana:

Nivel A (Alto): Máxima consolidación, servicios plenos y alto capital humano.

Nivel B y C (Medio): Áreas consolidadas con cobertura estable de infraestructura básica.

Nivel D y E (Transición y Base): Zonas de reciente expansión periférica con mayores necesidades de servicios.

El autor se encuentra realizando el mismo análisis sobre la ciudad de Cochabamba.

Por Williams Mamani Calle, técnico en Estadística, análisis espacial.  Correo electrónico: williamsmamanicalle@gmail.com

Desde que lanzamos Ideas Textuales, nuestro objetivo ha sido narrar reflexiones e historias que no salen en las noticias habituales.  

Este proyecto es independiente, sin auspiciantes políticos ni corporativos. Lo sostenemos  con nuestro tiempo, esfuerzo y una profunda convicción de compartir nuestras lecturas y escrituras.

Si este espacio te ha hecho reflexionar, te ha llegado, informado o inspirado, podés apoyarlo con un aporte voluntario.

Cada donación nos permite seguir escribiendo, investigar más a fondo y llegar a más personas con historias que valen la pena.


Descubre más desde Ideas Textuales®

Suscríbete y recibe las últimas entradas en tu correo electrónico.