Por Francisco Villena
En la era de la cuarta revolución industrial y bajo la plena irrupción de tecnologías como la inteligencia artificial, blockchain, realidad aumentada y realidad virtual, no hay que olvidarse de otra tecnología que está más presente de lo que se pueda pensar en un principio, y que acorde a varios estudios puede llegar a irrumpir a gran escala en la revolución tecnológica en curso.
Durante 2020 se espera que existan más de 20.4 billones de “cosas” conectadas en uso, respecto a los 8.4 billones que existían en 2017. Desde sensores a dispositivos móviles el crecimiento exponencial de elementos conectados, está creando una enorme cantidad de información sobre qué hacemos, cómo lo hacemos y dónde lo hacemos.
Todo ocurre en algún lugar, el 95% de la información que generamos a través de los dispositivos conectados tiene un componente espacial de alguna u otra manera, la explotación de esta información requiere nuevos métodos, nueva tecnología y talento innovador que hasta ahora nunca se había puesto en práctica.
La ciencia de los datos espaciales, se basa en el dónde y en el por qué y se apoya en la tecnología de los GIS (Geographic Information Systems) o Location Intelligence, que trata todos los aspectos de recolección, explotación y mantenimiento de los datos geospaciales, que integrándolos con datos de negocio puede ser un key player en la construcción de los puentes que unen el mundo físico y el mundo digital.
En España, el uso que mas se demanda actualmente en cuanto al uso de GIS es la transformación digital apoyada en infraestructuras geospaciales así como el análisis de negocio con el foco puesto en geomarketing y optimización de rutas o puntos de venta.
Son muchas las organizaciones, a nivel mundial, que son conscientes que para mantenerse en la brecha competitiva en el mercado actual deben entender y sacar ventaja a la pieza de localización de los datos. Apoyándose en la tecnología que proporciona GIS. Así, han explotado el paradigma de “la ciencia del donde” mejorando su cuenta de resultados, la satisfacción de sus clientes y el grado de penetración de sus productos en mercados que a priori eran complicados o inalcanzables.
La explotación de la información geospacial es una disciplina enfocada a transformar la información espacial a través del enriquecimiento de dicha información y análisis predictivo, en valor para el negocio de las organizaciones.
Sin entrar en grandes detalles, a nivel tecnológico, el campo de la información geospacial abarca 4 grandes bloques:
-
Ciencia de datos espaciales (Spatial Data Science)
-
Entidades de Modelado de la información espacial (Spatial Modelling)
-
Agrupación espacial (Spatial clustering)
-
Optimización logística con análisis espacial (Logistic Optimization)
Ciencia de Datos
Los científicos de datos tradicionalmente han tratado los atributos espaciales de los datos como un atributo más de la información, aplicando los mismos métodos no-espaciales y herramientas que cualquier otro tipo de información.
La información espacial, son datos referenciados espacialmente, es decir, con una localización conocida y generalmente representados en mapas. Como se verá de manera somera mas adelante, los datos espaciales, se pueden representar mediante numerosos sistemas de coordenadas de referencia.
La gran utilidad de los datos espaciales, radica, en que los datos (de una magnitud cuantificable) en ubicaciones cercanas tiende a ser similar; esta premisa ya fue recogida por primera vez por el cartógrafo Waldo Tobler en 1970, en lo que es la Primera Ley de la Geografía, que dice que:
"Todo está relacionado con todo lo demás, pero las cosas cercanas están más relacionadas que las cosas lejanas", esta es la base de casi toda la ciencia de los datos y de la estadística que lo soporta. La suposición sobre que los datos espaciales son dependientes o correlacionados espacialmente (1ª ley de la geografía), pero son independientes del número de observaciones, lo cual es una suposición común para muchas técnicas estadísticas, no está satisfecho.
La propiedad que mide el grado en que afecta la cercanía o lejanía de objetos en las relaciones entre ellos se denomina autocorrelación espacial. Poniendo por ejemplo un hecho significativo, que llueva en un lado de la calle, se puede prever con una gran nivel de confianza que está lloviendo al otro lado de la calle, pero habría menos certeza en afirmar que está lloviendo en toda la ciudad y menos aun en que está lloviendo en toda una región.
El análisis espacial es el proceso de examinar localizaciones, atributos y relaciones entre los datos espaciales mediante técnicas analíticas de para abordar una pregunta, por ejemplo: ¿por qué en unas zonas de un país la tasa de abandono escolar es mayor que otras? ¿por qué hay zonas con mayor tasas de robo residencial respecto a otras? Con el análisis espacial se extrae y se crea nueva información.
El proceso de análisis espacial puede ser sencillo como identificar patrones en un mapa, o tan complejo como construir modelos que imiten los procesos del mundo real combinando una serie de herramientas y datos para obtener información derivada.
A modo de resumen en la siguiente tabla se enumeran los tipos de análisis y los tipos de problemas que pretenden resolver:
Tipo de Análisis |
Descripción |
Ejemplos de casos reales |
Proximidad |
|
|
Superposición |
|
|
Redes |
|
|
Estadístico |
|
|
Temporal |
|
|
Entidades de Modelado de la información espacial
Sin entrar en grandes detalles tecnológicos, la información geoespacial está basada en los siguientes tipos de datos:
Datos referenciados por puntos
Datos asociados con un índice espacial que varía continuamente a través del espacio. Por ejemplo datos de rastreo GPS, dispositivos fijos, alta resolución satélites Estos datos a menudo son útiles para la inferencia y predicción del modelo en ubicaciones no muestreadas.
Patrones de puntos
Datos que representan ocurrencias de eventos donde las ubicaciones en si mismas son aleatorias. En este contexto, estos datos son útiles para evaluar la posible agrupación entre las observaciones.
Datos de red
Datos asociados a un conjunto de puntos ordenados, conectados por líneas rectas. Ejemplos incluir datos de redes de movilidad, internet y redes de telefonía móvil. Las aplicaciones típicas incluyen el análisis de redes espaciales y optimización de ruta.
Complejidad de la toma de muestras
Tratar con datos espaciales también significa que necesitamos poder proyectar un esferoide que es la Tierra, en un plano o en una esfera. Para un modelo 3D dado de la Tierra y un origen relativo a su centro (datum), se define una proyección mediante funciones matemáticas apropiadas que mapean las coordenadas de longitud y latitud a coordenadas planas o esféricas.
Estos sistemas de referencia de coordenadas proyectadas puede ser global o regional, y puede tener diferentes características, dependiendo entre otros si preservan mejor las distancias, escalas. Por ejemplo, la proyección de Mercator, que es el proyección de mapa estándar para navegación, conserva formas, mientras que la proyección UTM preserva las medidas del área.
En la ciencia de los datos espaciales, el conocimiento de la referencia de coordenadas es crítico para establecer las unidades de medida, calcular distancias y describir la posición relativa de diferentes regiones.
Aplicaciones de la Información Geoespacial
Como se titula el artículo de Forbes, el uso de GIS o Location Intelligence está solo limitado por la imaginación y si se me permite yo añadiría además que está limitado por el presupuesto.
Son muchas las organizaciones que han descubierto las ventajas competitivas que trae la explotación de la información espacial y no solo a un nivel competitivo o de negocio, sino que el uso de esta tecnología en servicios públicos puede ayudar a la mejorar los servicios que reciben los ciudadanos de las instituciones públicas, en la mejora de las condiciones ambientales y en el control de plagas y enfermedades contagiosas.
Uso en agricultura
-
Cada vez está más extendido el usos de GPS en la agricultura, para ahorrar el uso de fertilizantes, a través del establecimiento en los mapas que utilizan las máquinas fertilizadoras de variables como tipo de suelo, pendiente, condiciones de luz/sombra, existen algoritmos que permiten calcular la cantidad óptima de fertilizante que hay que verter en un área determinada. Así, solo se emplea fertilizante donde realmente es necesario.
Con esto, junto a la precisión de utilizar los datos GPS, no solo se produce un ahorro de costes, sino que también se está mejorando la calidad ambiental del entorno. -
Estudio y análisis en el comportamiento del consumidor: Históricamente este tipo de estudios han sido los que mas han crecido y los que mayor demanda de uso han tenido en el segmento de la ciencia de datos Geoespaciales.
-
Análisis de datos, se trata de analizar la información espacial de localización para encontrar patrones que relacionen a las personas individuales, a los grupos de personas y en entorno en el que viven.
-
Modelo Huff, se basa en el principio que la probabilidad que un consumidor determinado visite y compre en un sitio determinado es una función de la distancia a ese sitio, su atractivo y la distancia y el atractivo de los sitios de la competencia.
-
Comportamiento del consumidor, estableciendo correlaciones, entre variables que a priori pueden parecer impensables, pero que a través de estudios sociológicos se establecen como variables potenciales para decidir oportunidades de venta.
-
Estudio de la ubicación de nuevos centros comerciales a través de la distribución geográfica de datos como, ingresos, población, distancias medias de recorridos, un ejemplo es el caso de Dunkin Donuts y Starbuks. 3. Medicina
-
Como como se iniciaba este apartado, los estudios que se pueden aplicar usando datos geospaciales tienen el único límite la imaginación, existen estudios en algunos países que se ha visto una relación directa más fuerte entre las tasas de deshidratación infantil y el gasto en seguros médicos privados. Esto permite responder a preguntas del tipo, si se reduce la tasa de deshidratación infantil en un % puedo predecir en cuanto disminuiría el gasto en seguros privados.
-
Control de epidemias, Médicos Sin Fronteras, se apoyó en el uso de la información geospacial para delimitar las áreas de acción del virús del ébola, en Sierra Leona, Guínea.
-
Mapa que muestra en tiempo real, los casos reportados por la Organización Mundial de la Salud de los casos positivos en personas del virus del Coronavirús:
https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6
-
Automoción
- Conducción autónoma, a través del procesamiento en tiempo real de la información recibida por los satélites a través de GPS y Lidar. -
Seguridad y criminología
- Análisis criminalísticos, responder a delitos con un enfoque basado en datos y entregar respuestas personalizadas a través del despliegue rápido de personal y recursos. Gestión de la capacidad policial, Patrullaje Mapeo de grupos de robos u otros delitos que asignan más policías en esos lugares utilizando mapas de calor o Getis-Ord General G y patrones de puntos. -
Economía
Economía de la contaminación, evaluar opciones de crecimiento más ecológicas y los costos de la contaminación en algunas zonas del planeta (India p.ej) al comprender el estado actual de la degradación del medio ambiente. Visualización de indicadores económicos para negocios, industria y demografía basados en análisis radial, transmisión y proximidad.