Manizales, feb. 24 de 2015 - Agencia de Noticias UN- A través del software libre Weka, se pueden determinar nuevas características de análisis en los registros de información que se obtienen en estaciones hidroclimatológicas de monitoreo.
Lizeth Johana González Vergara, estudiante de Administración de Sistemas Informáticos de la U.N. Sede Manizales, indagó sobre cómo es posible, a través de la minería o exploración de datos, analizar y comparar información ya obtenida para entregar nuevas características que sirvan como temas de estudio, en áreas como gestión del riesgo, automatización, ingeniería electrónica, entre otros.
Para ello, utilizó como referencia más de 78.000 datos de almacenamiento de la estación hidroclimatológica de Posgrados, administrada por el Instituto de Estudios Ambientales (IDEA) de la Sede y encargada de ofrecer información sobre el clima.
Los datos allí registrados ofrecen un conocimiento climático de la región, en tiempo real, sin embargo se limitan a informar sobre el estado del clima de Manizales y no amplían su utilidad para describir su comportamiento y de esa manera interpretar y comprender las características que allí se presentan.
Para ofrecer un análisis más selectivo, dentro de las tareas que permite la minería de datos, la estudiante escogió la descripción, que explica el comportamiento individual de los datos para conocer un valor o atributo desconocido.
A partir de esta herramienta, se logró determinar que las variables de humedad relativa y temperatura tienen una similitud en su crecimiento. Este hallazgo suma importancia al monitoreo climático, ya que permite tener una posición de alerta frente a la posible ocurrencia de desastres naturales que pueden ser controlados y evitados según el comportamiento de los datos.
Herramienta Weka
Para llegar a estos resultados, González Vergara utilizó la técnica de agrupamiento (clustering), para hacer un proceso de división de datos en subconjuntos (clúster).
Posteriormente empleó el algoritmo de Kmeans, que se encuentra en el software Weka para analizar variables como precipitación, temperatura y humedad relativa, principalmente.
“Este algoritmo presenta mayor eficiencia y precisión cuando se trabaja con grandes cantidades de datos, además es más rápido y permite comprender mejor la distribución de la información, para observar las características de cada grupo y centrarse en un conjunto particular”, añade.
El proceso investigativo se llevó a cabo al interior del Semillero en Minería de Datos Ambientales, dirigido por el profesor Néstor Darío Duque Méndez.
(Por:Fin/FLPV/dmh/AC)