Predicción del desempeño de las técnicas de visualización a partir de métricas sobre los datos
Fecha
2014Autor
Urribarri, Dana Karina
Director
Castro, SilviaPalabras clave
Ciencias de la computación; Métricas de escalabilidad visual; Métricas de Scatterplots; Métricas de árboles; Layout hiperbólico; VisualizaciónMetadatos
Mostrar el registro completo del ítemResumen
El objetivo de una visualización es obtener una representación del conjunto de datos
que ayude al usuario en la correcta interpretación de los mismos y así lograr un acertado
análisis de éstos. Dado el constante crecimiento de los conjuntos de datos en diferentes
y variados campos de la información, la tarea de elegir la técnica más adecuada para
visualizar convenientemente los datos no es sencilla. Además, el resultado del proceso
de visualización depende de todas las decisiones que se hayan tomando a lo largo de
dicho proceso: un usuario inexperto es propenso a tomar decisiones equivocadas afectando
negativamente la visualización obtenida y, a la larga, frustrando su experiencia con la
visualización.
Si bien a la hora de visualizar conjuntos de datos pequeños no hay grandes desafíos,
la situación cambia al intentar visualizar grandes conjuntos de datos: una mala decisión
en cualquier punto del proceso de visualización y el resultado obtenido puede no ser
satisfactorio. Una alternativa para solucionar este problema es guiar al usuario en la
toma de decisiones a lo largo del proceso. Sin embargo, esta tarea no es sencilla: implica
la existencia de herramientas que permitan predecir qué decisión es “más conveniente”
tomar.
Una forma de elegir la decisión más conveniente es basarse en métricas sobre los datos
que describan aspectos claves de la técnica y permitan predecir el resultado final sin
necesidad de aplicar la técnica sobre los datos. The goal of visualization is to achieve a representation of a dataset that helps the user
to interpret them correctly and achieve a proper analysis. Given the constant growing of
datasets in deferent application areas, the task of choosing the more suitable technique to
visualize a dataset is not easy. Besides, the result of the visualization process depends on
every decision made along it: an unskilled user is prone to make incorrect decisions which
affect negatively the final visualization and, eventually, frustrate the user’s experience
with the visualization.
Visualizing small datasets is not a big challenge, but this changes when trying to
visualize big datasets: a wrong decision at any point in the visualization process and the
result might not be satisfactory. A solution to this problem is to guide the user while
making decisions along the process. Nevertheless, this task is not easy: it implies the
existence of tools which allow the prediction of what decision if “more advisable” to
make.
A way to choose the more advisable decision is using metrics over the data which
describe key aspects of the techniques and allow the prediction of the final result without
applying the technique to the dataset.
Colecciones
- Tesis de postgrado [1412]