Cargando…

SeeDB: Efficient Data-Driven Visualization Recommendations to Support Visual Analytics

Data analysts often build visualizations as the first step in their analytical workflow. However, when working with high-dimensional datasets, identifying visualizations that show relevant or desired trends in data can be laborious. We propose SeeDB, a visualization recommendation engine to facilita...

Descripción completa

Detalles Bibliográficos
Autores principales:	Vartak, Manasi, Rahman, Sajjadur, Madden, Samuel, Parameswaran, Aditya, Polyzotis, Neoklis
Formato:	Online Artículo Texto
Lenguaje:	English
Publicado:	2015
Materias:	Article
Acceso en línea:	https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4714568/ https://www.ncbi.nlm.nih.gov/pubmed/26779379

_version_	1782410343520141312
author	Vartak, Manasi Rahman, Sajjadur Madden, Samuel Parameswaran, Aditya Polyzotis, Neoklis
author_facet	Vartak, Manasi Rahman, Sajjadur Madden, Samuel Parameswaran, Aditya Polyzotis, Neoklis
author_sort	Vartak, Manasi
collection	PubMed
description	Data analysts often build visualizations as the first step in their analytical workflow. However, when working with high-dimensional datasets, identifying visualizations that show relevant or desired trends in data can be laborious. We propose SeeDB, a visualization recommendation engine to facilitate fast visual analysis: given a subset of data to be studied, SeeDB intelligently explores the space of visualizations, evaluates promising visualizations for trends, and recommends those it deems most “useful” or “interesting”. The two major obstacles in recommending interesting visualizations are (a) scale: evaluating a large number of candidate visualizations while responding within interactive time scales, and (b) utility: identifying an appropriate metric for assessing interestingness of visualizations. For the former, SeeDB introduces pruning optimizations to quickly identify high-utility visualizations and sharing optimizations to maximize sharing of computation across visualizations. For the latter, as a first step, we adopt a deviation-based metric for visualization utility, while indicating how we may be able to generalize it to other factors influencing utility. We implement SeeDB as a middleware layer that can run on top of any DBMS. Our experiments show that our framework can identify interesting visualizations with high accuracy. Our optimizations lead to multiple orders of magnitude speedup on relational row and column stores and provide recommendations at interactive time scales. Finally, we demonstrate via a user study the effectiveness of our deviation-based utility metric and the value of recommendations in supporting visual analytics.
format	Online Article Text
id	pubmed-4714568
institution	National Center for Biotechnology Information
language	English
publishDate	2015
record_format	MEDLINE/PubMed
spelling	pubmed-47145682016-01-15 SeeDB: Efficient Data-Driven Visualization Recommendations to Support Visual Analytics Vartak, Manasi Rahman, Sajjadur Madden, Samuel Parameswaran, Aditya Polyzotis, Neoklis Proceedings VLDB Endowment Article Data analysts often build visualizations as the first step in their analytical workflow. However, when working with high-dimensional datasets, identifying visualizations that show relevant or desired trends in data can be laborious. We propose SeeDB, a visualization recommendation engine to facilitate fast visual analysis: given a subset of data to be studied, SeeDB intelligently explores the space of visualizations, evaluates promising visualizations for trends, and recommends those it deems most “useful” or “interesting”. The two major obstacles in recommending interesting visualizations are (a) scale: evaluating a large number of candidate visualizations while responding within interactive time scales, and (b) utility: identifying an appropriate metric for assessing interestingness of visualizations. For the former, SeeDB introduces pruning optimizations to quickly identify high-utility visualizations and sharing optimizations to maximize sharing of computation across visualizations. For the latter, as a first step, we adopt a deviation-based metric for visualization utility, while indicating how we may be able to generalize it to other factors influencing utility. We implement SeeDB as a middleware layer that can run on top of any DBMS. Our experiments show that our framework can identify interesting visualizations with high accuracy. Our optimizations lead to multiple orders of magnitude speedup on relational row and column stores and provide recommendations at interactive time scales. Finally, we demonstrate via a user study the effectiveness of our deviation-based utility metric and the value of recommendations in supporting visual analytics. 2015-09 /pmc/articles/PMC4714568/ /pubmed/26779379 Text en This work is licensed under the Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License. To view a copy of this license, visit http://creativecommons.org/licenses/by-nc-nd/3.0/. Obtain permission prior to any use beyond those covered by the license. Contact copyright holder by emailing info@vldb.org. Articles from this volume were invited to present their results at the 42nd International Conference on Very Large Data Bases, September 5th - September 9th 2016, New Delhi, India.
spellingShingle	Article Vartak, Manasi Rahman, Sajjadur Madden, Samuel Parameswaran, Aditya Polyzotis, Neoklis SeeDB: Efficient Data-Driven Visualization Recommendations to Support Visual Analytics
title	SeeDB: Efficient Data-Driven Visualization Recommendations to Support Visual Analytics
title_full	SeeDB: Efficient Data-Driven Visualization Recommendations to Support Visual Analytics
title_fullStr	SeeDB: Efficient Data-Driven Visualization Recommendations to Support Visual Analytics
title_full_unstemmed	SeeDB: Efficient Data-Driven Visualization Recommendations to Support Visual Analytics
title_short	SeeDB: Efficient Data-Driven Visualization Recommendations to Support Visual Analytics
title_sort	seedb: efficient data-driven visualization recommendations to support visual analytics
topic	Article
url	https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4714568/ https://www.ncbi.nlm.nih.gov/pubmed/26779379
work_keys_str_mv	AT vartakmanasi seedbefficientdatadrivenvisualizationrecommendationstosupportvisualanalytics AT rahmansajjadur seedbefficientdatadrivenvisualizationrecommendationstosupportvisualanalytics AT maddensamuel seedbefficientdatadrivenvisualizationrecommendationstosupportvisualanalytics AT parameswaranaditya seedbefficientdatadrivenvisualizationrecommendationstosupportvisualanalytics AT polyzotisneoklis seedbefficientdatadrivenvisualizationrecommendationstosupportvisualanalytics

SeeDB: Efficient Data-Driven Visualization Recommendations to Support Visual Analytics

Ejemplares similares