Искусство визуализации: Искусство визуализации в бизнесе. Как представить сложную информацию простыми образамиPDF
Нейтан Яу. Искусство визуализации в бизнесе
С тех пор, как я перешел из издательского бизнеса в торговую компанию (а было это в 2005 г.), Excel – является моим основным инструментом работы. Конечно, я далек от мысли, что владею им в совершенстве, но всё же думаю, что могу себя назвать экспертом. Так вот, эта книга не об Excel’е… Автор вскользь упоминает о нем, но, скорее, в уничижительном контексте, как о программе для начинающих. Серьезная инфографика и визуализация данных выполняются в других программах. Автор начинает с легкого 10-страничного знакомства с тем, как извлекать данные из Интернета на основе кода, написанного на языке Python.
В умелых руках обилие информации – не проблема, а настоящий кладезь. Ведь интересны не сами цифры, а та информация, которую можно из них извлечь. Люди хотят знать, о чем именно говорят все эти таблицы и графики. Книга покажет, с помощью какого ПО удобнее обрабатывать информацию в каждом из случаев. Рассмотрены примеры визуализации в программах R и Adobe Illustrator, HTML, CSS и JavaScript. Также в книге вы познакомитесь с применением Flash-графики для нужд визуализации, научитесь создавать карты с помощью Python и SVG и анимированные карты в ActionScript и Flash. Книга – реальный учебник для тех, кто никогда не работал в упомянутых программах.
Нейтан Яу. Искусство визуализации в бизнесе. – М.: Манн, Иванов и Фербер, 2013. — 352 с.
Скачать конспект (краткое содержание) в формате Word или pdf
На момент публикации заметки доступна только цифровая версия книги; купить в ЛитРес
Введение. Один из лучших способов исследовать крупную базу данных и попытаться разобраться в ней — это визуализация. Поместите числа в видимое пространство и предоставьте мозгу — своему или ваших читателей — выявить паттерны. В этом деле мы все мастера. Вы сможете разглядеть истории, которые, возможно, никогда бы не увидели, применяя лишь формальные статистические методы. Если вы за всю жизнь не написали ни строчки кода, тогда R — вычислительная среда, которой отдают предпочтение многие статистики, — может показаться вам пугающей. Но после того как вы изучите несколько примеров, вы быстро набьете руку. Вы можете также скачать коды и файлы данных и опробовать работающие демоверсии на сайте издательства и блоге автора (на момент публикации заметки файлы в блоге не доступны).
Глава 1. Как рассказать историю с помощью данных
Великий смысл статистики и визуализации — в том, что они помогают увидеть, что именно стоит за данными. Помните: данные есть отражение реальной жизни. Это не просто груда каких-то чисел. В этой груде содержится множество историй. В полной мере это дошло до меня во время стажировки в газете New York Times. Длилась она всего три летних месяца после второго курса магистратуры, но изменила мой подход к данным навсегда. Я не только научился создавать графику для новостей. Я научился преподносить данные как новость, а вместе с тем узнал многое о дизайне, организации и проверке фактов, а также об их поиске и изучении. Некоторые из лучших диаграмм и графиков New York Times можно посмотреть на здесь.
Когда материалы собраны, подходите к визуализации так, как будто вы собираетесь рассказать историю. Какого рода историю вы хотите поведать? Это будет репортаж? Или рассказ о жизни? Вы хотите убедить людей в необходимости каких-то действий? Чему бы ни была посвящена ваша графика, вам следует всегда искать паттерны и зависимости. В качестве простого примера можно привести данные о подключении к Интернету, взятую из Доклада о мировом прогрессе (рис. 1).
Рис. 1. Подключение к Интернету
Проще и быстрее всего — предоставить компьютерной программе, которая у вас установлена, самой решить, какой диапазон использовать для каждой диаграммы. Однако все диаграммы здесь выстроены на базе одного и того же диапазона, несмотря на то что нет ни одной страны, у которой имелось бы по 95% абонентов с коммутируемым доступом или пользователей широкополосных сетей. Но единый масштаб дает вам возможность легко сравнивать распределения между группами. А потому, когда вам приходится работать с множеством различных наборов данных, постарайтесь думать о них как о группе, а не как об отдельных, никак не связанных между собой массивах. Так вы сможете получить гораздо более интересные результаты.
Сомнительные данные. Пытаясь разглядеть истории, скрывающиеся за вашими данными, стоит всегда подвергать сомнению то, что вы видите. Помните: то, что это — числа, еще не означает, что они верны. Проверка и верификация данных — одна из важнейших, если не самая важная, часть графического дизайна.
Дизайн. При разработке дизайна вам соблюдать несколько основных принципов:
- объясните кодировки,
- дайте осям названия (а также укажите, какая именно шкала применяется в каждом конкретном случае: логарифмическая, дифференциальная, экспоненциальная…),
- укажите источники,
- учитывайте аудиторию (диаграмма, создаваемая для слайда презентации, должна быть простой; вы, конечно, можете включить в нее массу деталей, но их увидят только те, кто сидит в первом ряду; а вот если вы делаете постер, который люди будут пристально разглядывать и изучать, тогда вы можете включить в диаграмму гораздо больше подробностей),
- держите геометрию под контролем.
Распространенная ошибка обычно происходит тогда, когда дизайнеры используют для обозначения величин двухмерные формы, но измеряют их так, как если бы они использовали только одно измерение. На рис. 2а показаны два круга, размер которых задавался по площади. Это правильный подход. На рис. 2б представлена пара кругов, чьи размеры определялись по диаметру. Первый круг диаметром в два раза меньше второго, но по площади он меньше в четыре раза.
Рис. 2. Определение размеров кругов в диаграммах: а) правильный подход, б) неправильный подход
Глава 2. Как обращаться с данными
Вам нужно научиться добывать и перерабатывать данные, и тогда ваши способности в области визуализации существенно возрастут. Получив данные, вам необходимо изучить контекст. Не нужно становиться экспертом в той области, из которой были почерпнуты данные, однако вам следует знать, из какого именно первоисточника они взяты и о чем говорят. Это поможет вам создать более качественную графику и поведать через нее более цельную историю.
При поиске данных, помимо Google, я время от времени обращаюсь и к WolframAlpha, поисковой машине с вычислительными возможностями. Эта поисковая машина может оказаться особенно полезной при поиске базовых статистических данных по разным темам. Данные также можно поискать на сайтах университетов, например, Калифорнийского университета в Лос-Анджелесе (данные, которые кафедра статистики университета использует при выполнении лабораторных работ). Если вас интересует география, обратитесь на Flickr ShapefiLes (здесь вы найдете географические границы), спорт – Basketball Reference (источник исчерпывающих данных и сведений вплоть до прямых репортажей с игр НБА), мир в целом – UNdata (агрегатор данных из разных источников со всего мира), государственные и политические организации США – Data.gov (каталог данных, поставляемых органами правительства). Вы также можете научиться самостоятельно извлекать данные с web-сайтов, например, с помощью кода на языке Python (см. Извлечение данных с web-страниц с помощью кода на языке Python).
Форматы данных. Большинство людей привыкли работать с данными в Excel. И в этом нет ничего плохого, если вы будете делать в данной программе все — от анализа до визуализации. Но если вам понадобится выйти за эти рамки, тогда вам придется ознакомиться и с другими форматами данных: текст с разделителями, объектная нотация JavaScript или расширяемый язык разметки.
Текст с разделителями-запятыми имеет очень широкое применение и читается большинством программ с таблицами, таких как Excel или Google Documents. Электронные таблицы вы также можете экспортировать в виде текста с разделителями.
Объектная нотация JavaScript (JSON) – это один из самых распространенных форматов, который предлагают веб-API. JSON работает с ключевыми словами и значениями и относится к ним как к объектам. Если вы конвертируете данные в формате JSON в значения, разделенные запятыми (CVS), каждый объект станет строчкой. Если вы собираетесь создавать диаграммы и графики для Сети, вы наверняка столкнетесь с этим форматом.
Расширяемый язык разметки (XML) применяют для передачи данных через различные API. Его можно охарактеризовать как формат текстового документа со значениями, заключенными в теги.
Инструменты форматирования. Google Refine (он же OpenRefine) запускается через браузер, а вся обработка данных происходит у вас на компьютере. Когда вы откроете Refine, вы увидите знакомый табличный интерфейс со строчками и столбцами. В нем можете сортировать данные по полям и искать определенные величины. А еще можно относительно быстро находить ошибки.
Опробуйте также Mr. Data Converter, чтобы конвертировать свои таблицы Excel в формат, удобный для размещения в Сети. Скопируйте данные из Excel и вставить их в область ввода в верхней части экрана, а внизу укажите, в каком формате вы хотите получить их (рис. 3).
Рис. 3. Интерфейс Mr. Data Converter
А еще вы можете отформатировать ваши данные с помощью кода (см. Форматирование данных с помощью кода на языке Python).
Глава 3. Выбор инструментов для визуализации данных
Настоящая глава посвящена теме выбора программного обеспечения для визуализации данных. Готовые решения для визуализации – это самый простой вариант, с которого могут начать новички. Некоторые из этих инструментов, такие как Microsoft Excel или Google Documents, предназначены для управления данными и графикой на базисном уровне, в то время как другие сконструированы для более углубленного анализа и визуального исследования.
Google Spreadsheets — это, по сути, облачная версия Microsoft Excel. Однако у Google Spreadsheets есть и некоторые преимущества перед Microsoft Excel. Во-первых, стандартный набор диаграмм, несколько иной (рис. 4).
Рис. 4. Набор диаграмм у Google Spreadsheets богаче, чем в Excel
Many Eyes — это действующий исследовательский проект Лаборатории визуальной коммуникации IBM. Представляет собой онлайн-приложение, дающее возможность загружать свои данные в виде текстового файла с разделителями и изучать этот файл с помощью набора интерактивных инструментов визуализации. В нем есть почти все традиционные типы визуализации, такие как линейный график и диаграмма рассеяния, но, помимо этого, Many Eyes предлагает целый набор различных, более продвинутых и экспериментальных типов визуализации, а также ряд базовых инструментов для составления карт, например, дерево слов или облако слов (рис. 5).
Рис. 5. Текстовое облако из слов Конституции США
В настоящий момент – это пока что самый богатый по возможностям бесплатный набор инструментов для исследования данных.
Программирование. Умение писать программы позволяет вам поступать более гибко и лучше адаптироваться к различным типам данных. Вся классная инфографика создается с помощью специально разработанного кода. Я предпочитаю использовать Python (см., например, Майк МакГрат. Программирование на Python для начинающих). PHP был первым языком, который я выучил, когда начал заниматься созданием программ для Сети. Существует множество PHP-библиотек для построения диаграмм. Самая популярная из них — это библиотека для создания спарклайнов, позволяющая вставлять маленькие, размером со слово, графики в текст или добавлять визуальные компоненты в числовые таблицы (рис. 6; о спарклайнах в Excel см. Спарклайны или микрографики в ячейках Excel).
Рис. 6. Инфографики, созданные с применением графической библиотеки РНР
Processing — это язык программирования с открытым исходным кодом, предназначенный для дизайнеров и художников. Для интерактивных и динамических инфографиков в Сети часто используют Flash и ActionScript. Графику можно создавать и только во Flash, тем более что интерфейс программы работает по принципу перетаскивания (drag and drop), однако ActionScript позволяет лучше контролировать процесс взаимодействия пользователей с интерактивными объектами. Многие приложения написаны целиком на ActionScript без использования среды Flash. Тем не менее код компилируется как Flash-приложение. В последнее время произошел заметный сдвиг в сторону визуализации, которая легко запускается без «посторонней помощи» в браузере через HTML, JavaScript и CSS. Вы можете использовать плагин Sparkline для jQuery, чтобы делать маленькие диаграммы (рис. 7).
Рис. 7. Инфографики, созданные с применением плагина jQuery Sparklines
R — мой излюбленный инструмент для создания инфографики. Большинство статистиков предпочитают работать именно с R.
Существуют также и платные альтернативы, такие как S-plus и SAS, но им тяжело тягаться с бесплатным вариантом и с активным сообществом его сторонников. Когда вы доберетесь до R, не думайте, что увидите интерфейс, где все можно делать мышью. С помощью разных пакетов R доступны практически все виды диаграмм. К сожалению, R мало подходит для интерактивной графики и анимации. Для анализа «сырой» продукт R подходит отлично, но для презентаций и сторителлинга лучше будет немного поработать над эстетикой. Я делаю основу графического объекта в R, а затем редактирую его и совершенствую в каком-нибудь приложении для подготовки макетов документов, например, в Adobe Illustrator.
Любая графика, построенная на статистических данных, которая выглядит как сделанная на заказ или появляется в том или ином крупном издании, скорее всего, на одном из этапов прошла обработку в Adobe Illustrator. Эта программа — отраслевой стандарт. Каждый графический объект, который печатается на страницах New York Times, был или создан, или отредактирован в Illustrator. Inkscape — это бесплатная альтернатива Adobe Illustrator. Также доступно обучающие руководства по Inkscape.
В последние годы объемы географических данных значительно возросли, а вместе с ними увеличилось и количество способов, которыми можно пользоваться для создания карт. Услуги мобильного позиционирования находятся на подъеме, все больше становятся массивы данных с привязанными к ним широтой и долготой. Помимо прочего, карты — невероятно интуитивный способ визуализации данных. Карты Google, Yahoo и Microsoft – самое простое онлайновое решение. Чем лучше вы умеете писать коды, тем большего вы сможете добиться с помощью API для создания карт.
Глава 4. Визуализация паттернов во времени
Столбчатые диаграммы — один из самых популярных типов диаграмм (рис. 8). Всегда начинайте ось значений с нуля, иначе соотношение величин на вашей диаграмме будет отображаться некорректно.
Рис. 8. Структура столбчатой диаграммы
Пример диаграммы для визуализации темпоральных (временных) данных, и работа с ними в R более подробно рассмотрена в отдельной заметке – Создание столбчатой диаграммы в R. В заметке также рассмотрены основы работы в Adobe Illustrator.
Штабельные столбчатые диаграммы помимо временной динамики позволяют анализировать подкатегории (рис. 9). В R для построения такой диаграммы используется функция barplot(), первым аргументом которой должна быть матрица (в обычной столбчатой диаграмме используется та же функция, но аргументом выступает один или два столбца).
Рис. 9. Структура штабельной столбчатой диаграммы
Иногда лучше использовать не столбцы, а точки. Они занимают меньше места и, поскольку нет брусков, более удачно создают ощущение непрерывного потока, переходящего от одной позиции к другой (рис. 10). В R для построения такой диаграммы используется функция plot() с типом type="
p"
("
p"
– points/точки, "
l"
– lines/линии, "
b"
– both, обе).
Рис. 10. Точечная диаграмма, созданная в R и обработанная в Illustrator
Несложную диаграмму можно сразу построить в Adobe Illustrator. Для начала в панели Инструменты выберите Вертикальные полосы. Кликните правой кнопкой мыши на треугольнике в правом нижнем углу пиктограммы и выберите Линейная диаграмма (рис. 11).
Рис. 11. Инструмент Линейная диаграмма в Adobe Illustrator
Откройте CSV-файл world-population.csv в Excel или Google Documents (рис. 12а), скопируйте все строчки за исключением шапки таблицы (то есть ее верхней строки). Вернитесь обратно в Illustrator. Используя инструмент Линейная диаграмма, в новом файле щелкните мышью и перетащите курсор по диагонали, очертив прямоугольную область, примерно равную по размеру тому графику, который вы хотите получить в конечном итоге. Появится таблица. Вставьте в нее данные из буфера памяти (рис. 12б), а затем щелкните по кнопке с галочкой в верхнем правом углу. Вы построили линейный график по умолчанию (рис. 13). Теперь доработайте его, и получите небольшой дизайнерский шедевр (рис. 14).
Рис. 12. Перенос данных через буфер из Excel (а) в Illustrator (б)
Рис. 13. Линейный график по в Illustrator умолчанию
Рис. 14. Изменение численности населения мира за последние пять десятилетий
Один из недостатков стандартного линейного графика состоит в том, что он внушает мысль о стабильном движении от точки А к точке В. Иногда все так и обстоит, как в примере выше. Но в других случаях после длительного времени пребывания в неизменном состоянии вдруг происходит скачок. Так ведут себя тарифы, ставки и т.п. Для такого типа данных существует ступенчатый график (рис. 15). В R для такого типа графиков используется функция plot() с типом type="
s"
Рис. 15. Изменение почтовых ставок
Глава 5. Визуализация пропорций
Временные ряды самым естественным образом группируются по… времени. Данные о пропорциях также группируются, но по категориям, подкатегориям и совокупностям. В случае с пропорциями обычно ищут три параметра: минимум, максимум и распределение в целом. Для демонстрации минимума и максимума вам не нужна диаграмма. Самое интересное — это распределение пропорций. Как соотносится группа людей, сделавшая тот или иной выбор, с остальными? Как распределяются калории между жирами, белками и углеводами — поровну, или одна из этих групп доминирует?
Части целого — это самый простой вид пропорций, а круговые диаграммы — старый испытанный вариант их представления (рис. 16а). Вы можете создать круговую диаграмму сразу же в Illustrator, а можете начать с R с помощью функции pie() (подробнее см. Базовые графические возможности R: круговые диаграммы). У круговой диаграммы есть младшая кузина: кольцевая диаграмма (рис. 16б).
Рис. 16. Интересы посетителей сайта FlowingData: (а) круговая диаграмма, (б) кольцевая диаграмма
Создание кольцевой диаграммы с помощью программы Protovis рассмотрено в отдельной заметке. Protovis — бесплатный инструмент для визуализации с открытым исходным кодом. Protovis — это JavaScript-библиотека, позволяющая использовать возможности современных браузеров для работы с масштабируемой векторной графикой. Поскольку графические объекты генерируются динамически, это дает возможность делать их анимированными и интерактивными. А потому Protovis — отличный выбор для создания онлайн-графики.
В 1990 году Бен Шнайдерман из Университета Мэриленда придумал тримап. Этот способ визуализации основан на областях, при котором размер каждого прямоугольника выражает собой количественный показатель. Внешние прямоугольники представляют родительские категории, а прямоугольники внутри родительских категорий — это своего рода подкатегории. Вы можете использовать тримап для визуализации прямых пропорций, но, чтобы опробовать технологию в полном объеме, ее лучше применять с иерархическими или, точнее, с древовидно структурированными данными (рис. 17). В R тримап можно построить с помощью функции map.market(), содержащейся в пакете Portfolio.
Рис. 17. Тримап, созданный в R и отредактированный в Illustrator
Дополнение от 30 ноября 2016 г. В версии Excel 2016 появилась диаграмма дерево, она же тримап. Подробнее см. Новые диаграммы в Excel 2016
Иногда приходится работать с пропорциями во времени. Такой тип диаграмм можно рассматривать как серию штабельных столбчатых диаграмм, столбцы которых соединены во времени (рис. 18). В Illustrator для этих целей используется Диаграмма с областями (аналог есть и в Excel).
Рис. 18. Штабельная диаграмма с областями, сопровождаемая подписями
Один из недостатков использования штабельных диаграмм с областями состоит в том, что они становятся нечитабельными и бесполезными, если у вас много категорий и много точек данных. В случае с разбивкой на возрастные группы диаграмма работает, так как категорий всего пять. Но если добавлять их еще и еще, ярусы в конце концов начнут выглядеть как узенькие полоски. Ситуация усложняется и тогда, когда у вас есть одна категория с относительно небольшой долей в общей сумме — она легко может затеряться между более внушительными категориями. Однако если сделать штабельную диаграмму с областями интерактивной, это проблема становится решаемой.
Интерактивные штабельные диаграммы с областями сделал популярными Мартин Ваттенберг с его NameVoyager. Данный инструмент используется для визуализации выбора имен для новорожденных во времени. Когда вы вводите имя в окошко поиска, диаграмма автоматически обновляется.
Один из недостатков штабельных диаграмм с областями состоит в том, что в них тяжело разглядеть тенденции в той или иной отдельной группе, потому что местоположение каждой точки зависит от точек, которые ниже нее. А потому иногда бывает лучше представить пропорции как простые временные ряды (рис. 19).
Рис. 19. Линейная диаграмма иногда будет хорошей альтернативой штабельной диаграмме с областями
Глава 6. Визуализация зависимостей
Корреляция — наверное, это первое, о чем вы подумали, когда услышали про поиск зависимостей в данных. Второе — скорее всего, это причинно-следственная связь. А теперь вы наверняка вспомнили мантру о том, что корреляция и причинно-следственная связь — это «две большие разницы». Корреляцию легко выявить и отобразить графически. У ученых на доказательство причинно-следственной связи порой уходят годы. В качестве примера рассмотрим уровень преступности в США по штатам за 2005 год в пересчете на 100 000 человек. Всего мы рассмотрим семь типов преступлений, а начнем с пары: кражи со взломов / убийства (рис. 20).
Рис. 20. Диаграмма рассеяния, сопоставляющая данные по убийствам и по кражам со взломом
Чтобы рассказать полную историю, вы должны понимать данные. Чем больше вы о них будете знать, тем лучше получится история, которую сможете поведать. Вот почему, чтобы получить все возможные парные сравнения, полезно воспользоваться матрицей диаграмм рассеяния (рис. 21).
Рис. 21. Матрица диаграмм рассеяния для сопоставления уровней различных типов преступности; чтобы увеличить изображение кликните на нем правой кнопкой мыши и выберите Открыть картинку в новой вкладке
Преимущество пузырьковой диаграммы состоит в том, что они дают возможность сравнивать три переменные одновременно (рис. 22). Одна переменная располагается на оси Х, другая — на оси Y, а выражением третьей служит размер площади пузырьков (именно площади, а не диаметра; подробнее см. Пузырьковая диаграмма).
Рис. 22. Пузырьковая диаграмма, демонстрирующая уровень преступности в США; аналогична рис. 20, но также добавлено население штатов в качестве третьей величины
Диаграммы распределения
В 1970-х годах, когда компьютеры не были так широко распространены, графики и диаграммы чертились в основном от руки. Часть советов знаменитого статистика Джона Тьюки, которые он давал в своей книге Анализ результатов наблюдений. Разведочный анализ (М.: Мир, 1981) касались использования ручек и карандашей для достижения плотности линий и оттенков. Тогда же возникла и диаграмма типа «стебель с листьями» (или «опора и консоль»). Все, что вам нужно сделать, — это написать числа в определенном порядке, и в результате вы получите общее представление о распределении. Данный метод пользовался особой популярностью в 1980-х годах (когда применение статистических графиков для анализа данных только набирало обороты), потому что включить такой график в документ было легко, даже если текст набирался на печатной машинке (подробнее см. Как упорядочить массив данных). Однако данный метод считается уже устаревшим, так что лучше, наверное, будет воспользоваться гистограммой (рис. 23). По сути, гистограмма является более наглядной версией диаграммы «стебель с листьями».
Рис. 23. Распределение стран по уровню рождаемости
Дополнение от 30 ноября 2016 г. В версии Excel 2016 появилась частотная гистограмма, позволяющая строить такие диаграммы в несколько щелчков. Подробнее см. Новые диаграммы в Excel 2016
Хотя ось значений непрерывная, распределение все равно разбивается на дискретное число столбцов. Каждый столбец представляет собой некую совокупность объектов, в случае с предыдущим примером — совокупность стран. Но что происходит внутри каждого такого деления, каждой «корзины»? На рис. 24 показано использование кривой вместо столбцов. Общая площадь под кривой равняется единице, а вертикальная ось представляет вероятность или пропорцию данного значения в этой самой совокупности.
Рис. 24. Структура графика плотности
Очень часто бывает полезно сравнивать несколько распределений. Это может быть динамика во времени, или по регионам. В Excel для этих целей могут использоваться спарклайны (подробнее см. Спарклайны или микрографики в ячейках Excel). Small multiples впервые использовал Эдвард Тафти для описания множества небольших по размеру, однотипных по структуре, но многовариантных (в плане данных) диаграмм или графиков, которые легко сравнивать. Как и большинство терминов Тафти, small multiples тяжело поддается переводу. На русском встречаются различные варианты: «типовые множества», «маленькие однотипности», «размноженные миниатюры», «мультиграфики» и даже «раскадровки». Вот вам две истории, рассказанные с помощью миниграфиков (рис. 25 и 26; о Тафти см., например, Принцип Эдварда Тафти минимизации количества элементов диаграммы).
Рис. 25. Распределение размеров телевизионных экранов во времени
Рис. 26. Рейтинги трилогий от оригинала до финала
Глава 7. Выявление различий
Эта глава посвящена тому, как обособлять группы в рамках совокупности, причем делать это по большому числу критериев, а также как выявлять выбросы, применяя здравый смысл. Один из самых прямолинейных способов визуализации таблицы данных — показать ее одновременно всю. Но при этом вместо чисел в качестве индикатора значений вы можете использовать цвета. Такое представление называется тепловой картой. [1] Для создания тепловой карты в R используется функция heatmap().
Рис. 27. Тепловая карта, демонстрирующая средние показатели за игру 50 лучших игроков НБА сезона 2008-2009 гг. Более темный цвет соответствует лучшим показателям. Игроки отсортированы по колонке Очки
Для наглядного представления многомерных данных хорошо подходят диаграммы-радары, также известные как паутинные, или лепестковые, диаграммы (а еще их иногда называют диаграммами-звездами; рис. 28). Центр — это минимальное значение каждой из переменных, а конец оси — ее максимум. На одной диаграмме можно представить несколько элементов. Однако в спешке легко напортачить и сделать графику бесполезной, иными словами, плохо рассказать историю. Так что лучше придерживаться принципа «один элемент — одна диаграмма» и сравнивать их между собой. В R для создания таких диаграмм используется функция stars().
Рис. 28. Структура диаграммы-радара
Еще один вид диаграмм для выявления общности и различий – параллельные координаты, изобретенные в 1885 году Морисом д’Оканем (Maurice d’Ocagne). В этом типе графики вы размещаете множество осей параллельно друг другу (рис. 29). Верхушка каждой оси представляет максимальное значение переменной, а ее нижняя точка — минимальное. Для каждого элемента слева направо вычерчивается линия, которая двигается вверх и вниз в зависимости от значений конкретного элемента.
Рис. 29. Диаграмма с параллельными координатами
Следующий метод выделения групп – кластерный анализ, и его разновидность – многомерное шкалирование (подробнее см. Кластерный анализ: сетевые графы и определение сообществ). Представьте себе, что вы находитесь в пустой комнате и что помимо вас в ней есть еще два человека. Ваша задача — определить, где именно им следует располагаться согласно их росту. Чем более они похожи по этому показателю, тем ближе должны стоять, и, соответственно, чем существенней разница в их росте, тем дальше они должны оказаться друг от друга. Но представьте, что у вас не двое, а 50 человек и вам необходимо их расставить по местам в комнате на основе, скажем, пяти критериев. Вот для этого и существует многомерное шкалирование. Если на основании данных о прохождении теста (см. рис. 29) расположить штаты на 2-мерной оси координат, то они сгруппируются в соответствии с полученными баллами (рис. 30).
Рис. 30. Штаты окрашены в соответствии с баллами за анализ текста
Помимо того, как группируются отдельные элементы данных, вас должно интересовать и то, как они не группируются. Иными словами, хорошо бы изучить выбросы. Иногда они могут оказаться самой интересной частью вашей истории, в других случаях — просто досадными опечатками.
Глава 8. Визуализация пространственных отношений
Карты — это форма визуализации, которая обладает дополнительным преимуществом: она невероятно интуитивна. В Сети самый распространенный способ определить на карте некую точку — это воспользоваться Google или Bing Maps. Через их API вы получаете интерактивную карту, которую можете изменять в масштабе и прокручивать с помощью всего нескольких строк JavaScript.
Поскольку исходные данные, как правило, включают перечень адресов, вам придется обратиться к геокодированию для извлечения широты и долготы точек. Если вам необходимо геокодировать несколько адресов, проще всего зайти на соответствующий сайт и ввести адреса вручную. Однако, если вам необходимо геокодировать множество пространственных точек, тогда вам лучше сделать это программными средствами, например, с помощью пакета Geopy языка Python. Хотя функционал R в области маппинга довольно ограничен, тем не менее он существенно облегчает процесс размещения точек на карте. Почти всю работу за вас выполнит пакет maps.
В реальной жизни данные обычно содержат не только координаты неких местоположений. Как правило, к ним привязана и еще какая-нибудь величина, такая как объем продаж компании или население города. В этом случае вы можете наложить на карту пузырьковую диаграмму (рис. 31).
Рис. 31. Данные об уровне подростковой рождаемости
Однако чаще данные соответствуют не точкам, а регионам или странам. А самый распространенный способ нанесения на карту региональных данных — это картограмма. В ней регионы окрашиваются в различные цвета на базе неких количественных показателей и в соответствии с разработанной вами цветовой шкалой (рис. 32).
Рис. 32. Уровень безработицы по округам США
Если вы добавите еще одно измерение данных, вы сможете рассмотреть изменения одновременно и во времени, и в пространстве. В главе 4 вы визуализировали время с помощью линий и графиков, но, когда к подобного рода данным добавляется еще и местоположение, может оказаться, что карты — это более интуитивно понятный способ представить паттерны и изменения. Так бывает легче разглядеть кластеры или группы регионов, которые находятся близко друг к другу в физическом плане. Для этих целей отлично подойдут маленькие панели (рис. 33).
Рис. 33. Уровень безработицы с 2004 по 2009 гг.
Один из наиболее очевидных способов визуализации изменений во времени и пространстве — это анимация данных. Вместо того чтобы показывать отдельные карты для различных срезов времени, вы можете продемонстрировать изменения в динамике на одной-единственной интерактивной карте. Несколько лет назад я разработал карту, показывающую распространение магазинов сети Walmart на территории Соединенных Штатов (подробнее см. Сэм Уолтон. Сделано в Америке. Как я создал Wal-Mart).
Глава 9. Прицельный дизайн
Когда вы занимаетесь самостоятельным изучением данных, вам не нужно думать о сторителлинге. В конце концов, вы и есть автор истории. Однако в тот момент, когда вы решите использовать эти данные, чтобы донести некую информацию до других голой диаграммы окажется уже недостаточно.
Для начала, чтобы рассказать хорошую историю с данными, вам необходимо знать их источник. Именно этот начальный процесс сбора данных и делает графику New York Times настолько качественной. Сбор и приведение данных в порядок — процедура намного более трудоемкая, нежели собственно создание графики.
Ваша работа в качестве дизайнера инфографики состоит в донесении того, что вы знаете, до вашей аудитории, которая, скорее всего, данных не знает, а потому, если не получит каких-нибудь объяснений или установок, может и не разглядеть в графике то, что видите вы. Вам не нужно писать целые эссе, чтобы сопровождать ими каждую вашу работу, но заголовок и кое-какие пояснения во вводном абзаце всегда бывают полезны. Не принимайте по умолчанию, что ваши читатели в курсе всего или что они и сами разберутся в вашей графике. Такого не будет, особенно в Сети, где все привыкли, чуть что, сразу щелкать по следующей ссылке и переходить далее.
В главе 1 вы увидели, как работает кодировка. По сути, у вас есть данные, и вы кодируете их с помощью геометрии, цвета или анимации. А затем читатели декодируют эти фигуры, цвета и движения, представляя себе их снова в виде чисел. Это и есть основа визуализации. Кодирование означает перевод на визуальный язык. Декодирование помогает взглянуть на данные под другим углом и разглядеть паттерны, которые вы бы не заметили, если б смотрели на таблицу.
На примерах, приведенных выше, вы могли убедиться, что хороший дизайн работает не только на эстетику. Он делает графику более понятной и способен менять отношение читателей к данным или к истории, которую вы пытаетесь им рассказать. Графики, создаваемые в R или Excel с настройками по умолчанию, смотрятся сыровато и похожи на штамповку. В инфографике выбор цвета играет важную роль. Цвет способен вызывать (или не вызывать) эмоции, он помогает доносить информацию. И это ваша ответственность — выбрать цвета, которые правильно передадут ваше послание. Цвета должны соответствовать истории, которую вы пытаетесь рассказать.
По теме см. также
Левин. Статистика для менеджеров с использованием Microsoft Excel
Идеи Байеса для менеджеров
Как с помощью диаграммы приукрасить действительность? или о факторе лжи Эдварда Тафти
Дарелл Хафф. Как лгать при помощи статистики.
[1] Любопытно, что я использовал тепловую карту, еще не зная ее названия, при анализе частоты обращения к ячейкам хранения на складе; см. Совершенствование складской логистики на основе методов менеджмента качества, рис. 11.
РЕЦЕНЗИЯ: «Искусство визуализации в бизнесе» — настольная книга для профессионалов в области инфографики и презентаций
Впервые с необходимостью строить графики и диаграммы не от руки, а при помощи Excel или Access я столкнулся в вузе курсе на третьем, когда началась статистика и макроэкономика. Работа с данными с тех пор за 9 лет шагнула вперед, – но качественных красивых диаграмм, информационных схем и «пай-чартов» больше не стало. Даже отечественные СМИ далеко не всегда используют визуальное представление цифр и фактов на ТВ и в интернете. Хотя именно зрительную информацию люди воспринимают лучше и быстрее всего. Книга, которая сегодня лежит на моем столе, – не просто констатация этого факта, а профессиональный учебник для тех, кто «столбики» и «лесенки» рисует каждый день и этим зарабатывает себе на жизнь.
Нейтан Яу
Занимается написанием статей и созданием различной графики для тематического контент-проекта FlowingData (посвящен визуализации данных, статистическим массивам и дизайну). Получил степень магистра, защитил кандидатскую диссертацию о визуализации персональных данных. Также написал книгу Data Points: Visualization That Means Something («Точки ввода данных: визуализация, которая имеет смысл»). С его экспериментами в области визуального представления информации можно познакомиться на страницах flowingdata.com
Первое впечатление от книгиБерешь в руки – и понимаешь, что перед тобой не просто подарочный альбом красивых инфографик, а солидный учебник. На самом деле, студентам и технических, и гуманитарных вузов такая книга была бы полезнее скучных лекций о построении диаграмм. Наглядные примеры, алгоритмы и пошаговые инструкции здесь разбиты по разделам в зависимости от того, какие данные и в каком виде вы хотите показать своей аудитории.
Самое полезноеСобственно, читать можно не всю книгу от начала до конца, а лишь ту главу или подраздел, которые нужны вам в данный момент для подготовки материалов к вашей презентации, выступлению на конференцию или просто для обсуждения идей с коллегами.
И тогда вы вряд ли снова будете городить презентации с «простынями текста».
Читая эту книгу, понимаешь, что много информации не бывает: бывает неправильная ее интерпретация. Ведь важно не просто набросать гору цифр. Важно показать, о чем конкретно говорят все созданные вами таблицы и графики.
Нейтан Яу объясняет, где можно найти нужны вам данные, как их форматировать, переработать и подготовить к правильной визуализации, а также какое ПО стоит использовать для этих целей.
Есть здесь и практические примеры визуализации данных при помощи R и Adobe Illustrator, HTML, CSS и JavaScript. Для самых хардкорных маркетологов и аналитиков есть даже уроки по созданию интерактивных карт на основе Python, SVG, ActionScript и Flash.
Кому читатьМаркетологам – чтобы понимать, как влияют правильные диаграммы и схемы на ваших клиентов и пользователей. А также чтобы делать красивые презентации.
Стартаперам – чтобы делать красивые презентации не просто ради презентаций, но и ради представления смысла (финансового и менеджерского) в удобоваримой форме. А также, чтобы покорять инвесторов.
Журналистам – если вы работаете в сфере журналистских расследований и журналистики данных, то прочтение этой книги вам обязательно.
Дизайнерам – думаю, излишне объяснять, зачем дизайнерам пригодится книга по визуализации данных, да еще и с набором уроков.
«Искусство визуализации в бизнесе. Как представить сложную информацию простыми образами», Нейтан Яу
Купить на litres.ru Купить на amazon
Книга Нейтана Яу ‘Искусство визуализации в бизнесе. Как представить сложную информацию простыми образами’
Книг по R на русском языке становится все больше, что не может не радовать. Совсем недавно издательством «Манн, Иванов и Фербер» была опубликована работа Нейтана Яу (Nathan Yau) «Искусство визуализации в бизнесе. Как представить сложную информацию простыми образами» (оригинальное название книги «Visualize This: The FlowingData Guide to Design, Visualization, and Statistics«). Нейтан является автором FlowingData — одного из наиболее популярных англоязычных блогов, посвященных визуализации данных. В своей новой книге Нейтан делится приемами создания инфографики, которая позволяет раскрыть порой неочевидные свойства анализируемых данных и рассказать на их основе интересную историю. Следует оговориться, что R — не единственный инструмент для обработки и визуализации данных, обсуждаемый в книге. Наряду с описанием выполнения определенных задач при помощи R, приводится много примеров кода Python, а также рассматриваются Javascript (JSON), XML, Adobe Illustrator, др. Книга включает 9 глав, краткое содержание которых приведено ниже.Глава 1. Как рассказать историю с помощью данных
Будучи вещью объективной, данные имеют человеческое измерение. Это значит, что за грудой цифр и слов часто скрываются истории о реальном мире, и задача статистики и визуализации состоит в том, чтобы помочь эти истории рассказать. На что обращать внимание в данных при подготовке таких историй? Как выбрать подходящее средство визуализации? Каковы обязательные элементы статистической диаграммы? Как учесть аудиторию, которой предназначен конечный результат визуализации? Эти вопросы обсуждаются в первой главе книги.
Глава 2. Как обращаться с данными
Прежде чем приступить к визуализации данных, их необходимо сначала получить. Более того, данные очень редко поступают в готовом к работе виде, и поэтому обычно значительную часто всего процесса визуализации занимает приведение данных к необходимому формату и их очистка. Во второй главе книги описываются открытые источники данных и программные средства их получения и подготовки к анализу. В частности, подробно обсуждается пример скрипта на языке Python, с помощью которого извлекаются исторические ряды наблюдений с одного из сайтов, посвященных прогнозу погоды. Далее читатель знакомится с распространенными форматами хранения (текст с разделителями, JSON, XML) и инструментами форматирования данных (Google Refine (сейчас проект называется OpenRefine), Mr. Data Converter, Mr. People, Python).Глава 3. Выбор инструментов для визуализации данных
Существует огромное разнообразие программ, позволяющих визуализировать данных. В этой главе обсуждается программное обеспечение, на которое стоит обратить особое внимание, включая R, Python, Flash и ActionScript, Tableau Software, Many Eyes, Google Maps, Modest Maps, Polymaps, HTML, CSS, Adobe Illustrator, Inkscape, и др.Глава 4. Визуализация паттернов во времени
Как следует из ее названия, эта глава посвящена обсуждению вопросов, связанных с визуализацией временных рядов. Приводятся пошаговые примеры создания заготовок диаграмм в R и их последующего доведения до конечного результата в Adobe Illustrator.
Глава 5. Визуализация пропорций
Как соотносится группа людей, сделавшая тот или иной выбор, с остальными? Как распределяются калории между жирами, белками и углеводами — поровну, или одна из этих групп доминирует? В пятой главе обсуждаются приемы визуализации пропорций, которые помогут ответить на подобные вопросы. Приводится подробный пример создания круговой диаграммы при помощи замечательного инструмента — Protovis (JavaScript-библиотека, позволяющая использовать возможности современных браузеров для работы с масштабируемой векторной графикой (Scalable Vector Graphics, SVG)). Кроме того, приведен подробный пример создания диаграммы типа «treemap» при помощи R и функции map.market() из пакета portfolio.Глава 6. Визуализация зависимостей
Данная глава посвящена приемам визуализации корреляционных связей между количественными переменными. Обсуждаются такие типы статистических графиков, как диаграммы рассеяния и матрицы диаграмм рассеяния, диаграммы рассеяния в сочетании с линиями тренда, пузырьковые диаграммы, матрицы гистограмм. Для создания всех этих типов диаграмм используется R.
Глава 7. Выявление различий
Глава 8. Визуализация пространственных отношений
Нейтан Яу известен как автор многих красивых карт, отражающих пространственное распределение и динамику разных явлений. В восьмой главе своей книги Нейтан описывает основы создания инфографики этого типа средствами Python, R и ActionScript.
Глава 9. Прицельный дизайн
Дизайн графиков определяет то, насколько легко будет их понять и интерпретировать заложенную в них историю. В этой заключительной главе книги описываются приемы, которые помогут сделать визуализацию данных максимально понятной и информативной.
Книга понравилась мне своей логичностью в изложении материала — автор начинает с обсуждения того, зачем мы вообще пытаемся визуализировать данные, после чего переходит к способам получения и подготовки данных к работе, и далее — к рассмотрению основных приемов визуализации. Все главы содержат большое количество примеров с использованием разнообразных программ, что дает хороший обзор доступных инструментов и делает книгу полезным сборником практических советов и готовых рецептов. Кроме того, Нейтан постоянно подчеркивает необходимость овладения несколькими программными средствами анализа и визуализации данных. Нельзя не согласиться с ним, что навыки работы с несколькими такими инструментами помогают экономить время и делают нас свободнее в выборе средств и способов достижения задуманного.
Правда, как мне кажется, у книги есть и один небольшой недостаток, который связан, как ни странно, именно с попыткой автора дать обзор многих программных инструментов одновременно. Для успешного освоения излагаемого таким образом материала читатель должен будет уже иметь определенные навыки работы с обсуждаемыми инструментами, иначе он может легко потеряться в строках кода R, Python, ActionScript и др. Соответственно, эта книга вряд ли может стать вводной для тех, кто не знаком ни с одним языком программирования и только приступает к знакомству с областью визуализации данных. С другой стороны, тем, кто уже имеет опыт работы в этой области, при чтении некоторых частей книги может стать скучно от констатации очевидного.
Есть также мелкие нарекания к переводу с английского. Например, встречаются такие неудачные фразы, как «генерализация примера» (стр. 54) вместо «обобщения примера», «маппинг» (от «mapping») вместо «картирования» (с. 95), «диаграмма-радар» вместо достаточно общепринятого термина «лепестковая диаграмма» (с. 249), и т.п.
Тем не менее, несмотря не некоторые мелкие недочеты (а какая работа их лишена?!), книгу «Искусство визуализации в бизнесе» однозначно можно порекомендовать тем читателям, кто интересуется анализом и визуализацией данных и хочет больше узнать о соответствующем программном обеспечении.
Искусство визуализации или просто возьми свое
Искусство визуализацииВнутричерепной космос работает очень просто: сначала создается мысль, а потом она приобретает форму. Или другими словами, мы притягиваем в свою жизнь все, о чем думаем, чего искренне и очень сильно, до глубины души, желаем, или то, что очень ярко обрисовываем ментально.
Когда мы часто думаем о проблемах, трудностях и опасности, то мы притягиваем к себе именно те ситуации, которые хотели бы избежать.
А когда думаем о радости, об удовольствии и любви, то притягиваем те ситуации, которые соответствуют нашим ожиданиям. То есть, чем чаще наша мысль о желаемом будет подкрепляться положительной энергией, тем чаще оно будет встречаться в жизни.
Подготовительный этап
Многим людям трудно сразу начать рисовать яркие ментальные картины своего будущего. Поэтому, я предлагаю начать с простых, подготовительных упражнений и немного развить свое умение визуализировать:
1. Лимон-арбуз.
Займите удобное положение, закройте глаза и расслабьтесь. Начните представлять себе лимон. Рассматривайте его со всех сторон. Представьте его ярко желтым. Затем разрежьте пополам и визуализируйте уже две половинки. Смотрите внимательней, может там видно косточки? Попробуйте ощутить вкус лимона. Открывайте глаза.
Потом, то же самое проделайте с арбузом.
2. Лицо.
Займите удобное положение, закройте глаза и расслабьтесь.
Начните визуализировать лицо близкого друга или любое другое лицо, которое вам хорошо известно. Постарайтесь увидеть все особенности этого лица. Если получается плохо, то откройте глаза и посмотрите на лицо, которое вы визуализировали, продолжайте работу.
3. Тихое место.
Займите удобное положение, закройте глаза и расслабьтесь.
Представьте себе, тихое и уютное место, где вы уже бывали или хотели бы быть. То место, где вы себя чувствуете расслабленно и спокойно. Например, это может быть берег реки, лес и т.п.
Постарайтесь услышать звуки, которые вас окружают.
Выполняйте каждое упражнение 2-3 раза в день по несколько минут. Продолжительность 7 дней.
Мастер визуализации
Основное упражнение:
Для начала вам необходимо поставить цель, подумайте о том, чего бы вам хотелось больше всего достичь. Или наоборот, поставьте для начала небольшую цель.
Далее, займите удобное положение, закройте глаза. Начните считать в обратном порядке от 20 до 1. Во время счета представьте, как расслабляется все ваше тело, начиная с головы и заканчивая пальцами ног. Вообразите, как все напряжение просто исчезает.
Когда вы дойдете до единицы и полностью расслабитесь, то начинаете представлять ярко и максимально точно то, что вы желаете.
Например, если это машина, то представьте, что вы ей уже пользуетесь. Постарайтесь увидеть, какая она внутри и какая снаружи. Вообразите, что вы показываете ее друзьям и послушайте, что они говорят про вас и ваше приобретение.
Дополняйте ваш образ любыми деталями, которые помогут сделать ментальную картинку более яркой и реальной. И главное – наслаждайтесь.
Полезные советы:
Работать с визуализацией эффективней всего в расслабленном состоянии, то есть на альфа-уровне. Именно обратный отсчет, с которого я советую начинать любую визуализацию, приводит к глубокому, замедленному состоянию – альфа-уровню (полусонное состояние). На этом уровне оба полушария работают совместно, и вы можете легко запрограммировать свой ментальный компьютер.
Завершайте визуализацию обычным счетом от 1 до 10. На цифре 7 скажите себе, что когда откроете глаза, то будете чувствовать себя бодро и прекрасно. На цифре 10 откройте глаза и повторите: я чувствую себя бодро и прекрасно. Это поможет вам выйти на привычный бета-уровень (бодрое и активное состояние).
Когда научитесь глубокому расслаблению и созидательной визуализации, то сможете эффективней изменять свою жизнь. Кстати, когда вы расслабляетесь на альфа-уровне, то вы становитесь более здоровым. Действуйте.
Узнать больше о созидательной визуализации вы можете здесь и здесь.
Мои страницы в социальных сетях
Искусство визуализации бренда
Кто такие визуализаторы бренда?
Сегодня, наверное, каждый предприниматель слышал о том, что нужно развивать свой личный бренд в «Инстаграме». Конечно, оформлять страницу можно и самостоятельно, но, когда самому справиться трудно — не хватает времени или опыта, например, выручает визуализатор. Он помогает в короткий срок выстроить личный бренд и сразу начать транслировать его в социальных сетях.
В чем видите свою профессиональную миссию?
В том, чтобы помогать экспертам и предпринимателям развиваться, достигать своих целей. А цели у всех разные — стать увереннее в себе, успешнее, повысить эффективность рекламы в соцсетях и с помощью нее привлечь инвестора или продюсера в свой проект.
SMM-специалист и визуализатор бренда: в чем различия?
Визуализация бренда в «Инстаграме» — один из инструментов SMM-специалиста, позволяющий экономить бюджет на продвижение за счет большей эффективности рекламы грамотно оформленной страницы. При этом SMM-щики часто сотрудничают с фотографами, стилистами и визажистами — или визуализаторами бренда в одном лице.
Из каких этапов состоит ваша работа?
У меня есть онлайн- и офлайн-услуги. В первом случае я составляю имиджбук, то есть провожу онлайн-консультацию, где детально прорабатываю стиль и имидж, роли в «Инстаграме», ДНК бренда и информационное заявление. Составляю стратегический план на развитие цифрового тела и усиление личного бренда. Разбираю профиль и даю рекомендации по его улучшению. Затем подбираю референсы и собираю тактическую мудборд-раскладку с примерами фотографий, отображающих проект заказчика, подходящими локациями, идеями, позами, стилем. В результате клиент получает качественную книгу с почерком личного бренда и начинает транслировать себя с выгодных сторон, становится успешнее и счастливее. (Улыбается.)
Офлайн-услуги — это стилизация имиджевой съемки, подбор гардероба, шопинг-сопровождение и сама фотосессия. Также делаю мудборд, состоящий из примеров фотографий, в котором отражается информационное заявление и цветовое решение аккаунта, продумываю образы, подбираю подходящие места, прописываю маршрут; в день съемки делаю профессиональный макияж и укладку. Сама фотосессия занимает от трех до шести часов — в зависимости от задач и расположения локаций. Затем я отбираю готовые фотографии и формирую гармоничную инстаграм-ленту. Делаю цветокоррекцию и ретушь всех снимков, и через два-три дня клиенты получают тридцать уникальных разноплановых фото, которые отражают их личный бренд.
Кому рекомендованы услуги визуализатора бренда?
Если вы чувствуете, что вам это нужно, значит, вам это точно нужно. (Улыбается.)
Какие навыки обязательны в этой профессии?
Очень пригодится база знаний по стилю, имиджу, личному бренду, фотографии, макияжу и укладкам. Но все навыки нужно обязательно оттачивать на практике. Изначально я была визажистом и мастером по прическам, параллельно проходила обучение на стилиста-имиджмейкера и SMM-специалиста. Очень помогло участие во всевозможных марафонах.
Работа подразумевает свободный график?
Да, ты сам регулируешь свою профессиональную деятельность. Я вот совмещаю работу с материнством — у нас две дочки, которые требуют много внимания. (Улыбается.)
Где можно отучиться на визуализатора?
Есть несколько онлайн-школ. Важно изучить все и найти именно своего преподавателя. Официально профессия визуализатора бренда появилась чуть больше года назад и стремительно развивается благодаря высокому спросу на услуги. Качественный контент сегодня не роскошь, а необходимость и признак уважения к своим клиентам и подписчикам!
Блог про HR-аналитику: Искусство визуализации в бизнесе
Глава Визуализация из книги Искусство визуализации в бизнесе Нейтана Яу издательства Манн, Иванов и Фербер.Читаю сам и рекомендую специалистам высокого уровня. Однозначно буду использовать решения в своем семинаре Аналитика для HR
Купить книгу Искусство визуализации в бизнесе в Лабиринте>> 860 р.
Озоне>> 902 р.
Визуализация
Один из лучших способов исследовать крупную базу данных и попытаться разобраться в ней — это визуализация. Поместите числа в видимое пространство и предоставьте мозгу — своему или ваших читателей — выявить паттерны. В этом деле мы все мастера. Вы сможете разглядеть истории, которые, возможно, никогда бы не увидели, применяя лишь формальные статистические методы.Джон Тьюки (John Tukey), мой любимый статистик и отец разведочного анализа данных, разбирался в статистических методах и свойствах, как мало кто другой, и верил, что графические методы также имеют законное право на существование. Он был глубоко убежден, что картинки способны открывать нам неожиданное. Вы можете очень многое узнать из данных, просто визуализируя их, а в ряде случаев это и есть все, что вам нужно сделать, чтобы принять информированное решение или рассказать историю.
Например, в 2009 году в Соединенных Штатах произошел значительный рост уровня безработицы. В 2007 году он составлял в среднем 4,6 процента, в 2008 году поднялся до 5,8 процента, а к сентябрю 2009 года дошел уже до 9,8 процента. Однако такие средние по стране величины способны поведать лишь часть истории. Это обобщенные данные по США в целом. Но, может, были какие-то регионы, в которых уровень безработицы оказался выше, чем в других местах? Может, были регионы, которые эта беда вообще обошла стороной?
Карты, представленные на рис. 0.1, рассказывают более полную версию этой истории, вам достаточно лишь взглянуть на них — и вы сможете ответить на вопросы из предыдущего абзаца. Округа, окрашенные в более темный цвет, — это области, в которых уровень безработицы был сравнительно высоким, в то время как в округах, окрашенных светлым, ее уровень оказался относительно низким. В 2009 году вы уже видите множество регионов на западе, где уровень безработицы стал выше 10 процентов. Такая же ситуация сложилась и в большинстве регионов на востоке. А вот регионы Среднего Запада пострадали не так сильно (см. рис. 0.2).
Рис. 0.1. Карты, демонстрирующие уровень безработицы в США с 2004 по 2009 гг.
Рис. 0.2. Карта, демонстрирующая уровень безработицы в 2009 г.
Вы бы не смогли выявить эти географические и временные закономерности так быстро, если бы перед вами была только сводная таблица, и уж точно не сумели бы это сделать, располагая лишь средними по стране величинами. И хотя при наличии данных на уровне округов картина становится более сложной, большинство людей тем не менее способны интерпретировать эти карты. Такие карты помогают политикам решать, куда направлять финансовую помощь или другие формы поддержки.
А самое замечательное — то, что все данные, использованные для создания представленных выше карт, абсолютно бесплатны и доступны широкой общественности на сайте Бюро трудовой статистики. И хотя «нарыть» их было не то чтобы очень просто с такой устаревшей системой представления данных, как у них, так или иначе все тамошние цифры в вашем распоряжении: они сидят и ждут, чтобы кто-нибудь их малость обработал визуально.
«Статистический ежегодник Соединенных Штатов», например, существует в виде сотен таблиц данных (рис. 0.3), но в нем нет ни одного графика.
Это неплохая возможность представить всеобъемлющую картину страны. Вот уж действительно интересная штука. Некоторое время назад я перевел часть таблиц в диаграммы просто так, ради идеи. На рис. 0.4 вы можете увидеть динамику браков и разводов, почтовых тарифов, потребления электроэнергии и кое-чего еще. В первом варианте, то есть в таблице, разобраться в данных непросто, и все, что у вас получится извлечь из них, — это отдельные величины. А вот в графическом варианте вы легко можете заметить тенденции и паттерны и с одного взгляда провести сравнение.
Такие поставщики новостей, как New York Times и Washington Post, прекрасно справляются с задачей делать данные более доступными и наглядными. Они, наверное, лучше многих других пользуются всей этой открытой информацией, каждый день рассказывая читателям все новые и новые истории.
Иногда графики с данными применяются для обогащения истории иной точкой зрения, а в других случаях графики, собственно, и излагают всю историю.
С развитием онлайн-медиа диаграммы и графики получили еще большее распространение. Сегодня в новостных компаниях существуют специальные службы, которые занимаются только интерактивами, или только диаграммами, или только картами. У New York Times, например, есть даже отдел новостей, созданный исключительно для работы с тем, что они называют «компьютеризированными репортажами».
Тамошние журналисты специализируются на новостях с цифрами. И отделу графики в New York Times не привыкать к работе с огромными массивами данных.
Визуализация пробилась также в попкультуру. Фирма Stamen Design, занимающаяся визуализацией и широко известная своими онлайн-интерактивами, в последние несколько лет готовила для ежегодной церемонии вручения премий MTV Video Music Awards трекеры твитов.
Рис. 0.4. Графический вид данных из «Статистического ежегодника Соединенных
Штатов»
Каждый год Stamen делала что-то новое, но суть была одна: показать, о чем говорят люди в Twitter
в реальном времени. Когда в 2009 году во время речи получившей награду Тейлор Свифт (Taylor Swift) произошла известная неприятность с Канье Уэстом (Kanye West)*, через трекер можно было сразу увидеть, что люди об этом думают.
На данном этапе вы подходите к визуализации не столько аналитически, сколько на уровне ощущений. Определение визуализации кажется несколько туманным. На протяжении длительного времени визуализация была чем-то связанным с количественными показателями. От вас требуется своими инструментами выявлять паттерны, а от паттернов — каким-то образом помогать вам в процессе анализа. Визуализация — это не просто получение объективных голых фактов.
Как и в случае с трекером Stamen, она почти всегда связана в первую очередь с фактором
развлечения. Это способ дать зрителям возможность смотреть шоу с присуждением призов и в процессе взаимодействовать с остальными людьми. Другим прекрасным тому примером может служить творчество Джонатана Харриса (Jonathan Harris). Харрис выстраивает свои работы, такие как «Все у нас хорошо» и «Охота на китов», скорее, вокруг историй, нежели вокруг аналитических прозрений, и эти истории базируются на человеческих эмоциях, вызванных цифрами и аналитикой.
Схемы и диаграммы также переросли состояние просто инструментов и служат теперь средствами коммуницирования идей — они способны даже на шутки. Такие сайты, как GraphJam и Indexed, используют диаграммы Венна, секторные диаграммы и пр. для того, чтобы представлять популярные песни или показывать, что комбинирование
Рис. 0.5. Цитаты из кинофильмов в графической форме
я публикую на FlowingData, — это моя собственная «проба пера» в данном жанре. Каждый день я веду наблюдения и выкладываю их в форме диаграмм. На рис. 0.5 таким образом
проиллюстрированы цитаты из известных фильмов, вошедших в рейтинги Американского
института киноискусства. Получилось нечто абсолютно нелепое, но забавное (по крайней мере, для меня).
Итак, что же такое визуализация? Ну, все зависит от того, с кем вы разговариваете.
Некоторые люди утверждают, что визуализация — это традиционные схемы и графики. Другие
придерживаются более либеральных взглядов. Для них все, что способно иллюстрировать
данные, и есть визуализация, и не имеет значения, что это: произведение data-арта или таблица в Microsoft Excel. Я лично больше склоняюсь к последним, хотя, бывает, иногда обнаруживаю себя среди членов первой группы. В конце концов, все это не так уж и важно. Просто делайте то, что подходит для ваших целей.
На каком бы определении визуализации вы ни остановились, когда вы станете создавать
диаграммы для своей презентации, анализировать большой массив цифровой информации
или готовить новостной репортаж, содержащий некие данные, вы в конечном счете будете
искать правды. В какой-то момент ложь и статистика стали почти синонимами, но на самом
деле лгут не числа. Лгут люди, использующие числа. Иногда они делают это намеренно,
реализуя какой-то план, но в большинстве случаев подобное происходит неумышленно. Когда
вы не знаете, как правильно составить диаграмму или как подать данные беспристрастно, есть
большая вероятность, что у вас появится некая информационная свалка, дающая совершенно
искривленное представление о реальности. Однако если вы усвоите годные приемы
визуализации и научитесь работать с данными, вы сможете уверенно излагать свои идеи
и радоваться своим открытиям.
Купить книгу Искусство визуализации в бизнесе в Лабиринте>> 860 р.
Озоне>> 902 р.
Искусство визуализации. Дентальная и художественная фотография
Согласие на обработку персональных данных Настоящим в соответствии с Федеральным законом № 152-ФЗ «О персональных данных» от 27.07.2006 года свободно, своей волей и в своем интересе выражаю свое безусловное согласие на обработку моих персональных данных , зарегистрированным в соответствии с законодательством РФ по адресу: (далее по тексту — Оператор). Персональные данные — любая информация, относящаяся к определенному или определяемому на основании такой информации физическому лицу. Настоящее Согласие выдано мною на обработку следующих персональных данных: — Ф.И.О.; — E-Mail; — Телефон; — Индекс; — Город; — Улица; — Дом; — Квартира; — Название компании; — Юридический адрес; — ИНН; — КПП; — Контактное лицо; — E-Mail; — Телефон; — Факс; — Индекс; — Местоположение; — Файл с реквизитами; — Ф.И.О.; — E-Mail; — Телефон; — Адрес доставки; — Название компании; — Юридический адрес; — Контактное лицо; — E-Mail; — Телефон; — Факс; — Адрес доставки; — Файл с реквизитами. Согласие дано Оператору для совершения следующих действий с моими персональными данными с использованием средств автоматизации и/или без использования таких средств: сбор, систематизация, накопление, хранение, уточнение (обновление, изменение), использование, обезличивание, а также осуществление любых иных действий, предусмотренных действующим законодательством РФ как неавтоматизированными, так и автоматизированными способами. Данное согласие дается Оператору для обработки моих персональных данных в следующих целях: — предоставление мне услуг/работ; — направление в мой адрес уведомлений, касающихся предоставляемых услуг/работ; — подготовка и направление ответов на мои запросы; — направление в мой адрес информации, в том числе рекламной, о мероприятиях/товарах/услугах/работах Оператора. Настоящее согласие действует до момента его отзыва путем направления соответствующего уведомления на электронный адрес [email protected]. В случае отзыва мною согласия на обработку персональных данных Оператор вправе продолжить обработку персональных данных без моего согласия при наличии оснований, указанных в пунктах 2 – 11 части 1 статьи 6, части 2 статьи 10 и части 2 статьи 11 Федерального закона №152-ФЗ «О персональных данных» от 27.06.2006 г.
Принимаю Не принимаю
25 лучших визуализаций данных 2020 года [Примеры]
Делать информацию красивой — это искусство. Здесь, в Visme, мы большие поклонники того, что постоянно создают художники по данным. От журналистики данных до дата-арта и науки о данных между ними.
Надеемся, вам понравятся выбранные нами примеры. Некоторые из них являются победителями премии Kantar Information is Beautiful, а другие идут другим путем. Не все лучшие визуализации данных получают награды.
Пожалуйста, поймите, что изображения, которые мы здесь приводим, — это лишь беглый взгляд на то, что на самом деле предлагают проекты.Предлагаем вам перейти по интересующим вас ссылкам, чтобы увидеть проекты во всей красе.
Без лишних слов, вот наша коллекция лучших визуализаций данных за 2020 год. Наслаждайтесь!
Лучшие визуализации данных 2020 года1 Codex Atlanticus
Визуальное агентство
Первые данные в нашей коллекции — это Атлантический кодекс. Visual Agency, группа по визуализации данных из Италии, собрала прекрасную цифровую библиотеку журналов и записных книжек Леонардо да Винчи.На сегодняшний день это самая большая цифровая коллекция его работ.
Но это еще не все — все устроено так, что удивит как поклонников визуализации данных, так и художников.
Codex Atlanticus выиграл премию Gold Kantar Information is Beautiful 2019 года в категории Искусство и развлечения. Для любителей истории и Леонардо да Винчи эта цифровая библиотека является богатым ресурсом для обучения и исследований.
Для поклонников визуализации данных эта библиотека является прекрасным примером того, как красиво оцифровать историю, и неудивительно, почему она входит в наш список лучших визуализаций данных.
2 Где светятся дикие твари
Джонни Уокер
Визуализация информации о природе обычно приводит к красивому решению. Эта визуализация о том, как и где присутствует биолюминесценция на юго-восточном побережье Австралии, является прекрасным примером.
«Там, где растут дикие животные» — это визуализация в виде таблицы, созданная для National Geographic Джонни Уокером. Биолюминесценция визуализируется в виде блестящих фигур на спутниковом снимке местности.Легенда и информация организованы вокруг карты и очень легко читаются.
3 Атлас лун
По National Geographic
Еще одна потрясающая визуализация данных, опубликованная National Geographic в 2019 году, — это Атлас лун. Это прокручиваемая цифровая визуализация, которая отправит вас в путешествие по космосу. Все данные касаются спутников в нашей солнечной системе, начиная с нашей собственной луны.
Визуализация не только красивая, но и познавательная, и ценная.Каждая луна пригодна для навигации, как и их орбиты и индивидуальная информация. Это одна из лучших визуализаций данных о космосе.
4 Взгляд на отчаяние
Автор: Sonja Kuijpers
Не многие люди могут создавать красивые вещи с неудачными данными и информацией. Это особенно эффективно, когда у художника по данным есть личная история и причина, по которой они визуализировали.
«Взгляд отчаяния» — это красивая визуализация Сони Куиджперс.В нем рассказывается история всех людей, покинувших Нидерланды в 2017 году. Каждый природный символ представляет, как была потеряна жизнь, а также размер, обозначающий возраст.
Иногда лучшая визуализация данных — это та, которая рассказывает личную, интересную историю.
5 Утопление в пластике
По Рейтер Графика
Люди привыкли пить воду из пластиковых бутылок. Это превратилось в огромную проблему с мусором. Эта визуализация показывает груды пластиковых бутылок по отношению к известным достопримечательностям и городским пейзажам.
«Утопление в пластике» — это визуализация от Reuters Graphics, которая отлично демонстрирует, как мы покрываем землю пластиком.
Вы можете увидеть больше экологических данных, а именно в нашем обзоре лучших визуализаций данных об изменении климата.
6 Опыт стены данных Starbucks
От Accurat
Не каждое кафе Starbucks имеет честь сказать, что оно является домом для отмеченной наградами визуализации данных. Первый обжарочный магазин Starbucks Reserve в Милане нанял группу опытных художников по визуализации данных из агентства Accurat.
Эта визуализация данных представляет собой интерактивную стену с дополненной реальностью, которая показывает историю Starbucks в виде сетки из различных слоев данных.
Стена была создана в 2018 году, но в 2019 году получила награду Gold Kantar is Beautiful в категории необычные. Вы можете увидеть стену в действии на сайте Accurat, но, конечно, лучше увидеть ее лично.
7 Как одеваться для космоса
Газета The Washington Post
За 50 лет освоения космоса и космических полетов космонавты использовали разные костюмы во время своих путешествий.Эта визуализация данных в The Washington Post показывает подробные 3D-визуализации пяти космических скафандров, от первых скафандров, покрытых ртутью, до цельного скафандра SpaceX.
Исследование включает в себя содержательный диалог между репортером космической отрасли и модным критиком. Мысли можно читать по мере изучения каждого костюма. Эту визуализацию лучше всего исследовать с некоторым терпением и любопытством.
8 Многообразие английских крикетных стадионов
BBC Sports
Google Maps и любители крикета объединились, чтобы создать визуализацию данных о форме стадионов для крикета в Англии.В основе исследования лежит то, что не все стадионы круглые, а скорее совокупность неровных форм.
Каждый стадион визуализируется сначала спутниковым изображением из Google Maps, а затем графикой с данными о длине и ширине поля и подробным изображением формы. Многообразие стадионов для игры в крикет в Англии — это визуализация для издания BBC Sports.
9 Символикон
Автор Michela Graziani
Визуализация данных и информационный дизайн — это работа, на выполнение которой уходит много времени.Обычно это также требует большой самоотдачи. Это верно для многих примеров данных в этом списке, но особенно запомнился Symbolikon.
Визуализация данных Symbolikon, созданная Микелой Грациани, представляет собой большую коллекцию художественно обработанных символов разных культур и времен. В нем более 700 символов в более чем 28 категориях, и он продолжает расти.
Каждый символ оцифрован в трех стилях; PNG, JPG и SVG. Коллекция доступна для продажи дизайнерам, которые могут делать с ней то, что они хотят.
10 Космический мусор
Автор: Федерика Фрагапане
Художник по данным Федерика Фрагапане получила заказ от BBC для создания визуализации данных о космическом мусоре. Наборы данных разделены на разные категории; расстояние от Земли, типы космического мусора, а также размер и масса объектов.
Что примечательно в лучших средствах визуализации данных Federica Fragapane, так это их внимание к деталям и окраске данных. Этот, в частности, отличный пример ее стиля и того, как он развивается.
11 прыжков в космос
Бюро Оберхаузера
Как мы убедились за годы составления этого обзора, космос является общим источником вдохновения для многих художников по данным. Календарь Bureau Oberhauser Leaps in Space 2020 — отличный тому пример.
Дизайнерское агентство Oberhauser создало эту визуализацию, чтобы показать данные о заметной и запоминающейся космической деятельности, которая произойдет в 2020 году, а также некоторые исторические события. Визуализация доступна в виде обоев рабочего стола или телефона или даже в виде плаката.
12 Если в зимнюю ночь путешественник
Автор Hanna Piotrowska
В 1979 году итальянский писатель Итало Кальвино написал концептуальную книгу о чтении книги. Это уже давно культовая книга для писателей, читателей и художников-концептуалистов. В 2019 году художник по визуализации данных Ханна Пиотровска взяла на себя задачу использовать книгу в качестве проекта визуализации данных.
В результате получился красиво напечатанный исходный текст плюс двойная книга с набором визуализаций данных.Наборы данных включают слова, фразы и сюжетные дуги. Графики красивы, и на них приятно смотреть.
13 ЛГБТ: не защищены законом
Автор: Gabrielle Merite
Графический дизайнер и художник по визуализации данных Габриэль Мерит взяла на себя задачу создать визуализацию данных о том, как ЛГБТ-сообщество не защищено определенными законами в Соединенных Штатах.
Каждый кружок представляет состояние, а части диаграммы представляют разные вещи, от которых они нуждаются в защите.Этим типом визуализации стоит поделиться, чтобы показать, насколько незащищено ЛГБТ-сообщество во многих штатах страны.
14 Грамматика данных
By Juillet Juillet
Данные о данных не всегда бывает скучно. Грамматика данных, например, доставляет удовольствие. Он не был обнаружен крупными изданиями и еще не получил никаких наград, но это не значит, что он не достоин этого списка.
Data Grammar — прекрасный глоссарий диаграмм для визуализации данных.Цвета вдохновляют, а включение черно-белых изображений с концептуальной маркировкой завершает дизайн.
15 Джорджия Lupi Data Fashion
Грузия Лупи
Джорджия Лупи известна своим художественным взглядом на данные. Ее творения всегда очень подробны и полны художественной ценности. Неудивительно, что ее дата-арт всегда попадает в наши обзоры. В коллекции этого года у нас есть ее совместная лаборатория моды с Other Stories.
Основная идея этой модной визуализации заключалась в прославлении трех женщин-ученых.В эскизах Джорджии использовались данные из известных проектов каждой женщины для создания многоразовой графики, которая затем была напечатана на ткани ручной работы.
Одежда продается в специальной сумке, в которой объясняются данные и идеи.
16 красивых новостей ежедневно
По информации прекрасна
У Дэвида МакКэндлесса, создателя премии Kantar Information is Beautiful Awards, в этом году есть отличный новый проект. За год Дэвид и его команда собрали более 300 наборов данных в разных категориях и создали визуализации о них.
Beautiful News Daily публикует новую визуализацию каждый день и будет делать это в течение года. Команда Information is Beautiful какое-то время была громким именем в мире данных, и неудивительно, что Beautiful News Daily — замечательный проект, за которым стоит следить по мере его роста.
17 Мировые товары
от DailyFX
Визуализации вращающегося глобуса обычно очень приятно смотреть. Иногда они также полны данных, которые всплывают разного цвета.Так обстоит дело с визуализацией данных о мировых товарах.
Данные об импорте и экспорте по всему миру за последние десять лет. Визуализация является интерактивной по типам товаров, годам и местоположениям.
18 Строительные надежды
От Accurat
Визуализация данных The Building Hopes — это визуализация на основе AR, которая исследует надежды людей на жизнь в целом. Проект можно просмотреть на компьютере, но лучше всего загрузить приложение на мобильное устройство.
Когда вы открываете приложение, вас просят пройтись по ближайшему окружению, выбирая надежды и выбирая, насколько вы надеетесь на каждую из них. Каждая надежда представлена цветным камнем, и они собраны во вращающуюся скульптуру.
Когда скульптура будет готова, вы можете изучить свои данные и сравнить их с Google Trends в вашем регионе. Затем вы также можете обнаружить другие скульптуры данных, созданные людьми в той же местности.
19 Маркет Кафе Mag
У Маркет Кафе Маг
Эти данные также были в нашей коллекции в прошлом году, потому что это ежегодное мероприятие.Market Cafe Mag — единственный журнал о данных, который только что получил награду Gold Kantar Information is Beautiful.
Номер 5 этого года озаглавлен «Активизм в Data Viz» и включает работы Сони Куиджперс, The Pudding, Пола Баттона и других.
Получив награду, они переиздают 1-й выпуск, который поступит в продажу в 2020 году. Маркет Кафе Mag — один из тех, за которыми следует следить, поскольку мы считаем, что от них можно будет получить только больше и лучше.
20 Почему кошки и собаки?
Надие Бремер
Надие Бремер добавляет в свои визуализации особый творческий стиль.В этом году она работала над проектом в сотрудничестве с Google Trends. Он называется «Почему кошки и собаки?» и, как вы можете догадаться, все дело в кошках и собаках.
Данные взяты из тенденций Google и того, что люди ищут о кошках и собаках. Визуализация доступна для изучения и напрямую связана с поиском Google, к которому она применяется. Это вид визуализации данных, который может развлекать вас часами.
21 миграционная волна
По National Geographic
Награда Kantar Information is Beautiful принесла нам еще одну выдающуюся визуализацию данных от National Geographic.Волны миграции — это визуализация данных за 50 лет миграции. В печатной версии показаны некоторые страны, но полная визуализация доступна на веб-сайте National Geographic.
Черно-белые волны на желтом фоне создают прекрасное визуальное представление данных. Интересно посмотреть, в какие страны уезжает больше людей, а в каких — заново.
22 Год, когда Гонконг доминировал в заголовках новостей
Утренняя почта Южного Китая
The South China Morning Post известна своим творческим подходом к журналистике данных.Их инфографика и визуализация данных всегда интересны и полны ценности. Команда журналистов данных полна отличных идей и пользуется постоянным признанием.
В этот обзор мы включили их собственные данные, а именно сводку всей инфографики и визуализации данных, которые они опубликовали за год по таким темам, как Brexit, торговая война между США и Китаем и многое другое.
23 10 лет спустя
По Рейтер Графика
Хотя эта визуализация данных была опубликована ближе к концу 2018 года, в 2019 году она получила награду Kantar Information is Beautiful в категории «Политика и глобальность».
Данные для этой визуализации — все о том, как все изменилось после финансового кризиса 2008 года. Каждый из пяти журналистов Reuters рассмотрел конкретный аспект кризиса и создал комплексные данные, а именно диаграммы, видеообращения и множество аналитических материалов.
24 Комната перемен
Грузия Лупи
Данные как искусство — это другая крайность спектра данных, а именно журналистика данных на другой стороне. Не каждый может превратить данные в искусство, но Джорджия Лупи снова попадает в этот список с потрясающим проектом визуализации данных.
Этот проект визуализации данных был частью XXII Международной выставки La Triennale di Milano в 2019 году. Цель выставки — показать, как окружающая среда изменилась за эти годы. Наборы данных разделены на категории, и каждая категория имеет свою собственную абстрактную иллюстрацию для отображения данных.
Визуализация информации — это тип визуализации данных, используемый в музеях, общественных местах и на транспорте. Комната перемен — это хорошее сочетание всех стилей визуализации данных.
25 Год в деталях
Экономист
В прошлом году, в 2018 году, печатная версия журнала The Economist открыла новый раздел своей серии «Графические детали». Графическая серия — это раздел журналистики данных, который полюбился читателям, особенно энтузиастам визуализации данных.
В этом году команда объединила все публикации серии Graphic Series в один большой загружаемый PDF-файл.
Создание собственных визуализаций данных
Вот и все, что нужно для визуализации данных в этом году! Вы нашли новых фаворитов? Каждый год мы заново открываем для себя наших любимых художников данных через их новые проекты и открываем новые.
Если вы заинтересованы в создании собственных визуализаций данных, перейдите к простому в использовании конструктору графиков Visme. Он поставляется с множеством инструментов визуализации данных, включая бесплатные шаблоны, анимированные и интерактивные графики, виджеты данных и многое другое.
Создайте бесплатную учетную запись на Visme сегодня и начните создавать лучшие визуализации данных, которые когда-либо видел ваш веб-сайт.
Кроме того, вы можете посмотреть это видео, чтобы лучше понять, как использовать визуализацию данных для улучшения бизнес-отчетов и презентаций.
Мыслить и видеть в картинках: искусство визуализации
Моя задача, которую я пытаюсь достичь, заключается в том, чтобы силой письменного слова заставить вас слышать, заставить вас чувствовать — прежде всего, заставить вас видеть. Это — и не более того, и это все.
— Джозеф Конрад
Большинство писателей, которых я знаю, обладают удивительными словесными навыками. Они стали писателями, потому что полюбили читать книги.Но, как предполагает Джозеф Конрад, писатели в равной степени являются визуальными художниками. Раскрашиваем картинки словами. На мой взгляд, визуальные навыки, необходимые писателям, прискорбно игнорируются. Главный из этих навыков — навык визуализации.
Настоящая работа писателя — вызвать образ — богатую и обширную картину мира, написанную на странице. И для этого писатель должен сначала уметь визуализировать эту картинку. И, как и видеть себя, визуализация — это дисциплинированный навык.Это требует практики и осторожных, осознанных усилий, а это нелегко.
Я получил образование художника-оформителя, а художники-визуалисты много смотрят, прежде чем что-то заметят. Мы внимательно смотрим на каждый аспект наших субъектов, постоянно оценивая и переоценивая то, что мы видим.
Причина всех этих поисков не в том, чтобы точно отобразить то, что там есть. «Искусство — это не то, что вы видите, а то, что вы заставляете видеть других», — сказал однажды Дега. Так что я буду выбирать, извлекая важные детали и отбрасывая лишние.Затем я буду преувеличивать, манипулировать и организовывать их так, чтобы они объединились и пролили новый свет.
Когда я пишу, я делаю то же самое. Как и многие писатели, я могу часами сидеть за компьютером и визуализировать. Если у кухонной раковины стоит женщина, я представляю в воображении всю кухню. Цвета, тона, качество света, кухонные шкафы, скатерть, пол линолеума, размер и форма кухонного стола — все это бросается в глаза. И если эта женщина поднимает тряпку с края раковины, я вижу, как она это делает.Я представляю ее руки; ее ногти могли быть ухоженными, или она могла их укусить. Разница очевидна.
Когда она оборачивается, я представляю, как движется ее тело. Устало или бодро, или какое-то сочетание между ними; в ее движениях есть доля правды о ее жизни. Я буду замечать каждую мелочь: ее туфли, ее одежду, тряпку, изношенную или нет. И я мог бы видеть, как она поднимает эту тряпку десятки раз, прежде чем я все исправлю.
Как сценограф, я меняю освещение и переставляю мебель.Я буду трудиться внутри этой простой сцены, извлекая и просеивая ее исходный материал столько, сколько потребуется, пока детали не соберутся вместе и не создадут то значение, которое я ищу.
Если это хороший день для письма, визуализация дается легко, и я восхищаюсь тем, что вижу. Если нет, то я вспоминаю упражнение в начальной школе «Как приготовить бутерброд с арахисовым маслом и желе».
В этом упражнении ученики просят учителя намазать хлеб арахисовым маслом. Когда учитель просто ставит неоткрытую банку на закрытый пакет с хлебом, возникает шум.Урок здесь состоит в том, чтобы с научной точки зрения разбить вещи на четкие и краткие инструкции и рассмотреть каждый шаг в надлежащем порядке. Это простая задача, но сложнее, чем кажется.
Последовательная визуализация действий по порядку заставляет вас замедляться. Это побуждает вас видеть не только то, что ваш персонаж открывает упаковку с хлебом, но и то, как он это делает. Они аккуратно раскручивают завязку и откладывают ее в сторону? Или они держат его за конец и бьют по сумке? То, как человек открывает пачку хлеба, может многое сказать о них.
Визуализация, способность видеть и мыслить образами, в значительной степени является функцией правого полушария мозга. Умственная обработка в этом полушарии происходит целостно и одновременно. Эти навыки обработки — вторая натура для художника. С другой стороны, языковые навыки находятся в ведении более методичного левого полушария.
Визуализация сама по себе является сложной задачей, но у писателей есть дополнительная дополнительная задача вербализации того, что они видят, и эту одновременную визуализацию / вербализацию выполнить чрезвычайно сложно.
Рассмотрим то, что называется эффектом Струпа: когда название цвета («синий», «зеленый» или «красный») печатается цветом, не совпадающим со словом, время нашей реакции сильно замедляется. Когда требуется как словесная, так и визуальная обработка, наша способность делать и то, и другое резко ухудшается. По крайней мере частично, поэтому писать так сложно. Но это того стоит.
Если вы потратите время на визуализацию и проработку деталей, как это делает художник, в следующий раз, когда ваш персонаж куда-то пойдет, вы будете менее склонны просто рассказывать нам об этом, и с большей вероятностью покажете нам, как это сделать.И в этом, по словам Джозефа Конрада, все.
Визуализация в искусстве: как выглядит идея? Учебник
Как только идея переводится на визуальный язык, художник создает материальный объект, воплощающий идею художника. Часто это начинается с выбора художественной среды, наиболее соответствующей идее. Художественные медиа включают рисунок, живопись, эстамп, фотографию, скульптуру, инсталляцию, книги художников, перформанс, видео или фильмы, цифровое искусство и интерактивные интернет-сайты.Произведение искусства также может представлять собой комбинацию различных медиа, называемых мультимедийными, или даже комбинацию различных дисциплин, таких как музыка, театр или танец.
Много идей — один средний
Некоторые художники работают исключительно в одной среде, выражая в ней множество идей.
Пабло Пикассо: Живопись
Пабло Пикассо (испанский, 1881–1973) был вундеркиндом, часами проводил в музее, рисовал работы мастеров-художников, точно воспроизводя картины с точностью до деталей.Он был плодовитым художником, часто создавая произведения искусства за один день. Он провел свою долгую жизнь, преследуя свои идеи, исследуя и экспериментируя с ними, никогда не оставляя их в покое. Это очевидно из множества различных периодов, которые он пережил в своем творчестве. Хотя Пикассо работал в других медиа (рисунок, гравюра и скульптура), он использовал живопись как средство радикального развития своих идей — много раз — на протяжении всей своей жизни.
Сидящий Арлекин 1901 холст, масло 32 3/4 x 24 1/8 в Метрополитен-музее Мистер.и миссис Джон Л. Лоеб Гифт, 1960
Портрет Даниэля-Генри Канвейлера Холст, масло 45 5/8 x 45 5/8
Институт искусств Чикаго Подарок г-жи Гилберт В. Чепмен памяти Чарльза Б. Гудспида, 1948 г.
Девушка перед зеркалом 1932 Холст, масло 64 x 51 1/4 «Музей современного искусства, Нью-Йорк Подарок миссис.Саймон Гуггенхайм. © 2011 Поместье Пабло Пикассо / Общество прав художников (ARS), Нью-Йорк
Официальный сайт Пабло Пикассо
http://www.picasso.fr/us/picasso_page_index.php
Каждый хочет разбираться в живописи. Почему они не пытаются понять пение птиц? Почему они любят ночь, цветок, все, что окружает человека, не пытаясь их понять? Что касается живописи, они хотят понять.Пусть прежде всего поймут, что художник работает по необходимости; что он тоже крошечный элемент мира, которому следует приписывать не большее значение, чем многие вещи в природе, которые очаровывают нас, но которые мы сами себе не объясняем. Те, кто пытается объяснить картину, большую часть времени ошибаются. Обрадованная Гертруда Стайн сказала мне некоторое время назад, что наконец поняла, что представляет собой моя фотография: трех музыкантов. Это был натюрморт!
— Пабло Пикассо (1)
Одна идея, много средств массовой информации
Другие художники реализуют центральную идею через множество различных средств массовой информации.
Яёи Кусама (японский, 1929-)
Яёи Кусама была столь же одержима, как Пикассо, в изучении своих идей и активно воплощала их в различных медиа, включая живопись, рисунок, коллаж, перформанс, скульптуру, инсталляцию, искусство окружающей среды и как автор.
Концепции повторения, паттерна и бесконечности, а также психического ландшафта — общие элементы в ее работах. Кусама откровенно обсуждает, как акт созидания стал оружием в ее борьбе с психическими заболеваниями.
Самоуничтожение точками 1968
Перформанс, задокументированный фотографиями Хэла Рейфа
Яёи Кусама, Сети серия 1997-98 холст, акрил
Зеркальная комната (Тыква) 1991
Зеркала, дерево, бумага маше, краска 200см х 200см х 200 см.
Коллекция, Музей Хара, Токио
Яёи Кусама «Восхождение в горошек на деревьях » на Сингапурской биеннале 2006 года на Орчард-роуд, Сингапур.Фото любезно предоставлено wikipedia.com Сенгканг, август 2006 г.
Официальный сайт Яёи Кусамы:
http://www.yayoi-kusama.jp/
Вот кто я!
Однажды, глядя на скатерть с красным цветочным узором …
Я посмотрел в потолок и увидел все тот же красный цветочный узор
везде, даже на оконных стеклах и столбах.
Комната, мое тело, вся вселенная была заполнена им,
я был устранен, а я вернулся и уменьшился
к бесконечности вечного времени и абсолюту пространства…
Я твердо верю, что творческая философия искусства в конечном итоге рождается в уединенной медитации и поднимается от покоя умершей души до блеска и трепета в великолепии пяти цветов.
— Яёи Кусама (2)
Процесс работы. Путем проб и ошибок вы сможете найти наиболее эффективный для вас процесс работы. Это индивидуальная вещь, которая сильно различается от художника к художнику.Одна из радостей работы художником — это знать, что вы можете творить любым способом, который вы выберете — нет правильных или неправильных способов воображать, разрабатывать или производить искусство — только способы, которые работают для ты .
Дизайн визуализации данных и искусство изображения реальности
В рамках продолжающейся серии выставок с библиотекой дизайна карточек Hyundai в Сеуле, Корея, старший куратор MoMA Паола Антонелли организовала три капсульные выставки, которые подчеркивают новые рубежи в современном дизайне и поощряют международный диалог.Вторая выставка, Data Visualization, открылась в Сеуле в июле 2015 года и недавно завершилась. Мы живем в эпоху, когда нас засыпают данными, собранными датчиками, упорядоченными с помощью программного обеспечения и рассредоточенными через постоянно расширяющиеся сети. Визуализировать эти данные — значит понять их. Как показали проекты на этой выставке, дизайнеры и ученые создают диаграммы, трехмерные карты и другую графику, чтобы помочь нам разобраться в огромном количестве информации, с которой мы сталкиваемся ежедневно.Обмен между Нью-Йорком и Сеулом углубился во время личных визитов в Корею, где Антонелли встретился с дизайнерами, чтобы обсудить их текущие работы. Здесь один из этих дизайнеров, Сей Мин, размышляет об особых обстоятельствах проектирования визуализации данных в Корее. —Мишель Миллар Фишер, помощник куратора, Департамент архитектуры и дизайна
Как создать цифровой реализм в сетевой среде?
В изобразительном искусстве реализм часто означает художественное представление реальности такой, какая она есть, акт мимесиса.По сравнению с романтизмом, который подчеркивает субъективный опыт и эмоции, реализм фокусируется на фактах и обычной жизни. В XIX веке реалисты изображали фигуры и сцены такими, какими они были — или могли быть пережиты — в повседневной жизни. Они часто участвовали в общественных движениях через свои картины. Например, Гюстав Курбе (1819–1877) изобразил на своих картинах жизнь рабочего класса. В цифровую эпоху, которую мы определим как «жизнь со смартфонами», как реализм был принят в сетевой среде? Помогают ли новые технологии продолжать художественные замыслы, достижения и эстетику реализма? Если да, то как?
Данные могут быть средством цифрового реализма.Истории просмотра веб-страниц показывают недавние интересы. Службы обмена мгновенными сообщениями хранят ваши личные разговоры в виде неструктурированных данных. Использование кредитной карты показывает, что вы едите и регулярно покупаете. Цифровые данные, собранные из нашей повседневной жизни, могут описывать, отображать и представлять факты и правду о нас самих и нашем окружении. Цифровые данные позволяют нам отображать не только то, что мы видим, но и то, что не видим.
Гюстав Курбе. Камнедробители. 1849
Импорт / экспорт стрелкового оружия: интерактивная визуализация санкционированных правительством поставок стрелкового оружия и боеприпасов с 1992 по 2010 год.Идея Google (2012). (chromeexperiments.com)
Данные как визуальные?
Данные состоят из фактов, которые можно анализировать или использовать для получения информации. Человечество писало тексты, числа и рисовало в пещерах, на предметах и бумаге, чтобы записать свою жизнь, восходящую к древней истории. В настоящее время мы оставляем свой след и историю с цифровыми устройствами, а интеллектуальные датчики иногда делают это автоматически, без нашего разрешения. По данным IDC (International Data Corporation), к 2020 году объем данных, которые мы создаем и копируем ежегодно, достигнет 44 зеттабайт, или 44 триллиона гигабайт.Как видите, объем данных стремительно растет.
Персональные данные о местоположении, собираемые с помощью смартфонов. Он может сказать, где я был, как долго я останавливался и сколько раз бывал. (randomwalks.org)
Визуализация данных изображает мир без эмоциональной интерпретации или субъективных рамок (по крайней мере, так кажется на первый взгляд). Он призван позволить зрителю ощутить ясное и рациональное представление. Системы сбора и обмена данными, такие как открытый API, общедоступные данные, носимые устройства и видеоаналитика, позволяют нам погрузиться в реальный мир с точки зрения глобальных перспектив.
Metrogram: трехмерная интерактивная карта токийского метро в реальном времени от Хироши Кои (chromeexperiments.com)
Необработанный мир, визуализация данных
Просмотр данных часто доставляет неприятные ощущения — реальности не всегда легко смотреть прямо в глаза. Человеческая память и понимание не всегда точны, и большинство наших воспоминаний можно расширять, искажать и раскрашивать так, как мы хотим запомнить. Но цифровые данные в определенной степени чисты. На поверхностном уровне в мире данных нет никаких фантазий или иллюзий.
Визуализация данных интересна тем, что мы можем иметь разные точки зрения на одних и тех же точных данных: хорошие результаты, неожиданные взгляды, уже известные вещи, вещи, которых раньше не видели, необычные темы и находить общие проблемы. Например, Stamen Design выделяет закономерности, основанные на данных в своем проекте «Cabspotting», данные о трафике такси в городе рассказывают нам о ежедневных маршрутах горожан, произошедших авариях и особых событиях, происходящих в городе, посредством ритмов передачи данных. .Недавно Комиссия по такси и лимузинам Нью-Йорка опубликовала информацию об 1,1 миллиарда отдельных поездок на такси в городе с января 2009 по июнь 2015 года. Этот набор данных показывает загруженность дорог в час пик, горячие точки ночной жизни Нью-Йорка и многое другое. Мы можем перемещаться по этим данным, чтобы находить красоту и ценность с разных точек зрения. Перефразируя точку зрения художников-реалистов, красота не только существует в высоком статусе, но может быть везде во многих других формах, включая необработанные и обработанные наборы данных.
Данные о расходах Сеула — Что Сеул сделал сегодня: ежедневные мероприятия и суммы Сеула по случайным прогулкам
Искусство и информация, визуализация данных в Корее
Визуализация данных в Корее еще не достигла полного расцвета. Движение открытых данных и информационный дизайн относительно активны, но в Корее опубликовано не так много работ по визуализации данных. Возможно, одна из причин — контроль. Информационный дизайн в форме инфографики передает намерения и сообщения непосредственно зрителям в понятной форме.Роль зрителя — это потребитель, а не производитель. Однако визуализация данных требует, чтобы зрители были производителями информации, формируя данные в соответствии с их собственным пониманием, опытом и интерпретациями.
Несколько известных корейских дизайнерских студий, таких как Vice Versa Design, Neuro Associates и Infographics 203, специализируются на информационном дизайне, в котором особенно используются правительственные и отраслевые рыночные данные. Их клиенты и эксперты рынка сначала собирают данные, а затем применяют проекты для лучшего понимания.
Бизнес-планы и бюджеты Good Neighbour на 2014 год от Vice Versa
Карта сравнения цен на продукты в Сеуле от Neuro Associates
Корейский проект современной истории Infographics 203 превратил сложные исторические проблемы Южной Кореи в понятную графику.
Современная история Кореи по инфографике 203
Журналистика также использует визуализацию данных в попытке добиться полной объективности. The New York Times и The Guardian используют журналистику данных и интерактивные новости для предоставления своим читателям объективных отчетов.В Корее то же самое делают YTN и KyungHyang News .
Карта новостей в реальном времени, опубликованная YTN
История корейских политических партий, опубликованная Kyunghyang News
Некоторые корейские художники и создатели экспериментируют, чтобы проверить влияние визуализации данных на социальные действия. Случайные прогулки и Оптическая гонка занимают промежуточное положение между искусством, дизайном и информацией. Они делятся своими установками, онлайн-сервисами и распечатками, чтобы люди могли воспринимать данные визуально и физически.Они создают экспериментальное искусство вне медиа, но всегда с данными.
Данные могут быть наглядными: мобильный трафик Южной Кореи с 2010 по 2012 год из случайных блужданий
Валюта данных: гибридная вязальная машина, работающая на основе поисковых операций в Интернете из случайных блужданий
Семейство вероятностей: предполагаемый дом по финансовому статусу от Optical Race
Одна вещь, которую мы должны помнить при визуализации данных, заключается в том, что предубеждений невозможно полностью избежать, независимо от того, насколько чистым было исходное намерение.Данные, как и исторический архив, всегда частичны и зависят от решений, которые определяют их сбор. Художники и дизайнеры данных представляют данные, чтобы сообщить о том, что происходит на самом деле, но это иногда вызывает непреднамеренные предубеждения и предубеждения. Создателям нелегко избавиться от субъективного толкования. Это дилемма между данными, искусством и объективными желаниями.
Сей Мин (Sey Min) — художник и дизайнер в области визуализации данных, который заинтересован в работе с наборами данных в реальном времени в различных медиаформатах.Она создает проекты, которые переосмысливают отношение людей к технологиям, обществу и городам, а также к окружающей среде. Сочетая элементы экологических исследований, визуального искусства, программирования и рассказывания историй, ее проекты варьируются от создания интерактивной информационной графической системы в реальном времени для музыкального клуба ( Gender Ratio, 2007) до визуализации данных о расходах города Сеула ( City DATA : Ежедневные расходы Сеула, , 2014 г.). Она является основателем и организатором Random Walks (случайных блужданий.org), которая является студией визуализации данных в Корее. Ее работы выставлялись в Национальном музее современного искусства, Корея; TED 2011; TEDGlobal 2012; Art Center Nabi в Сеуле и Lift Conference и представлен на CNN Asia, Lift09 и aliceon.net. Сей Мин получил степень магистра в области интерактивных медиа в институте Пратта (2004) и работал в MIT SENSEable City Lab в качестве исследователя городского информационного дизайна. Она была стипендиатом TED 2011 года, а с 2012 по 2013 год была выбрана старшим научным сотрудником. Ее работы также доступны на ttoky.com, который написан на английском языке.
Искусство и наука визуализации данных | Майкл Махони
Давайте перейдем от теоретических соображений к построению графиков к реальным строительным блокам, которые есть в вашем распоряжении. По мере того как мы это делаем, мы также перейдем к мантре № 2:
Все должно быть сделано как можно проще, но не проще.
Графики по своей сути представляют собой двухмерное изображение наших данных:
У них есть шкала x и y, и, как на нашем графике рассеяния здесь, положение точки на каждой шкале говорит вам, насколько велики ее значения.Но такая установка позволяет нам смотреть только на две переменные в наших данных — и мы часто заинтересованы в том, чтобы увидеть взаимосвязь между более чем двумя переменными.
Итак, возникает вопрос: как мы можем визуализировать эти дополнительные переменные? Мы можем попробовать добавить другую шкалу позиций:
Но трехмерные изображения сложно осмыслить, их сложно создать и они не так эффективны для передачи вашего сообщения. У них действительно есть свое применение — особенно когда вы можете создавать реальные, физические 3D-модели, а не просто создавать 3D-формы на 2D-плоскостях, — но зачастую они не стоят усилий.
Итак, какие инструменты есть в нашем наборе инструментов? Те, которые в целом согласованы (нет, на самом деле — это область активных дискуссий), делятся на четыре категории:
- Положение (как у нас уже есть с X и Y)
- Цвет
- Форма
- Размер
Это инструменты, которые мы можем использовать для кодирования дополнительной информации в нашей графике. Мы собираемся называть эти эстетикой , но подойдет любое количество других слов — некоторые люди называют их шкалами, некоторые — ценностями.Я называю их эстетикой, потому что именно так их называет мой язык (R, использующий ggplot2), но само слово происходит от того факта, что это вещи, которые меняют внешний вид вашего графика.
Как бы то ни было, мы используем набор данных EPA для этого устройства, представляющий данные об экономии топлива за 1999 и 2008 годы для 38 популярных моделей автомобилей. «Hwy» — это пробег по шоссе, «displ» — объем двигателя (т.е. объем), «cty» — городской пробег. Но, честно говоря, наш набор данных не имеет значения прямо сейчас — большая часть нашего обсуждения здесь применима к любому набору данных, который вы собираете.
Мы рассмотрим каждый из этих эстетических аспектов, чтобы поговорить о том, как можно закодировать больше информации в каждой из ваших изображений. Попутно помните наши мантры:
- Хорошая графика рассказывает историю
- Все должно быть сделано как можно проще, но не проще
- Используйте правильный инструмент для работы
- Чернила дешевы. Электроны еще дешевле
В этом разделе мы поговорим о том, как это применимо.
Позиция
Давайте начнем обсуждение эстетики и закончим обсуждением позиции.Расстояние значений по осям x, y или — в случае нашей трехмерной графики — осям z представляет собой размер конкретной переменной. Люди по своей сути понимают, что значения, расположенные дальше по каждой оси, более экстремальны — например, представьте, что вы натолкнулись на следующий рисунок (сделанный с смоделированными данными):
Какие значения, по вашему мнению, выше?
Большинство людей изначально предполагают, что нижний левый угол представляет собой 0 на обеих осях, и что чем дальше вы удаляетесь от этого угла, тем выше значения.Это — относительно очевидное — открытие намекает на гораздо более важную концепцию визуализации данных: топология восприятия должна соответствовать топологии данных. Другими словами, это означает, что значения, которые кажутся на больше на графике, должны представлять значения, которые на больше в ваших данных. Таким образом, при работе с позицией более высокие значения должны находиться дальше от этого нижнего левого угла — вы должны позволить подсознательным предположениям зрителя сделать за вас тяжелую работу.
Применение этого совета к категориальным данным может оказаться немного сложным. Представьте, что мы смотрим на средние расстояния по шоссе для производителей автомобилей в нашем наборе данных:
В этом случае позиция по оси x просто представляет другого производителя автомобилей в алфавитном порядке. Но помните, положение на графике — это эстетика, которую мы можем использовать для кодирования большего количества информации в нашей графике. И мы не делаем этого здесь — например, мы могли бы показать ту же информацию, вообще не используя позицию x:
Попытайтесь сравнить Pontiac и Hyundai на первом графике и на втором графике.Во всяком случае, удаление нашей посторонней эстетики облегчило сравнение производителей. Это важный фактор, стоящий за нашей второй мантрой — все должно быть сделано как можно проще, но не проще. Излишняя эстетика сбивает график с толку, затрудняя понимание истории, которую он пытается рассказать.
Однако, создавая графику, мы всегда должны стремиться упростить важные сравнения. Таким образом, мы должны воспользоваться нашей эстетикой x, расположив производителей не в алфавитном порядке, а по их среднему пробегу на шоссе:
Переупорядочив графику, мы теперь можем лучше сравнивать больше похожих производителей.Теперь стало намного быстрее понимать нашу визуализацию — более близкие сравнения проводить легче, поэтому размещение большего количества близких значений значительно упрощает их понимание. Посмотрите, например, на Pontiac и Hyundai. Вообще говоря, не располагайте элементы в алфавитном порядке — используйте порядок размещения элементов для кодирования дополнительной информации.
В качестве небольшого примечания, я лично считаю, что при работе с категориальными значениями по оси X вы должны переупорядочить свои значения так, чтобы сначала было наивысшее значение.По какой-то причине я просто обнаружил, что самая высокая полоса / самая высокая точка (или что-то еще, что используется для отображения значения) рядом с линией оси Y выглядит намного чище, чем альтернатива:
Для чего это стоит, я несколько меньше догматичен по этому поводу, когда значения находятся на оси Y. Я лично считаю, что максимальное значение всегда должно быть наверху, поскольку люди ожидают, что более высокие значения будут дальше от этого нижнего левого угла:
Однако меня не так сразу отталкивает противоположный порядок, как я с осью X, вероятно, потому что нижняя полоса / точка, находящаяся дальше всего, выглядит как более естественная форма и все еще находится вдоль линии оси X:
По крайней мере, для этого ваш пробег может отличаться.Кроме того, стоит отметить, насколько чище метки на этом графике, когда они находятся на оси Y — переворачивание вашей системы координат, как мы сделали здесь, — хороший способ отобразить данные, когда у вас громоздкий количество категорий.
Цвет
Хотя мы хорошо изучили роль, которую играет положение в передаче информации, мы все еще застряли на том же вопросе, с которого начали: как мы можем отобразить третью переменную на графике?
Один из самых популярных способов — использовать цвета для представления третьей переменной.Возможно, стоит поговорить о том, как можно использовать цвет с смоделированным набором данных. Возьмем, к примеру, следующий график:
А теперь давайте добавим цвет для нашей третьей переменной:
Помните: перцепционная топология должна соответствовать топологии данных. Какие значения больше?
Большинство людей скажет, что более темные. Но всегда ли это так просто? Давайте изменим нашу цветовую шкалу для сравнения:
Конечно, некоторые из этих цветов темнее других, но я бы не сказал, что какой-либо из них говорит мне, что значение является особенно высоким или низким.
Это потому, что люди не воспринимают оттенок — фактический оттенок цвета — как упорядоченное значение. Цвет точки не означает, что точка имеет более высокое или более низкое значение, чем любая другая точка на графике. Вместо этого оттенок работает как неупорядоченное значение , которое только сообщает нам, какие точки к каким группам принадлежат. Чтобы определить, насколько высоко или низко значение точки, вместо этого мы должны использовать люминесценцию — или насколько яркой или темной является отдельная точка.
Есть еще одна ось, по которой вы можете перемещать цвета для кодирования значения — насколько ярким является цвет, известный как цветность :
Просто имейте в виду, что люминесценция и цветность — насколько светлый цвет и насколько оно яркое — упорядоченных значений , тогда как оттенок (или оттенок цвета) неупорядоченный Это становится актуальным при работе с категориальными данными. Например, возвращаясь к диаграмме рассеяния, которую мы начали с:
Если мы хотим закодировать категориальную переменную в этом — например, класс транспортного средства — мы могли бы использовать оттенок, чтобы отличать разные типы автомобилей друг от друга:
В этом случае использование оттенка для различения наших переменных явно имеет больше смысла, чем использование цветности или люминесценции:
Это случай знания того, какой инструмент использовать для работы — цветность и люминесценция явно означают, что некоторые переменные ближе друг к другу, чем подходит для категориальных данных, тогда как оттенок не даст вашей аудитории никакой полезной информации об упорядоченной переменной.Однако обратите внимание, что я бы все же не рекомендовал использовать радугу для различения категорий в вашей графике — цвета радуги — это не совсем неупорядоченные значения (например, красный и оранжевый гораздо более похожи цвета, чем желтый и синий), и вы закончите намекающими связями между вашими категориями, которые вы, возможно, не захотите предлагать. Кроме того, радуга просто ужасна:
Говоря об использовании правильного инструмента для работы, одна из худших вещей, которые люди любят делать при визуализации данных, — это чрезмерное использование цвета.Возьмем, к примеру, следующий пример:
На этом графике переменная «класс» представлена как положением по оси x, так и цветом. Дублируя эти усилия, мы усложняем понимание нашего графика — достаточно однократного кодирования информации, а повторение большего количества раз — отвлекает. Запомните вторую мантру: все должно быть сделано как можно проще, но не проще. Лучшая визуализация данных — это та, которая включает все элементы, необходимые для доставки сообщения, и не более того.
Вы можете свободно использовать цвет в своей графике, если он добавляет больше информации к графику — например, если он кодирует третью переменную:
Но репликация, как мы делали выше, просто добавляет больше мусора в вашу диаграмму .
Еще один способ эффективного использования цвета на графике — выделить точки с определенными характеристиками:
Это позволяет зрителю быстро выбирать наиболее важные участки нашего графика, повышая его эффективность.Обратите внимание, что я использовал форму вместо цвета для разделения классов транспортных средств, кстати — комбинирование выделения точек и использование цвета для различения категориальных переменных может работать, но также может стать несколько хаотичным:
Есть еще одна причина, по которой цвет является сложной эстетикой Для правильной работы с графикой: около 5% населения (10% мужчин, 1% женщин) вообще не видят цвета. Это означает, что вы должны быть осторожны при использовании его в своих визуализациях — используйте безопасные для дальтоников цветовые палитры (подробнее о них см. «ColorBrewer» или «viridis») и по возможности сочетайте их с другой эстетикой.
Форма
Самая простая эстетика для сочетания цвета — это следующая по частоте использования форма. Этот гораздо более интуитивно понятен, чем цвет — чтобы продемонстрировать, вернемся к нашему графику рассеяния:
Теперь мы можем изменить форму каждой точки в зависимости от того, какой класс транспортного средства она представляет:
Представьте, что мы выполняем то же упражнение, что и мы делали с цветом раньше — какие значения больше?
Я уже испортил ответ, рассказав вам, что представляют собой формы — ни одна из них по своей сути не больше других.Форма, как и оттенок, представляет собой неупорядоченное значение .
Те же основные концепции применимы, когда мы меняем форму линий, а не только точек. Например, если мы построим отдельные линии тренда для переднеприводных, заднеприводных и полноприводных автомобилей, мы можем использовать тип линии для представления каждого типа автомобиля:
Но даже здесь ни один тип линии не подразумевает более высокий или более низкое значение, чем другие.
Однако к этому правилу следует сделать два предостережения. Например, если мы вернемся к нашему исходному графику рассеяния и изменим формы, которые мы используем:
Этот график, кажется, подразумевает большую связь между первыми тремя классами автомобилей (все они представляют собой разные типы ромбов) и следующими тремя классы (которые представляют собой все типы треугольников), выделяя внедорожники.Таким образом, мы можем использовать форму для обозначения связи между нашими группами — более похожие формы, которые различаются только углом или текстурой, подразумевают более тесное отношение друг к другу, чем к другим типам форм. Это может быть как благословением, так и проклятием — если вы выберете, например, квадрат и ромб, чтобы обозначить две несвязанные группы, ваша аудитория может случайно прочитать в отношениях больше, чем вы предполагали.
Также стоит отметить, что различные формы могут довольно быстро загромождать график.Как правило, использование более 3–4 фигур на графике — плохая идея, а более 6 фигур означает, что вам нужно немного подумать о том, что вы действительно хотите, чтобы люди отняли.
Размер
Наш последний эстетический аспект — размер. Возвращаясь к нашему исходному графику рассеяния, мы можем представить себе использование такого размера:
Размер — это изначально упорядоченное значение — точки большого размера подразумевают большие значения. В частности, люди воспринимают большие площади как соответствующие более значительным значениям — точки, которые в три раза больше на приведенном выше графике, также примерно в три раза больше по значению.
Это становится сложным, если размер используется неправильно, по ошибке или для искажения данных. Иногда аналитик сопоставляет радиус с переменной, а не с площадью точки, в результате чего получаются графики, как показано ниже:
В этом примере точки, представляющие значение cty, равное 10, не выглядят даже близко к 1/3 от точки, равные 30. Это делает увеличение более крутым при взгляде на эту диаграмму — поэтому будьте осторожны при работе с размером как с эстетикой, чтобы ваше программное обеспечение использовало площадь точек, а не радиус!
Также стоит отметить, что в отличие от цвета, который может использоваться для различения группировок, а также для представления упорядоченного значения, как правило, использовать размер для категориальной переменной — плохая идея.Например, если мы сопоставили размер точки с классом транспортного средства:
Мы, кажется, подразумеваем здесь отношения, которых на самом деле не существует, например, микроавтобус и автомобиль среднего размера в основном одно и то же. В результате лучше использовать размер только для непрерывных (или числовых) данных.
A Tangent
Теперь, когда мы рассмотрели эти четыре эстетических аспекта, я хочу сделать небольшое отступление. Когда дело доходит до того, насколько быстро и легко люди воспринимают каждую из этих эстетических составляющих, исследования остановились на следующем порядке:
- Позиция
- Размер
- Цвет (особенно цветность и люминесценция)
- Форма
И как мы Как уже неоднократно говорилось, лучшая визуализация данных — это такая визуализация, которая включает ровно столько элементов, сколько требуется для доставки сообщения, и не более того.Все должно быть сделано как можно проще, но не проще.
Однако мы живем в мире людей, где наиболее эффективный с научной точки зрения метод не всегда является самым популярным. А поскольку цвет по своей природе более интересен, чем размер как эстетика, практикующие часто обнаруживают, что используют цвета для обозначения значений, когда размера было бы достаточно. И поскольку мы знаем, что цвет обычно следует использовать вместе с формой, чтобы сделать нашу визуализацию более всеобъемлющей, размер часто оказывается последней эстетикой, используемой в диаграмме.Это нормально — иногда нам нужно оптимизировать для чего-то другого, кроме «как быстро кто-то сможет понять мою диаграмму», например, «насколько привлекательной выглядит моя диаграмма» или «что мой босс хочет от меня». Но стоит отметить, что если вы увидите противоречивые советы в будущем — разногласия возникают из-за того, преподает ли ваш источник наиболее обоснованную с научной точки зрения теорию или наиболее применимую практику.
Давайте перейдем от эстетики к нашей третьей мантре:
Используйте правильный инструмент для работы.
Вспомните нашу первую диаграмму:
Как вы уже знаете, это диаграмма рассеяния , также известная как диаграмма точек . Теперь предположим, что мы добавили к нему наиболее подходящую линию:
Это не перестало быть диаграммой рассеяния, как только мы нарисовали на ней линию, но термин диаграмма рассеяния больше не охватывает все, что здесь происходит. Очевидно, что это также не линейный график: хотя на нем есть линия, на нем также есть точки.
Вместо того, чтобы спорить о том, что это за диаграмма, более полезно описать, какие инструменты мы использовали для отображения наших данных.Мы называем их геометриями , сокращенно от геометрий — потому что, когда вы действительно глубоко вникаете в вещи, это геометрические представления того, как ваш набор данных распределяется по осям x и y вашего графика. Я не хочу заходить слишком далеко по этому пути — я просто хочу объяснить словарь, чтобы мы не говорили о , что это за тип диаграммы , а скорее о , какие геометрии он использует . Такой подход позволяет лучше понять, как можно комбинировать и переформатировать, вместо того, чтобы предполагать, что каждый тип диаграммы может выполнять только одну задачу.
Две непрерывные переменные
В этой диаграмме используются две геометрии, которые действительно хороши для графиков с непрерывным y и непрерывным x — точками и линиями. Это то, что люди чаще всего имеют в виду, когда говорят о линейном графике — единственной плавной линии тренда, которая показывает закономерность в данных. Однако линейный график также может означать диаграмму, в которой каждая точка соединена по очереди:
Важно четко понимать, какой тип диаграммы вы собираетесь создать! Для ясности я всегда называю предшествующую линию линией тренда.
Эти типы диаграмм имеют огромное значение для быстрой исследовательской графики, показывая, как различные комбинации переменных взаимодействуют друг с другом. Например, многие аналитики начинают знакомиться с новыми наборами данных, используя матрицы корреляции (также известные как матрицы точечной диаграммы), которые создают сетку графиков разброса, представляющих каждую переменную:
В этом формате понимание взаимодействия между вашими данными происходит быстро и легко. , при этом определенные переменные взаимодействия, очевидно, выступают многообещающими направлениями для дальнейших исследований.
Чтобы немного подкрепить, есть один серьезный недостаток диаграмм рассеяния, который я хочу выделить, прежде чем двигаться дальше. Если у вас есть несколько точек с одинаковыми значениями x и y, то диаграмма рассеяния будет просто рисовать каждую точку поверх предыдущей, создавая впечатление, что у вас меньше данных, чем на самом деле. Добавление небольшого количества случайного шума — например, использование RAND () в Excel — к вашим значениям может помочь показать фактическую плотность ваших данных, особенно когда вы имеете дело с числами, которые не были измерены так точно, как могли бы. были.
Последней диаграммой, которая хорошо работает с двумя непрерывными переменными, является диаграмма с областями, которая напоминает линейную диаграмму, но заполняет область под линией:
Диаграммы с областями имеют смысл, когда 0 является релевантным числом для вашего набора данных, то есть , значение 0 не будет особенно неожиданным. Они также часто используются, когда у вас несколько группировок и вы заботитесь об их общей сумме:
(Этот новый набор данных представляет собой набор данных «бриллианты», представляющий 54000 бриллиантов размеров, качества, огранки и продажных цен.С этого момента мы будем использовать его и набор данных EPA.) совокупные эффекты всех нижестоящих групп. Например, на самом деле «чистых» бриллиантов весом 0,25 карата меньше, чем бриллиантов 1,0, но из-за того, что «идеальные» и «премиальные» резко возрастают, ваша аудитория может сделать неправильные выводы. В ситуациях, когда общая сумма имеет большее значение, чем группировка, это нормально, но в противном случае в качестве результата стоит взглянуть на другие типы диаграмм.
Одна непрерывная переменная
Если вместо этого вы хотите увидеть, как одна непрерывная переменная распределяется по всему набору данных, одним из лучших инструментов в вашем распоряжении является гистограмма. Гистограмма показывает, сколько наблюдений в вашем наборе данных попадает в определенный диапазон непрерывной переменной, и строит график, который считается гистограммой:
Один важный флаг, который следует поднять с гистограммами, — это то, что вам нужно обращать внимание на то, как ваши данные в мусорное ведро. Если вы не выбрали правильную ширину для своих бункеров, вы можете рискнуть пропустить пики и впадины в своем наборе данных и можете неправильно понять, как распределяются ваши данные — например, посмотрите, какие сдвиги будут, если мы построим график 500 бинов вместо 30. мы использовали выше:
Альтернативой гистограмме является график частот, который использует линейную диаграмму вместо столбцов для представления частоты значения в вашем наборе данных:
Опять же, вы должны обратить внимание на то, как с этими диаграммами широкие бункеры данных — вы можете случайно сгладить основные закономерности в своих данных, если не будете осторожны!
Одним из больших преимуществ частотной диаграммы перед гистограммой является то, как она работает с несколькими группировками — если ваши группировки торгуют доминирующим положением на разных уровнях вашей переменной, частотный график сделает их гораздо более очевидным, чем гистограмма.
(Обратите внимание, что я сделал что-то странное с данными, чтобы показать, как ниже меняются распределения.)
Одна категориальная переменная, одна непрерывная
Если вы хотите сравнить категориальную и непрерывную переменную, вы обычно застрял в какой-то форме гистограммы:
Гистограмма, возможно, наименее интересный из существующих типов графиков, в основном из-за того, насколько они распространены, но это потому, что они действительно хороши в том, что они делают. Гистограммы — один из наиболее легко интерпретируемых и эффективных типов визуализаций, какими бы захватывающими они ни были.
Однако некоторые люди действительно намерены это испортить. Возьмем, к примеру, столбчатую диаграмму с накоплением, которая часто используется для добавления третьей переменной в смесь:
Сравните Fair / G с Premium / G. Точно сравнить коробки практически невозможно — у них нет ни верхней, ни нижней строки, поэтому вы не сможете провести сравнение. В таких ситуациях лучше использовать вместо этого гистограмму с уклоном:
Гистограммы с уклоном обычно лучше подходят для сравнения фактических чисел различных группировок.Тем не менее, эта диаграмма хорошо показывает одно из ограничений, с которыми сталкиваются гистограммы, с которыми уклоняются — как только вы преодолеете 4 или 5 группировок, проводить сравнения сложно. В этих случаях вы, вероятно, пытаетесь применить неправильную диаграмму для работы, и вам следует подумать о том, чтобы разбить ее на более мелкие (помните, что чернила дешевы, а электроны или дешевле), или заменить столбцы несколькими линиями.
Однако единственное место, где уместны гистограммы с накоплением, — это когда вы сравниваете относительные пропорции двух разных групп в каждом столбце.Например, возьмите следующий график:
В этом случае сравнение между группами тривиально, что упрощается тем, что все группы имеют общую линию — 100% для группы 1 и 0% для группы 2. Эта точка отсчета решает проблему, которая возникла у нас с более чем двумя группировками — хотя обратите внимание, что мы все равно предпочли бы уклоненную гистограмму, если бы столбцы не всегда составляли одинаковую сумму.
A Quick Tangent
Это обычно то место, где большинство людей будет очень долго разглагольствовать о круговых диаграммах и о том, насколько они плохи.Они ошибаются, но понятным образом.
Люди любят ненавидеть круговые диаграммы, потому что они почти всегда плохие. Однако, если вашему зрителю важно иметь возможность быстро определить, какую пропорцию составляют две или более групп в целом, круговая диаграмма на самом деле является самым быстрым и эффективным способом донести мысль. Например, сравните следующие круговые и гистограммы, построенные с тем же набором данных:
Намного легче сказать, что, скажем, A меньше, чем C — F на круговой диаграмме, чем столбиковый график, поскольку люди лучше при суммировании углов, чем площадей.В этих случаях смело используйте круговую диаграмму и говорите всем, кто вас раздражает, что я сказал, что это нормально.
Две категориальные переменные
Наша последняя комбинация — это когда вы хотите иметь категориальную переменную как по оси x, так и по оси y. Это более сложные графики, о которых стоит подумать, поскольку мы больше не кодируем значение в позиции в зависимости от того, насколько далеко точка находится от нижнего левого угла, а скорее должны проявить творческий подход к эффективному использованию позиции для кодирования значения. Помните, что геометрия — это геометрическое представление того, как ваш набор данных распределяется по осям x и y вашего графика.Когда обе ваши оси категоричны, вы должны проявить творческий подход, чтобы показать это распределение.
Один из методов — использовать плотность, как в случае с диаграммой рассеяния, чтобы показать, сколько точек данных попадает в каждую комбинацию категорий, представленных на графике. Вы можете сделать это, составив диаграмму «облака точек», где более плотные облака представляют более распространенные комбинации:
Даже без единственного числа на этой диаграмме, ее смысл ясен — мы можем сказать, как распределяются наши алмазы, с одного взгляда. .Аналогичный способ сделать это — использовать тепловую карту, где разноцветные ячейки представляют диапазон значений:
Я лично считаю, что тепловые карты менее эффективны — частично потому, что, используя эстетику цвета для кодирования этого значения, вы не можете используйте его для чего-нибудь еще — но их часто легче сделать с имеющимися ресурсами.
Что такое визуализация данных? Определение и примеры
Примеры визуализации данных в действии
Конечно, один из лучших способов понять визуализацию данных — это увидеть ее.Какая безумная идея! С общедоступными галереями визуализации данных и данными повсюду в сети, может быть сложно понять, с чего начать. Мы собрали 10 лучших примеров визуализации данных за все время, с примерами, которые отображают исторические завоевания, анализируют сценарии фильмов, раскрывают скрытые причины смертности и многое другое. Собственная общедоступная галерея Tableau демонстрирует множество визуализаций, созданных с помощью бесплатного инструмента Tableau Public, мы предлагаем несколько общих информационных панелей для начинающих в качестве удобных шаблонов, а Viz of the Day собирает некоторые из лучших творений сообщества.Кроме того, существует множество отличных блогов и книг о визуализации данных, содержащих отличные примеры, объяснения и информацию о передовых методах работы.
Различные типы визуализаций
Когда вы думаете о визуализации данных, ваша первая мысль, вероятно, сразу же приходит к простым гистограммам или круговым диаграммам. Хотя они могут быть неотъемлемой частью визуализации данных и общей базой для многих графиков данных, правильная визуализация должна сочетаться с правильным набором информации.Простые графики — это только верхушка айсберга. Существует целый ряд методов визуализации для эффективного и интересного представления данных. Общие общие типы визуализации данных:
- Графики
- Столы
- Графики
- Карты
- Инфографика
- Панели мониторинга
Более конкретные примеры методов визуализации данных:
- Диаграмма с областями
- Гистограмма
- Участки типа «коробочка и усы»
- Облако пузырей
- Пулевая диаграмма
- Картограмма
- Круглый вид
- Точечная карта распределения
- Диаграмма Ганта
- Тепловая карта
- Таблица выделения
- Гистограмма
- Матрица
- Сеть
- Полярная область
- Радиальное дерево
- Точечная диаграмма (2D или 3D)
- Стримграф
- Текстовые таблицы
- Хронология
- Древовидная карта
- График клинового стека
- Облако слов
- И любые сочетания и сочетания на приборной панели!
Подробнее о визуализациях данных (и о том, как создавать собственные)
Если вы чувствуете вдохновение или хотите узнать больше, есть масса ресурсов, которые можно использовать.В визуализации данных и журналистике данных полно энтузиастов-практиков, готовых поделиться своими советами, приемами, теорией и многим другим.
Блоги о визуализации данных — отличное место для начала
См. Наш список отличных блогов по визуализации данных, полный примеров, идей и образовательных ресурсов. Эксперты, которые пишут книги и преподают классы по теории, лежащей в основе визуализации данных, также обычно ведут блоги, где анализируют последние тенденции в этой области и обсуждают новые визуальные эффекты.Многие будут критиковать современную графику или писать учебные пособия по созданию эффективных визуализаций. Другие будут собирать множество различных визуализаций данных со всего Интернета, чтобы выделить наиболее интригующие. Блоги — отличный способ узнать больше об определенных подмножествах визуализации данных или найти соответствующие источники вдохновения в хорошо выполненных проектах.
Узнайте об исторических примерах и теории из книг
Прочтите наш список замечательных книг по теории и практике визуализации данных.В то время как блоги могут идти в ногу с меняющейся областью визуализации данных, книги сосредоточены на том, где теория остается неизменной. Люди пытались представить данные в визуальной форме на протяжении всего своего существования. Одна из более ранних книг о визуализации данных, первоначально опубликованная в 1983 году, заложила основу для будущей визуализации данных и остается актуальной по сей день. Более современные книги по-прежнему посвящены теории и методам, предлагая неподвластные времени примеры и практические советы. Некоторые даже берут завершенные проекты и представляют визуальную графику в виде книги как архивную экспозицию.
Есть множество бесплатных курсов и платных программ обучения
Существует множество отличных платных и бесплатных курсов и ресурсов по визуализации данных, в том числе прямо здесь, на веб-сайте Tableau. Здесь есть видео, статьи и технические документы для всех, от новичка до рок-звезды. Однако, что касается сторонних курсов, в настоящее время мы не будем давать конкретных предложений в этой статье.
Примечание об инструментах и программном обеспечении визуализации данных
Существуют десятки инструментов для визуализации и анализа данных.Они варьируются от простых до сложных, от интуитивных до тупых. Не каждый инструмент подходит для каждого, кто хочет изучить методы визуализации, и не каждый инструмент можно масштабировать для промышленных или корпоративных целей. Если вы хотите узнать больше о вариантах, не стесняйтесь читать здесь или погрузиться в подробный сторонний анализ, такой как Gartner Magic Quadrant. Также помните, что хорошая теория и навыки визуализации данных выходят за рамки конкретных инструментов и продуктов. Когда вы изучаете этот навык, сосредоточьтесь на передовых методах и изучите свой собственный стиль, когда дело касается визуализаций и информационных панелей.Визуализация данных никуда не исчезнет, поэтому важно создать основу для анализа, повествования и исследования, которую вы можете носить с собой независимо от инструментов или программного обеспечения, которые вы в конечном итоге используете.
Визуализация данных — искусство или наука?
Около 40 000 лет назад первые искусственные двумерные символы появились на стенах пещеры . Это одни из самых ранних известных визуальных выражений человеческих идей. Сегодня мы продолжаем традицию визуальной коммуникации с помощью невероятного набора средств массовой информации — краски на холсте, пленки, керамики, компьютерных пикселей, фотографии и многих других.
В связи с недавним увеличением доступности массивных наборов данных, также возрос острый интерес общественности к пониманию того, что рассказывают эти большие наборы данных, и к визуализации этих идей в полезных и убедительных формах. Индустрия визуализации данных переживает бум.
В Correlate.io мы любим погружаться в наборы данных, понимать истории, которые они рассказывают, и находить практичные, но красивые и увлекательные способы поделиться этими историями с помощью нашей платформы визуализации данных.Преобразование необработанных наборов данных в визуальное повествование помогает нам понять взаимосвязи, корреляции и истории в наших данных таким образом, который мы не сможем сразу увидеть, глядя на необработанные наборы данных.
Процесс визуализации данных — это любопытный зверь, который начинается с кажущихся непонятными объемов информации, проходит через интенсивную очистку данных, классификацию, статистическое и математическое моделирование, анализ, процесс проектирования и заканчивается визуализацией. Весь процесс построения визуализации представляет собой сложный междисциплинарный набор областей.Однажды мы сделали шаг назад и наблюдали, как наша команда разнообразных профессионалов работает над созданием визуализации. Мы были поражены тем, сколько разных точек зрения необходимо было для создания динамической конечной цели.
В надежде удовлетворить наши попытки точно определить, что такое визуализация данных, мы подвергли наших сотрудников испытанию. Мы спросили их, что они думают — визуализация данных — это искусство? Или это наука?
Что говорит команда IB5k …
«Это определенно комбинация того и другого.Визуализации часто являются результатом последовательности аналитических операций, применяемых к набору данных. Цель визуализации — передать шаблон, который эти операции обнаруживают в сборе данных. Чтобы визуализация была эффективной, она должна быть увлекательной. Он должен взаимодействовать с людьми, чтобы убедительно и ясно сообщать обнаруженные закономерности, и эта часть является большим искусством. Есть наука о психологии визуализации, которая объясняет, как это делается, но это все еще искусство.”
— Эзра Ли (специалист по данным, IB5k и Correlate)
«Я думаю, что способность придавать смысл данным — это во многом искусство. Требуются креативность и изобретательность, чтобы составить эти графики и уметь применять смысл и делать выводы о реальных вещах из простых данных. Мне кажется, что данные — это ваша палитра, а визуализация — это живопись. Конечно, вы можете добавить к сюжету кучу данных и извлечь из этого что-то, но чтобы создать что-то значимое, что другие люди смогут понять, оценить и восхититься, нужен настоящий художник.”
— Джексон Бланкштейн (разработчик, IB5k и Correlate)
«Я думаю, это наука. Неважно, насколько красиво это выглядит, не имеет значения, насколько четкие шрифты или различие, которое вы хотите показать в визуализации. Если набор данных и анализ не сделаны правильно, правильно и строго, это просто картина. Я не думаю, что это искусство, это наука ».
— Юнг Ли (специалист по продуктам, IB5k и Correlate)
«Визуализация данных — это одновременно искусство и наука.Наука о данных требует моделирования, тестирования и математической проверки. Однако выбор способа отображения этой информации требует тонкости и внимания как к эстетическим, так и к техническим деталям, чтобы правильно, красиво и просто визуализировать данные. Данные могут быть сильно искажены из-за непонимания или чрезмерно упрощенной эстетической обработки. Визуализация данных требует как понимания необработанных данных, так и умения разумно и точно использовать графические элементы для отображения практических идей на основе этих необработанных данных.”
Одна из моих любимых цитат за все время — «Ложь, проклятая ложь и статистика» Марка Твена. Я думаю, важно, чтобы мы осознавали, что статистический анализ — это область, в которой мы пристрастиям; то есть данными можно манипулировать, чтобы позволить их автору получить желаемые результаты. Таким образом, мы должны проявлять бдительность при анализе наших данных, и мы должны быть искусными авторами дизайна, используя свои способности как художников и ученых, чтобы помочь раскрыть лежащие в основе объективные истины в наших наборах данных.
— Лаура Сич (руководитель проекта, IB5k)
«Я считаю, что это искусство. Когда специалисты по обработке данных собирают или получают данные, они несут ответственность за рассказ через строгий процесс очистки данных, статистического анализа, моделирования и многого другого. А что такое искусство, как не повествование? Как хореография — это способ рассказать историю с помощью движения, как картина может рассказать историю с помощью мазков на холсте — то же самое с музыкой. Все дело в повествовании.С этой точки зрения это искусство ».
— Анжела Шёпке (руководитель проекта, IB5k и Correlate)
«Я считаю, что эффективная визуализация данных — это одновременно искусство и наука. Под этим я подразумеваю следующее: очевидно, что это наука, в которой задействованы достоверные данные, и существуют научные способы их анализа, структурирования и интерпретации этих данных. На этапах сбора и агрегирования данных необходимо соблюдать определенные правила, а также применять строгие математические инструменты для поиска закономерностей, имеющих научное значение.
Тем не менее, существует художественный аспект не только в представлении данных (пунктирные или пунктирные линии, выбор цвета, узоры и формы и т. Д.), Которые должны четко передавать информацию, выводы и закономерности, но и на начальных этапах. когда человек сталкивается с огромным набором данных, и часто нужно найти место для начала. Знание, с чего начать, — это уже отчасти искусство, ощущение реальной ситуации, в которой были созданы данные, и наличие интуиции в отношении того, как вещи могут быть связаны, чтобы даже начать поиск и анализ.