Глава Визуализация из книги Искусство визуализации в бизнесе Нейтана Яу издательства Манн, Иванов и Фербер.
Читаю сам и рекомендую специалистам высокого уровня. Однозначно буду использовать решения в своем семинаре Аналитика для HR
Купить книгу Искусство визуализации в бизнесе в Лабиринте>> 860 р.
Озоне>> 902 р.
Джон Тьюки (John Tukey), мой любимый статистик и отец разведочного анализа данных, разбирался в статистических методах и свойствах, как мало кто другой, и верил, что графические методы также имеют законное право на существование. Он был глубоко убежден, что картинки способны открывать нам неожиданное. Вы можете очень многое узнать из данных, просто визуализируя их, а в ряде случаев это и есть все, что вам нужно сделать, чтобы принять информированное решение или рассказать историю.
Например, в 2009 году в Соединенных Штатах произошел значительный рост уровня безработицы. В 2007 году он составлял в среднем 4,6 процента, в 2008 году поднялся до 5,8 процента, а к сентябрю 2009 года дошел уже до 9,8 процента. Однако такие средние по стране величины способны поведать лишь часть истории. Это обобщенные данные по США в целом. Но, может, были какие-то регионы, в которых уровень безработицы оказался выше, чем в других местах? Может, были регионы, которые эта беда вообще обошла стороной?
Карты, представленные на рис. 0.1, рассказывают более полную версию этой истории, вам достаточно лишь взглянуть на них — и вы сможете ответить на вопросы из предыдущего абзаца. Округа, окрашенные в более темный цвет, — это области, в которых уровень безработицы был сравнительно высоким, в то время как в округах, окрашенных светлым, ее уровень оказался относительно низким. В 2009 году вы уже видите множество регионов на западе, где уровень безработицы стал выше 10 процентов. Такая же ситуация сложилась и в большинстве регионов на востоке. А вот регионы Среднего Запада пострадали не так сильно (см. рис. 0.2).
Рис. 0.1. Карты, демонстрирующие уровень безработицы в США с 2004 по 2009 гг.
Рис. 0.2. Карта, демонстрирующая уровень безработицы в 2009 г.
Вы бы не смогли выявить эти географические и временные закономерности так быстро, если бы перед вами была только сводная таблица, и уж точно не сумели бы это сделать, располагая лишь средними по стране величинами. И хотя при наличии данных на уровне округов картина становится более сложной, большинство людей тем не менее способны интерпретировать эти карты. Такие карты помогают политикам решать, куда направлять финансовую помощь или другие формы поддержки.
А самое замечательное — то, что все данные, использованные для создания представленных выше карт, абсолютно бесплатны и доступны широкой общественности на сайте Бюро трудовой статистики. И хотя «нарыть» их было не то чтобы очень просто с такой устаревшей системой представления данных, как у них, так или иначе все тамошние цифры в вашем распоряжении: они сидят и ждут, чтобы кто-нибудь их малость обработал визуально.
«Статистический ежегодник Соединенных Штатов», например, существует в виде сотен таблиц данных (рис. 0.3), но в нем нет ни одного графика.
Это неплохая возможность представить всеобъемлющую картину страны. Вот уж действительно интересная штука. Некоторое время назад я перевел часть таблиц в диаграммы просто так, ради идеи. На рис. 0.4 вы можете увидеть динамику браков и разводов, почтовых тарифов, потребления электроэнергии и кое-чего еще. В первом варианте, то есть в таблице, разобраться в данных непросто, и все, что у вас получится извлечь из них, — это отдельные величины. А вот в графическом варианте вы легко можете заметить тенденции и паттерны и с одного взгляда провести сравнение.
Такие поставщики новостей, как New York Times и Washington Post, прекрасно справляются с задачей делать данные более доступными и наглядными. Они, наверное, лучше многих других пользуются всей этой открытой информацией, каждый день рассказывая читателям все новые и новые истории.
Иногда графики с данными применяются для обогащения истории иной точкой зрения, а в других случаях графики, собственно, и излагают всю историю.
С развитием онлайн-медиа диаграммы и графики получили еще большее распространение. Сегодня в новостных компаниях существуют специальные службы, которые занимаются только интерактивами, или только диаграммами, или только картами. У New York Times, например, есть даже отдел новостей, созданный исключительно для работы с тем, что они называют «компьютеризированными репортажами».
Тамошние журналисты специализируются на новостях с цифрами. И отделу графики в New York Times не привыкать к работе с огромными массивами данных.
Визуализация пробилась также в попкультуру. Фирма Stamen Design, занимающаяся визуализацией и широко известная своими онлайн-интерактивами, в последние несколько лет готовила для ежегодной церемонии вручения премий MTV Video Music Awards трекеры твитов.
Рис. 0.4. Графический вид данных из «Статистического ежегодника Соединенных
Штатов»
Каждый год Stamen делала что-то новое, но суть была одна: показать, о чем говорят люди в Twitter
в реальном времени. Когда в 2009 году во время речи получившей награду Тейлор Свифт (Taylor Swift) произошла известная неприятность с Канье Уэстом (Kanye West)*, через трекер можно было сразу увидеть, что люди об этом думают.
На данном этапе вы подходите к визуализации не столько аналитически, сколько на уровне ощущений. Определение визуализации кажется несколько туманным. На протяжении длительного времени визуализация была чем-то связанным с количественными показателями. От вас требуется своими инструментами выявлять паттерны, а от паттернов — каким-то образом помогать вам в процессе анализа. Визуализация — это не просто получение объективных голых фактов.
Как и в случае с трекером Stamen, она почти всегда связана в первую очередь с фактором
развлечения. Это способ дать зрителям возможность смотреть шоу с присуждением призов и в процессе взаимодействовать с остальными людьми. Другим прекрасным тому примером может служить творчество Джонатана Харриса (Jonathan Harris). Харрис выстраивает свои работы, такие как «Все у нас хорошо» и «Охота на китов», скорее, вокруг историй, нежели вокруг аналитических прозрений, и эти истории базируются на человеческих эмоциях, вызванных цифрами и аналитикой.
Схемы и диаграммы также переросли состояние просто инструментов и служат теперь средствами коммуницирования идей — они способны даже на шутки. Такие сайты, как GraphJam и Indexed, используют диаграммы Венна, секторные диаграммы и пр. для того, чтобы представлять популярные песни или показывать, что комбинирование
Рис. 0.5. Цитаты из кинофильмов в графической форме
черного, белого и красного равносильно выпуску коммунистической газеты или убийству панды. «Недозагрузка данных» (Data Underload) — серия юмористических постов, которые
я публикую на FlowingData, — это моя собственная «проба пера» в данном жанре. Каждый день я веду наблюдения и выкладываю их в форме диаграмм. На рис. 0.5 таким образом
проиллюстрированы цитаты из известных фильмов, вошедших в рейтинги Американского
института киноискусства. Получилось нечто абсолютно нелепое, но забавное (по крайней мере, для меня).
Итак, что же такое визуализация? Ну, все зависит от того, с кем вы разговариваете.
Некоторые люди утверждают, что визуализация — это традиционные схемы и графики. Другие
придерживаются более либеральных взглядов. Для них все, что способно иллюстрировать
данные, и есть визуализация, и не имеет значения, что это: произведение data-арта или таблица в Microsoft Excel. Я лично больше склоняюсь к последним, хотя, бывает, иногда обнаруживаю себя среди членов первой группы. В конце концов, все это не так уж и важно. Просто делайте то, что подходит для ваших целей.
На каком бы определении визуализации вы ни остановились, когда вы станете создавать
диаграммы для своей презентации, анализировать большой массив цифровой информации
или готовить новостной репортаж, содержащий некие данные, вы в конечном счете будете
искать правды. В какой-то момент ложь и статистика стали почти синонимами, но на самом
деле лгут не числа. Лгут люди, использующие числа. Иногда они делают это намеренно,
реализуя какой-то план, но в большинстве случаев подобное происходит неумышленно. Когда
вы не знаете, как правильно составить диаграмму или как подать данные беспристрастно, есть
большая вероятность, что у вас появится некая информационная свалка, дающая совершенно
искривленное представление о реальности. Однако если вы усвоите годные приемы
визуализации и научитесь работать с данными, вы сможете уверенно излагать свои идеи
и радоваться своим открытиям.
Купить книгу Искусство визуализации в бизнесе в Лабиринте>> 860 р.
Озоне>> 902 р.
Читаю сам и рекомендую специалистам высокого уровня. Однозначно буду использовать решения в своем семинаре Аналитика для HR
Купить книгу Искусство визуализации в бизнесе в Лабиринте>> 860 р.
Озоне>> 902 р.
Визуализация
Один из лучших способов исследовать крупную базу данных и попытаться разобраться в ней — это визуализация. Поместите числа в видимое пространство и предоставьте мозгу — своему или ваших читателей — выявить паттерны. В этом деле мы все мастера. Вы сможете разглядеть истории, которые, возможно, никогда бы не увидели, применяя лишь формальные статистические методы.Джон Тьюки (John Tukey), мой любимый статистик и отец разведочного анализа данных, разбирался в статистических методах и свойствах, как мало кто другой, и верил, что графические методы также имеют законное право на существование. Он был глубоко убежден, что картинки способны открывать нам неожиданное. Вы можете очень многое узнать из данных, просто визуализируя их, а в ряде случаев это и есть все, что вам нужно сделать, чтобы принять информированное решение или рассказать историю.
Например, в 2009 году в Соединенных Штатах произошел значительный рост уровня безработицы. В 2007 году он составлял в среднем 4,6 процента, в 2008 году поднялся до 5,8 процента, а к сентябрю 2009 года дошел уже до 9,8 процента. Однако такие средние по стране величины способны поведать лишь часть истории. Это обобщенные данные по США в целом. Но, может, были какие-то регионы, в которых уровень безработицы оказался выше, чем в других местах? Может, были регионы, которые эта беда вообще обошла стороной?
Карты, представленные на рис. 0.1, рассказывают более полную версию этой истории, вам достаточно лишь взглянуть на них — и вы сможете ответить на вопросы из предыдущего абзаца. Округа, окрашенные в более темный цвет, — это области, в которых уровень безработицы был сравнительно высоким, в то время как в округах, окрашенных светлым, ее уровень оказался относительно низким. В 2009 году вы уже видите множество регионов на западе, где уровень безработицы стал выше 10 процентов. Такая же ситуация сложилась и в большинстве регионов на востоке. А вот регионы Среднего Запада пострадали не так сильно (см. рис. 0.2).
Рис. 0.1. Карты, демонстрирующие уровень безработицы в США с 2004 по 2009 гг.
Рис. 0.2. Карта, демонстрирующая уровень безработицы в 2009 г.
Вы бы не смогли выявить эти географические и временные закономерности так быстро, если бы перед вами была только сводная таблица, и уж точно не сумели бы это сделать, располагая лишь средними по стране величинами. И хотя при наличии данных на уровне округов картина становится более сложной, большинство людей тем не менее способны интерпретировать эти карты. Такие карты помогают политикам решать, куда направлять финансовую помощь или другие формы поддержки.
А самое замечательное — то, что все данные, использованные для создания представленных выше карт, абсолютно бесплатны и доступны широкой общественности на сайте Бюро трудовой статистики. И хотя «нарыть» их было не то чтобы очень просто с такой устаревшей системой представления данных, как у них, так или иначе все тамошние цифры в вашем распоряжении: они сидят и ждут, чтобы кто-нибудь их малость обработал визуально.
«Статистический ежегодник Соединенных Штатов», например, существует в виде сотен таблиц данных (рис. 0.3), но в нем нет ни одного графика.
Это неплохая возможность представить всеобъемлющую картину страны. Вот уж действительно интересная штука. Некоторое время назад я перевел часть таблиц в диаграммы просто так, ради идеи. На рис. 0.4 вы можете увидеть динамику браков и разводов, почтовых тарифов, потребления электроэнергии и кое-чего еще. В первом варианте, то есть в таблице, разобраться в данных непросто, и все, что у вас получится извлечь из них, — это отдельные величины. А вот в графическом варианте вы легко можете заметить тенденции и паттерны и с одного взгляда провести сравнение.
Такие поставщики новостей, как New York Times и Washington Post, прекрасно справляются с задачей делать данные более доступными и наглядными. Они, наверное, лучше многих других пользуются всей этой открытой информацией, каждый день рассказывая читателям все новые и новые истории.
Иногда графики с данными применяются для обогащения истории иной точкой зрения, а в других случаях графики, собственно, и излагают всю историю.
С развитием онлайн-медиа диаграммы и графики получили еще большее распространение. Сегодня в новостных компаниях существуют специальные службы, которые занимаются только интерактивами, или только диаграммами, или только картами. У New York Times, например, есть даже отдел новостей, созданный исключительно для работы с тем, что они называют «компьютеризированными репортажами».
Тамошние журналисты специализируются на новостях с цифрами. И отделу графики в New York Times не привыкать к работе с огромными массивами данных.
Визуализация пробилась также в попкультуру. Фирма Stamen Design, занимающаяся визуализацией и широко известная своими онлайн-интерактивами, в последние несколько лет готовила для ежегодной церемонии вручения премий MTV Video Music Awards трекеры твитов.
Рис. 0.4. Графический вид данных из «Статистического ежегодника Соединенных
Штатов»
Каждый год Stamen делала что-то новое, но суть была одна: показать, о чем говорят люди в Twitter
в реальном времени. Когда в 2009 году во время речи получившей награду Тейлор Свифт (Taylor Swift) произошла известная неприятность с Канье Уэстом (Kanye West)*, через трекер можно было сразу увидеть, что люди об этом думают.
На данном этапе вы подходите к визуализации не столько аналитически, сколько на уровне ощущений. Определение визуализации кажется несколько туманным. На протяжении длительного времени визуализация была чем-то связанным с количественными показателями. От вас требуется своими инструментами выявлять паттерны, а от паттернов — каким-то образом помогать вам в процессе анализа. Визуализация — это не просто получение объективных голых фактов.
Как и в случае с трекером Stamen, она почти всегда связана в первую очередь с фактором
развлечения. Это способ дать зрителям возможность смотреть шоу с присуждением призов и в процессе взаимодействовать с остальными людьми. Другим прекрасным тому примером может служить творчество Джонатана Харриса (Jonathan Harris). Харрис выстраивает свои работы, такие как «Все у нас хорошо» и «Охота на китов», скорее, вокруг историй, нежели вокруг аналитических прозрений, и эти истории базируются на человеческих эмоциях, вызванных цифрами и аналитикой.
Схемы и диаграммы также переросли состояние просто инструментов и служат теперь средствами коммуницирования идей — они способны даже на шутки. Такие сайты, как GraphJam и Indexed, используют диаграммы Венна, секторные диаграммы и пр. для того, чтобы представлять популярные песни или показывать, что комбинирование
Рис. 0.5. Цитаты из кинофильмов в графической форме
черного, белого и красного равносильно выпуску коммунистической газеты или убийству панды. «Недозагрузка данных» (Data Underload) — серия юмористических постов, которые
я публикую на FlowingData, — это моя собственная «проба пера» в данном жанре. Каждый день я веду наблюдения и выкладываю их в форме диаграмм. На рис. 0.5 таким образом
проиллюстрированы цитаты из известных фильмов, вошедших в рейтинги Американского
института киноискусства. Получилось нечто абсолютно нелепое, но забавное (по крайней мере, для меня).
Итак, что же такое визуализация? Ну, все зависит от того, с кем вы разговариваете.
Некоторые люди утверждают, что визуализация — это традиционные схемы и графики. Другие
придерживаются более либеральных взглядов. Для них все, что способно иллюстрировать
данные, и есть визуализация, и не имеет значения, что это: произведение data-арта или таблица в Microsoft Excel. Я лично больше склоняюсь к последним, хотя, бывает, иногда обнаруживаю себя среди членов первой группы. В конце концов, все это не так уж и важно. Просто делайте то, что подходит для ваших целей.
На каком бы определении визуализации вы ни остановились, когда вы станете создавать
диаграммы для своей презентации, анализировать большой массив цифровой информации
или готовить новостной репортаж, содержащий некие данные, вы в конечном счете будете
искать правды. В какой-то момент ложь и статистика стали почти синонимами, но на самом
деле лгут не числа. Лгут люди, использующие числа. Иногда они делают это намеренно,
реализуя какой-то план, но в большинстве случаев подобное происходит неумышленно. Когда
вы не знаете, как правильно составить диаграмму или как подать данные беспристрастно, есть
большая вероятность, что у вас появится некая информационная свалка, дающая совершенно
искривленное представление о реальности. Однако если вы усвоите годные приемы
визуализации и научитесь работать с данными, вы сможете уверенно излагать свои идеи
и радоваться своим открытиям.
Купить книгу Искусство визуализации в бизнесе в Лабиринте>> 860 р.
Озоне>> 902 р.
Комментариев нет:
Отправить комментарий