Где брать информацию?

Сегодня я вам расскажу о том, где лучше всего брать информацию для своих визуализаций.
Обычно те, кто только-только столкнулся с понятием инфографика, также сталкиваются с проблемой отсутствия хороших данных, которые были бы пригодных для визуализации. Эта статья поможет решить часть проблем, связанных с нехваткой информации.

Основные базы данных

Freebase
FreebaseСайт Freebase представляет из себя целое сообщество людей, которые собирают информацию по нескольким направлениям: люди, места и предметы. Это почти как Википедия, только тут данные намного лучше структурированы в смысле визуализации. Файлы с нужной информацией можно скачивать или напрямую загружать в своё приложение.

Infochimps
InfochimpsInfochimps носит более коммерческий характер, нежели Freebase (название говорит само за себя). Большинство собранных на сайте Infochimps данных распространяются на платной основе, однако, некоторые базы данных доступны для скачивания бесплатно. Кроме того имеется собственное API, что позволяет напрямую подключаться к интересующим базам данных, не загружая собственный компьютер.

Numbrary
NumbraryДанный сервис под названием Numbrary — это каталог различной (в основном правительственной) информации, распространяемой через интернет.

AggData
AggDataЕщё один сайт — AggData, который предлагает купить собранные базы данных, но и скачать бесплатные, которые, правда, не столь информативны, но тоже вполне пригодны для изучения. В основном, это базы о местоположениях, адресах, почтовых индексах и координатах — т.е. все, что связано с геолокацией. Платные базы обновляются практически ежедневно, а бесплатные примерно раз в 2-3 месяца.

APDS
Amazon Public Data SetsРасшифровывается APDS как Amazon Public Data Sets — сборник огромных научных баз данных, которые могут послужить отличным источником для программной визуализации (например, на языке Processing).

Wikipedia
WikipediaСамая большая и, пожалуй, самая известная база данных — Wikipedia. В ней можно найти самую различную информацию, которая оформлена в информационные таблицы на HTML в небольших объёмах. Поэтому тем, кто ищет большие массивы информации, придётся или собирать эту информацию с нескольких страниц в Википедии, или воспользоваться альтернативными источниками информации.

Gapminder
Gapminder Создатель сайта Gapminder — Ханс Рослинг. Свой сайт, на котором представлено большое число различных баз данных, он презентовал на выступлении на TED, где, помимо всего прочего, продемонстрировал возможности работы десктоп программы (написанной на AIR от Adobe), которая может напрямую взаимодействовать со всеми доступными базами с сайта Gapminder и визуализировать динамику изменения какой-либо величины. Эта программа и сам сайт являются результатом очень большой работы команды Рослинга — они добивались разрешения на доступ к правительственной информации, после чего превратили полученные данные в публичные, доступные всем для скачивания, базы данных.