Ситуация в мире сейчас такая, что больше вопросов, чем ответов. Хочется понимать что на самом деле происходит, но очевидно, что даже при желании внимательно проанализировать ситуацию и причинно-следственные связи, у нас не будет достаточно достоверной информации, чтоб сделать выводы. И что же мы можем делать в этом случае? Мы можем оценить текущую ситуацию и сформировать для себя некие ожидания, прогнозы, чтоб понять как спланировать свою личную жизнь и в каком направлении двигаться дальше.
Что будет в этой статье?
- Краткое описание доступных источников данных.
- Примечания по использованию данных.
- Визуализация доступных данных по коронавирусу. (+демографические и экономические показатели) в powerBI (InsightWhale).
- Примечания по работе с файлом powerBI.
- Краткая инфо по слайдам (картинки и немного текста).
- Что можно извлечь из графиков и как их воспринимать.
Что доступно для обзора?
Примеры источников данных:
- Johns Hopkins
- Сайты официальных организаций, например:
- Твиттер аккаунты официальных организаций, например:
Всегда обращайте внимание какой источник данных используется в отчетах/графиках/визуализации!
Встречаются данные, которые никак не подтверждены официальными ресурсами страны (например, СМИ пишет, что чаще умирают женщины 65+, но страна не выдавала инфо о соотношении пола/возраста по смертности от коронавируса).
Неофициальные ресурсы могут просто выдвигать гипотезы, а не анализировать подтвержденные данные. Более того, даже если это был анализ, не факт, что методы были применены правильно (иногда при анализе можно получить парадоксальные результаты, например “чем больше плотность населения — тем ниже темпы заражения”).
Важно понимать:
- Не все страны отдают точную статистику. Например, в Италии можно найти разбивку данных по демографическим показателям и городам, а в Казахстане есть только общая цифра на всю страну.
- Не во всех странах есть необходимое количество тестов на коронавирус, соответственно реальные количественные показатели могут отличаться от того, что есть в интернете/СМИ.
- Данные по общим демографическим (соотношение полов, смертность и пр.) и экономическим (долг страны, импорт/экспорт и пр.) показателям в открытом доступе можно найти в ограниченном количестве и чаще это данные за 2015-2017 годы.
- Для сбора и размещения статистики также требуется время, так что в целом те данные, которые мы видим на сайтах, как минимум запаздывают на день.
Таким образом, даже если мы используем официальные данные, мы не сможем увидеть настоящую картину в целом по миру, поэтому в любом случае всегда держим в голове допущение, что всё может быть несколько лучше/хуже.
Визуализация данных по коронавирусу в powerBI
Мы, команда InsightWhale немного побрейнштормили на тему коронавируса, посмотрели доступную информацию и сделали визуализацию данных. Визуализация не дает того или иного окраса происходящим событиям, а просто описывает текущую ситуацию. Используя эти графики и таблицы вы можете сделать свои личные выводы, я лишь опишу возможные варианты использования и примечания.
Общие примечания
- Отчетику нужно прогрузиться, дайте ему немного времени (он сразу после этого блока в iframe).
- Отчет powerBI обновляется ежедневно и даже если скриншоты в статье устареют, то он — нет.
- В правом верхнем углу вы можете посмотреть последнюю дату обновления данных и используемые источники.
- В правом нижнем углу есть иконка, при нажатии на которую, можно развернуть отчет на весь экран.
- Вторая справа иконка в правом нижнем углу -> поделиться URL, можете скопировать ссылку, чтоб отправить друзьям или пошарить в соц. сетях.
- Внизу посередине переключаются страницы отчета.
- Отчет обновляется, поэтому могут добавляться новые листы или в текущие могут вноситься небольшие правки.
- Чтоб выбрать несколько стран одновременно, используйте Ctrl + левая кнопка мыши (Windows) или cmd + левая кнопка мыши (Mac)
Общие данные
Можно применить фильтр справа (выбрать одну или несколько стран) и узнать цифры по конкретной стране.
- Confirmed: количество подтвержденных заражений, включает и recovered, и deaths, и тех, кто еще заражен.
- Recovered: количество выздоровевших.
- Deaths: количество умерших.
- Increased today on: на сколько увеличилось количество случаев сегодня (в день обновления данных).
- Confirmed vs Population: коэффициент значимости заражения относительно населения, количество подтвержденные случаи разделить на население.
- Recovered vs Confirmed: коэффициент выздоровления, кол-во выздоровевших разделить на кол-во подтвержденных случаев.
- Deaths vs Confirmed: коэффициент смертности, кол-во смертей разделить на кол-во подтвержденных случаев.
- Карта отвечает на вопрос: в каких странах больше всего людей выздоравливает относительно заразившихся?
Статистика по странам со 100+ зараженными
Слайды ниже показывают только те страны, где более 100 зараженных. Можно выбрать одну или несколько стран для отображения на графике и отфильтровать по дате или количеству дней. Статистика для стран с 30M+ населения.
Чем полезен?
Здесь всё сводится к единой точке — когда в стране появилось более 100 зараженных. Если в случае с использованием календарных дней мы можем посмотреть текущую ситуацию, то здесь мы можем посмотреть относительное течение заболеваемости по странам.
Например, мы видим, что на 20й день в США показатели уже значительно превышают Китайские и сам темп заболеваемости в целом более резкий, чем был в Китае.
Над чем подумать и куда копать?
Вы, конечно же, можете задаться своими вопросами (пишите в комментариях, я с радостью подумаю вместе с вами), но вот пара вариантов:
- Какие действия были предприняты Китаем на 20-21 день (в то время как у Китая будет дальше скачок, а после стабильная ситуация, у США выглядит так, будто ситуация не быстро стабилизируется)?
- Что делали США на 14-15 день или чего НЕ делали в сравнении с Китаем (примерно после этого рост пошел более резко вверх)?
Тот же график, что выше, но по календарным дням.
Чем полезен?
- Здесь можно посмотреть конкретные даты и более точечно искать информацию по действиям государств в те или иные изменения количественных показателей.
- Можно увидеть корреляцию между графиками разных стран, например, Италия и Испания имеют одинаковую просадку 12 марта, а далее графики движутся параллельно. Найдя такие интересные моменты, мы можем лезть глубже и анализировать действия стран попарно.
Над чем подумать и куда копать?
- Что делал Китай 12 февраля?
- Что происходило в Италии и Испании 12 марта?
- Что происходило в Штатах 18 марта?
- Выдержит ли система здравоохранения Штатов такую ситуацию?
Этот график похож на те, что выше, но показывает влияние количества заражений коронавирусом на население страны, графики сведены к единой точке (когда стало 100+ зараженных). Статистика для стран с 30M+ населения.
Чем полезен?
- Понять для каких стран ситуация несет наибольший удар по населению и системе здравоохранения.
- Понять относительное влияние зараженности населения коронавирусом. Цифры могут быть огромные, но это будет малая доля населения, либо же наоборот, количественные показатели будут низкие в сравнении с другими странами, но это будет нести огромный урон государству.
Над чем подумать и куда копать?
- По количественным показателям Китай лидировал, но фактически урон населению с 5+ дней у других стран намного выше. Это те страны, которые в первую очередь нуждаются в помощи и в принятии оперативных мер на уровне управления государством.
Коэффициент смертности и выздоровления по календарным дням
Отношение коэффициента смертности и выздоровления с количеством зараженных.
Чем полезен?
Можно понять как меняется ситуация в какой-либо конкретной стране по выздоровлению или смертности в дни, начиная с 100+ заражений.
Над чем подумать и куда копать?
На первом графике видно, что в США смертность превышает выздоровления, а в Италии наоборот. Конечно, здравая ситуация когда больше людей выздоравливают и меньше людей умирают. Соответственно, в США явно происходит что-то нехорошее и неправильное.
Если в какой-то момент графики меняются местами, можно проанализировать какие действия выполнялись и какие меры были предприняты страной, либо же попробовать поискать более подробную разбивку по демографическим показателям (например, гипотетически возможно, чтоб в какой-то стране был высокий процент пожилых людей среди зараженных, у которых больше риск). К сожалению, такие данные по каждой стране найти сложно.
Общие данные по странам. Таблица.
Можно посмотреть ТОП стран по разным показателям и выбрать какие-либо группы для более глубокого анализа. Учтены все страны, в т.ч. с количеством заражений менее 100 и с населением менее 30 миллионов.
Чем полезен?
Сортировка по влиянию зараженности на население. И казалось бы, в топе сначала должны быть страны с малым населением, но как мы видим, Италия и Испания находятся в первой пятерке.
Чем полезен?
Сортировка по коэффициенту выздоровления.
Гипотезы:
- Страны с низкими количественными показателями и высоким коэффициентом выздоровления:
а) не дают всемирным организациям данные по реальному количеству зараженных
б) выполняют правильные действия (изоляция, закрытие границ и пр.) - Страны с высокими количественными показателями и высоким рейтом выздоровления делают всё правильно и можно проанализировать что именно они делали/делают.
Чем полезен?
Где больше всего умирают от коронавируса относительно количества заболевших? Вероятно, если из 2-3 заболевших один умер, то страна не отдает всю статистику.
Чем полезен?
Влияние смертности от коронавируса на население страны. Малые числа, но всё же если мы говорим о пандемии и многие паникуют, думаю стоит знать эти показатели. Стоит дополнительно изучить общие показатели по смертности от других заболеваний в прошлые годы.
Общие демографические показатели по странам
Фильтр выбора страны в шапке отчета посередине.
Чем полезен?
Есть разные гипотезы в интернете, что быстрее/больше заражаются те страны где высокий процент 65+ или больше мужчин и т.п. Демографические данные по странам в открытых источниках присутствуют только за 2016 год, на этом графике можно выбрать несколько стран и сравнить их по демографическим показателям.
К сожалению, на таком уровне нельзя сделать никакого точного вывода. Чтоб определить влияние демографии на смертность/выздоровления от коронавируса, нужно иметь данные конкретно по заболевшим, а такую информацию выдают всего лишь несколько стран.
Общие экономические показатели по странам
Чем полезен?
Такой же график как выше, но с экономическими показателями, а не демографическими. Есть гипотезы, что вирус — это третья мировая война и одни страны умышленно заражают другие по каким-то политически-экономическим соображениям. Показатели приведены за три года, чтоб можно было посмотреть динамику. Можно выбрать группу стран и проанализировать их показатели и, вероятно, найти какие-то инсайты. GDP = ВВП
Думаю, что эти данные также можно использовать для понимания насколько ситуация с коронавирусом будет критична для экономики той или иной страны.
Итого
InsightWhale продолжает собирать и анализировать данные, если у нас будут какие-то полезные инсайты или выводы, мы обязательно поделимся, а пока давайте будем делать так:
- не паниковать,
- думать,
- беречь себя и своих близких,
- следовать рекомендуемым действиям (от правительства), например, насчет самоизоляции.
В России сейчас неплохая ситуация, поэтому стоит сохранить её на этом уровне и не допустить таких графиков, которые можем наблюдать у США и Италии.
Здоровья вам и добра!
Пишите в комментах была ли вам интересна и полезна статья 🙂