Covid-19 a sztuka i nauka wizualizacji danych


Podczas pandemii Covid-19 przywódcy polityczni i urzędnicy służby cywilnej korzystali z wizualizacji danych w celu opisania sytuacji i uzasadnienia swoich decyzji. Ale pokazał również, że chociaż oprogramowanie ułatwia zamianę liczb na obrazy, wymaga do tego wykwalifikowanych ludzi.

Na znacznie opóźnionej konferencji prasowej, która odbyła się o 18:30 w dniu 31 października 2020 r. – najwyraźniej jej czas został wymuszony przez Niechęć BBC do zwlekania Taniec z gwiazdami – główny doradca naukowy Sir Patrick Vallance przedstawił wykres, który przewiduje wzrost liczby zgonów w Anglii z około 200 do 800 do 8 grudnia. Na wykresie uwzględniono szereg przewidywań, przy czym najgorszy przypadek wynosił około 1500.

Ten element wykresu był błędny i rząd ponownie opublikował slajdy, w których górna granica zakresu wskazywała na nieco ponad 1000 zgonów dziennie. Prognoza również była błędna: 375 osób zmarło w Anglii z powodu Covid-19 8 grudnia, chociaż było to kilka tygodni po wprowadzeniu nowych ograniczeń blokowania. (Zobacz wykresy „przed i po” poniżej).

Premier Boris Johnson ogłosił to na konferencji prasowej w Halloween, zaraz po tym, jak Vallance i główny lekarz, profesor Chris Whitty, zakończyli swoje slajdy. „Obawiam się, że żaden odpowiedzialny premier nie może zignorować przesłania tych liczb” – powiedział Johnson w ramach uzasadnienia.

Zanim wykryto konkretny błąd, wizualizacje były krytykowane za zbyt szczegółowe i drobiazgowe pismo, które raczej straszyło widzów niż ich oświecało. „To skomplikowany slajd”, powiedział Vallance o jednym z zatytułowanych „Użytkowanie nowego połączonego łóżka projekcyjnego SPI-M w Anglii”. „W następne Halloween idę jako wykres” – napisała na Twitterze Marina Hyde, dziennikarka w Opiekun.

Pierwszy wykres opublikowany 31 października 2020 r.
Zaktualizowany wykres opublikowany 31 października 2020 r.

„Na rządowych konferencjach prasowych widzieliśmy, że czasami mniej może oznaczać więcej, a prostota często jest najlepszym sposobem komunikacji z danymi” – mówi Gavin Freeguard, autor Ostrzeżenie: zawartość graficzna, newsletter e-mailowy obejmujący wizualizację danych. „Nie rzucałbyś listów na stronę i miałbyś nadzieję, że zmieszczą się w zwięzłe zdania i doskonale uformowane akapity, które opowiadają historię, którą chcesz opowiedzieć. Jednak zbyt często ludzie wrzucają liczby do wykresów i myślą, że to wystarczy. Tak nie jest ”.

Reklama

Andy Cotgreave, dyrektor ds. ewangelizacji technicznej w firmie Tableau, dostawcy oprogramowania do wizualizacji, mówi, że wykresy używane na rządowych konferencjach prasowych Covid-19 powinny być sprawdzane tak dokładnie, jak każdy materiał pisemny. „To ich przestrzeń do jasnego komunikowania się z nerwową publicznością na temat zmiany zachowania” – mówi. „Interfejs musi być doskonały”.

Jednym z problemów jest ponowne wykorzystanie wizualizacji na konferencjach prasowych, które zostały zaprojektowane z myślą o urzędnikach i politykach, którzy spędzają większość swojego życia, walcząc z pandemią. Cotgreave twierdzi, że publiczne wersje powinny być prostsze, a prezenterzy powinni poświęcić więcej czasu na ich wyjaśnianie, przy czym dobrą zasadą jest to, że widzowie muszą być w stanie zrozumieć wykres w krótszym czasie, niż jest to potrzebne do udostępnienia go im do obejrzenia. „Nie musisz głupieć, ale musisz zabrać ze sobą publiczność, jeśli jest to skomplikowane” – mówi.

Jednak projektowanie wykresów tak, aby były bardziej dostępne, wiąże się z niebezpieczeństwami. Może to wynikać z niekompetencji, z wykresem nowych przypadków lokalnych najwyraźniej nadawanych przez Fox31, stację telewizyjną z Denver, przy użyciu pionowej osi x, która zaczynała się od 30, a następnie poszła w pół-losowych podziałach, które reprezentowały 10, 30 lub 50 przypadków . Badacz sztucznej inteligencji Yann LeCun nazwał to „śmiecharytmiczną skalą”.

Lepiej zaprojektowane wizualizacje mogą jednak nadal wprowadzać w błąd. W marcu ubiegłego roku działacz kampanii otwartych danych Alice Casey skrytykowała BBC News za wykres słupkowy który pokazał proporcje ludzi umierających z powodu Covid-19 na podstawie wieku, stanu zdrowia i płci, wykorzystując dane dotyczące 44 000 osób w Chinach. Było wyraźnie oznaczone i zawierało źródło danych.

Ale jego pozioma oś Y kończyła się na 15%, z tym odsetkiem pokazanym tylko raz na dole trzech wykresów. W rezultacie słupek wskaźnika śmiertelności 80 i więcej przeszedł prawie na całą szerokość wykresu. „Wizualizacja w pewnym sensie pokazuje, że„ starzy ludzie umierają z powodu Covid ”- mówi Cotgreave.

Zaprojektował alternatywną wersję, która obejmowała zarówno tych, którzy zginęli, jak i tych, którzy przeżyli, co pokazało, że najstarsze są najbardziej zagrożone, ale także pokazało, że przeżyje sześć z siedmiu osób w wieku 80 lat i starszych. „Sposób, w jaki zdecyduję się pokazać dane, wpłynie na twoją interpretację” – mówi. „Ludzie nie zdają sobie z tego sprawy”.

Alternatywny wykres słupkowy Andy’ego Cotgreave’a.

Obawa o to, jak użytkownicy będą interpretować dane, jest powodem, dla którego Biuro Statystyki Narodowej (ONS) zawiera zakresy błędów zarówno w wizualizacjach, jak i komentarzach do cotygodniowego badania infekcji Covid-19, prowadzonego przez uniwersytety w Oksfordzie i Manchesterze, Public Health England oraz organizację charytatywną Wellcome Trust. Badanie opiera się na zestawach testowych wysłanych do losowej próby populacji i jest postrzegane jako jedno z najlepszych źródeł danych na temat pandemii w Wielkiej Brytanii.

Dlatego ci, którzy go używają, w tym ci w rządzie, muszą znać jego ograniczenia – twierdzi Rob Fry, szef ONS ds. Wizualizacji danych. „Na podstawie tych danych podjęto decyzje, które zmieniły życie” – mówi. Dodaje, że słupki błędów pokazują zakres, w którym statystycy są w 95% pewni, że znajduje się prawdziwa liczba, ilustrując jej dokładność. „Świadomość, że ta liczba może być wyższa lub niższa, może wpłynąć na decyzję”.

Fry prowadzi mały zespół wspierający prace związane z wizualizacją danych w ONS. W przypadku większości badań analitycy szkicują wykresy w programie Microsoft Excel, a centralny zespół wydawniczy dostosowuje je przy użyciu bibliotek JavaScript, głównie pochodzących od norweskich specjalistów od wizualizacji Highcharts, a także D3.js i Mapbox GL. Zespół ds. Wizualizacji danych pracuje bezpośrednio nad głośnymi publikacjami, w tym ankietą dotyczącą infekcji Covid-19, a także zapewnia szkolenia i wskazówki.

Zespół radzi pracownikom ONS, aby zastanowili się nad kluczowym przesłaniem wizualizacji i zaprojektowali go na tej podstawie. „Unikniesz pokusy zbytniego wciskania się w wykres” – mówi Fry. Mówią również współpracownikom, aby tworzyli samodzielne wykresy z tytułem i adnotacją, która podkreśla kluczową wiadomość, więc działają one, gdy są używane gdzie indziej. Witryna ONS zachęca do takiego ponownego wykorzystywania, udostępniając łącza do osadzania i pobierania wizualizacji.

ONS publikuje również swoje przewodnik po stylu, pozwalając każdemu korzystać z jego wskazówek. Obejmuje to porady dotyczące doboru kolorów, w tym „zrób to dobrze w czerni i bieli”, aby wykresy były dostępne dla osób całkowicie ślepych na kolory, „nigdy nie powinno się widzieć czerwonego i zielonego”, ponieważ bardziej powszechne rodzaje ślepoty barw utrudniają rozróżnienie między nimi, a „najbezpieczniejszym odcieniem jest niebieski”.

Oprócz Covid-19 zespół Fry pracuje nad automatycznie generowanymi wizualizacjami wysoce zlokalizowanych danych ze Spisu Ludności, który ONS prowadzi w Anglii i Walii w niedzielę 21 marca 2021 r., Chociaż ten „Atlas spisowy” będzie dostępny dopiero w przyszłym roku. W międzyczasie jego prace wizualizujące pandemię oglądają miliony: w ciągu dwóch dni od publikacji zażądano 150 milionów kafelków od interaktywna mapa zgonów, co odpowiada około 10 milionom wyświetleń. „To bardzo wstrząsający pokaz danych, z myślą o wszystkich ludziach i rodzinach odpowiedzialnych za te zgony” – mówi Fry.

Mapy były intensywnie wykorzystywane do wizualizacji Covid-19. Berlińskie narzędzie do tworzenia wykresów Datawrapper twierdzi, że mapy stanowiły 21% wszystkich wizualizacji opublikowanych za pośrednictwem jego systemu w 2020 r., W porównaniu z 10% w 2017 r., Chociaż jest to część długoterminowego trendu, a wykresy liniowe również wzrosły, z 19% w poprzednim lat do 23% w 2020 roku.

Mapy mają swoje własne wyzwania, na przykład czy używać pliku choropleth lub mapa termiczna – gdzie obszary są pokolorowane lub cieniowane na podstawie danych – lub symbole wyśrodkowane w miejscu, takie jak okręgi, których rozmiar jest oparty na danych. „To, co wybierzesz, zależy od pytania, na które próbujesz odpowiedzieć swoim widzom” – mówi Estella Geraghty, dyrektor ds. Medycznych i dyrektor ds. Rozwiązań zdrowotnych w kalifornijskim dostawcy oprogramowania geograficznego. Esri.

Deska rozdzielcza uruchomiona na początku pandemii przez Uniwersytet Johna Hopkinsa w Baltimore użyto czerwonych okręgów, wyśrodkowanych na krajach i stanach USA, o średnicach odzwierciedlających numery przypadków, na czarno-szarej mapie. Surowy projekt pomógł zwiększyć świadomość, ale także pokazał wszystkie przypadki w równym stopniu.

Jest to trudne w przypadku kartogramów, gdy obszary składowe różnią się znacznie pod względem wielkości, a geograficznie małe kraje, takie jak Singapur, są prawie niewidoczne w skali globalnej. Ale może mieć sens w przypadku danych związanych z decyzjami politycznymi. „Jeśli jest to kwestia polityczna, prawdopodobnie chcesz mieć granice polityczne” – mówi Geraghty. „Wróć do: co próbuję przekazać?”

Choroplety były szeroko stosowane w Wielkiej Brytanii i innych krajach do komunikowania wskaźników przypadków Covid-19, ale najwyraźniej niewielkie wybory mogą zmienić to, co przekazują. Podczas konferencji prasowej na Halloween, Whitty użył mapy wskaźników zachorowań w Anglii, która pokazała dużą część północnej i środkowej Anglii w jaskrawym, ciemnofioletowym kolorze.

Ciemnofioletowa mapa Chrisa Whitty’ego (po lewej).

James Cheshire, profesor informacji geograficznej i kartografii na University College London, wskazał, że obszary w kolorze ciemnofioletowym wykazywały od 200 do 740 przypadków zachorowań tygodniowo na 100 000 osób, podczas gdy pierwsze dwa kolory obejmowały wąskie zakresy zaledwie od 0 do 25 i od 25 do 50.

„Wybór dokonany dla tej mapy przesadnie podkreśla małe skoki w małych ilościach kosztem dużych skoków w dużych ilościach” – napisał. Jego przeprojektowanie mapy z równymi przerwami kolorów w oparciu o pełny zakres współczynników skrzynek umieścił większość Anglii w najjaśniejszych odcieniach, z tylko kilkoma obszarami na północy w najbardziej niepokojących kolorach.

Przeprojektowanie mapy przez Jamesa Cheshire (na dole po lewej)

Jednym ze sposobów, aby mapy działały lepiej, jest podejście mieszane, publikowanie ich z tabelami, wykresami słupkowymi i automatycznie generowanymi komentarzami, coś, co kalifornijski dostawca analizy danych Tibco Software zrobił ze swoim Deska rozdzielcza Covid-19. Główny analityk, Michael O’Connor, mówi, że zapobiega to problemom z kartogramami, takimi jak zagubienie danych o małych obszarach. Pulpit nawigacyjny wykorzystuje również ciemniejsze kolory, aby wyróżnić dane z poprzedniego tygodnia na kilku wykresach.

Potrzeba przekazywania liczb na Covid-19 oznaczała stromą krzywą uczenia się dla tych, którzy używają do tego wykresów. „Większość dużych pulpitów nawigacyjnych i wizualizacji koronawirusa zostało z czasem znacznie ulepszonych – a inni skopiowali swoje pomysły” – mówi Lisa Charlotte Rost, projektantka, która pisze Blog Datawrapper. „W dzisiejszych czasach bardzo rzadko widzę wizualizację w redakcji dowolnej wielkości, która przyprawia mnie o dreszcze”.

Dodaje jednak, że osoby wizualizujące dane dotyczące pandemii muszą pamiętać, że liczby oznaczają ludzi. Na zestawie automatycznie aktualizowanych wykresów, które Datawrapper wygenerował od marca ubiegłego roku, zgony są pokazane na czarno, aby odzwierciedlić szacunek, przypadki są na niebiesko, a odzyskanie na zielono. „Myślę, że niektórzy twórcy wizualizacji danych nie zastanawiają się wystarczająco, jak ich wizualizacja Covid-19 wygląda dla ludzi, którzy stracili kogoś na tę chorobę lub którzy sami ją zapadli” – mówi Rost.





Source link

Advertisment

Więcej

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

Advertisment

Podobne

Advertisment

Najnowsze

YMTC twierdzi, że 3D QLC NAND oferuje wytrzymałość porównywalną z 3D TLC NAND

Jak podaje ITHome, firma twierdzi, że chipy flash YMTC X3-6070 3D QLC NAND oferują wytrzymałość porównywalną z chipami flash 3D TLC NAND oferowanych...

Praktyczne: jak korzystać z SharePlay w CarPlay z Apple Music

Jedna z dużych zmian w iOS 17 dla CarPlay użytkowników jest dodanie obsługi SharePlay dla Apple Music. Dzięki tej funkcji każda osoba...

Rozdanie TechPowerUp-Arctic: nie przegap szansy na wygranie kombinacji Coolers+Fan+TIM

Jeśli przegapiłeś, rozdanie TechPowerUp x Arctic trwa od 22 marca. Aż sześciu szczęśliwych zwycięzców może otrzymać kombinacje chłodnic procesora Arctic, wentylatorów obudowych i...
Advertisment