Koncepcja utworu
W 1948 roku Claude E. Shannon opublikował pracę Matematyczna teoria komunikacji, w której zaproponował podstawy współczesnej teorii informacji i opisał systemem binarnym, czyli ciągiem zer i jedynek, zależności warunkowe między literami i słowami w języku angielskim. Przy okazji rozważań nad pojęciem entropii przedstawił model generatora tekstowego budującego nowe teksty na podstawie korpusu, ale opierając się nie na niezależnych zmiennych losowych, a na prawdopodobieństwie warunkowym. Wykorzystał do tego koncepcję łańcuchów Markova, czyli ciągu zdarzeń, w którym prawdopodobieństwo każdego zdarzenia zależy tylko od zdarzenia poprzedniego.
Rozważania Shannona dały podwaliny pod współczesne teorie informacji, a zastosowanie językowych modeli łańcuchów Markova przyczyniło się do gwałtownego rozwoju dziedziny komputerowego przetwarzania tekstów.
Minęło siedemdziesiąt lat od publikacji artykułu i łańcuchy Markova możemy znaleźć wszędzie: w telefonach ułatwiają pisanie wiadomości prywatnych, podpowiadając kolejne słowo na podstawie wbudowanego słownika i historii dotychczasowych konwersacji; usprawniają procesy automatycznego rozpoznawania mowy i maszynowego tłumaczenia tekstów. W stylometrii zwiększają skuteczność analizy statystycznej korpusów i wykrywania autorstwa książek. Połączone z maszynowym uczeniem – wspomagają budowanie między innymi czatbotów.
Ta rewolucja ma również swoje ciemne strony. Zaawansowane technologie przetwarzania dużych korpusów tekstów połączone z profilowaniem użytkowników, zbieraniem danych o ich aktywności, umożliwiło – na wcześniej niespotykaną skalę – manipulowanie społeczeństwem. Rewolucja Web 2.0, która z jednej strony miała zdecentralizować ośrodki nadawcze, a z drugiej dać głos każdemu mieszkańcowi cyfrowego świata, została wykorzystana do: tworzenia behawioralnych modeli statystycznych i na ich podstawie automatycznego dostosowywania komunikatów reklamowych, czy generowania sztucznych bytów, fake’owych profili i botów rozpowszechniających nieprawdziwe informacje w celu wpłynięcia na głosujących.
Wykorzystanie technologii językowych do szerzenia dezinformacji było jedną z inspiracji do odzwierciedlania zanieczyszczenia powietrza na przestrzeń internetową. W utworze przejęto mechanizmy, którymi posługują się podmioty generujące fake’owe treści (oczywiście w bardzo okrojonej wersji). Aplikacja, po zainstalowaniu, zbiera informacje o użytkowniku: z każdej przeglądanej strony kopiuje zdania, a następnie posiłkuje się nimi do modyfikowania aktualnie otwartej witryny przy użyciu prawdopodobieństwa warunkowego – matematycznego modelu obliczającego prawdopodobieństwo wystąpienia zdarzenia pod warunkiem zajścia zdarzenia poprzedniego.
Zanieczyszczenie powietrza – dane, którymi oddychamy
Głównym aktorem biorącym udział w utworze jest smog – mieszanina mgły, dymu i spalin; chmura pyłów i związków chemicznych szkodliwych dla zdrowia człowieka, zwierząt i środowiska naturalnego. W przeciwieństwie do bezbarwnego dwutlenku węgla współodpowiedzialnego za procesy globalnego ocieplenia smog jest widoczny. W sezonie grzewczym powietrze traci swoją przezroczystość. Staje się nośnikiem informacji o stężeniu szkodliwych substancji, wiadomością, której adresatem są wszyscy mieszkańcy miasta. Nawiązując do słów Jussi Parikka – przeistacza się w wizualne medium, którym oddychamy:
„Air pollution is in many ways visual media you breathe. This is the elemental media condition across the aesthetic landscapes of contemporary industrial and post-industrial life. An urban screen is a residue of the transport cultures of automobiles as well as other sources of fossil fuel culture.”
Od wielu lat słyszymy, że za wysokie pomiary szkodliwych substancji odpowiedzialni są ludzie palący w piecach odpadami i złej jakości węglem, ale problem jest o wiele bardziej skomplikowany. Na stan jakości powietrza wpływ mają lata dzikiej zabudowy kanałów przewietrzania miasta, wycinanie naturalnych płuc metropolii: skupisk drzew, przy równoczesnym braku inicjatyw budowy parków. Za pięćdziesiąt procent skażenia lokalnej atmosfery odpowiada pokłosie rewolucji przemysłowej opartej na węglu i ropie oraz skutki masowej produkcji, między innymi transport drogowy, procesy spalania w przemyśle i transformacji energii, a także procesy produkcyjne. Są to lata systemowych zaniedbań i omijania problemu przez władze miast.
Korpus
Utwór po zainstalowaniu towarzyszy przeglądaniu stron internetowych i kolekcjonuje zdania z odwiedzonych witryn. Po zgromadzeniu 20 000 ciągów tekstowych aplikacja rozpoczyna działanie.
Cięcie zdań
Przy przekroczeniu poziomu 25 uq/m3 pyłu zawieszonego PM 10 – mechanizm wstrzykuje w otwartą stronę fragmenty treści zaciągniętych z wcześniej odwiedzonych witryn. Metoda transformacji opiera się na połączeniu ze sobą dwóch ciągów tekstowych: zdania z aktualnie przeglądanej strony ze zdaniem archiwalnym znajdującym się w korpusie. Lokalizacja cięcia wyznaczana jest przez miejsce wspólne – sekwencję dwóch wyrazów, która występuje zarówno w pierwszym, jak i w drugim zdaniu.
PM 10 i PM 2.5
Stężenie pyłu zawieszonego PM 10 w powietrzu odpowiada za liczbę zanieczyszczonych zdań na przeglądanej stronie. a poziom pyłu zawieszonego PM 2.5 wpływa na dobór treści, które zmodyfikują zdanie źródłowe, wedle zasady im większe skażenie powietrza, tym wybierane są mniej prawdopodobne elementy.