Wojna szyfrów

W 1872 roku brytyjski generał Alexander Cunningham, badając teren w północnych Indiach kontrolowanych przez Brytyjczyków, natknął się na coś osobliwego. Zakopany w ruinach, odkrył mały, kwadratowy kawałek czegoś, co opisał jako gładki, czarny, niepolerowany kamień z wyrytymi dziwnymi symbolami – liniami, zazębiającymi się owalami, czymś przypominającym rybę – i czymś, co wyglądało jak wyryty pod spodem byk. Generał, nie rozpoznając symboli i uznając, że byk nie jest podobny do innych indiańskich zwierząt, założył, że artefakt nie jest indiański, ale jest jakimś zagubionym obcym znakiem. Kamień ten, wraz z podobnymi znalezionymi w ciągu następnych kilku lat, trafił do British Museum. W latach dwudziestych XX wieku odnaleziono wiele innych artefaktów, znanych wówczas jako pieczęcie, i zidentyfikowano je jako dowody istnienia kultury liczącej 4000 lat, znanej obecnie jako cywilizacja doliny Indusu, najstarsza znana do tej pory cywilizacja indyjska.

Od tamtej pory odkryto jeszcze tysiące takich maleńkich pieczęci. Większość z nich posiada jedną linię symboli na górze z obrazem, zwykle zwierzęcia, wyrzeźbionym poniżej. Wśród przedstawionych zwierząt są byki, nosorożce, słonie i, co zastanawiające, jednorożce. Zostały one znalezione na obszarze obejmującym dzisiejsze Indie i Pakistan oraz wzdłuż szlaków handlowych, przy czym pieczęcie znaleziono aż do dzisiejszego Iraku. Symbole te, począwszy od geometrycznych wzorów, a skończywszy na przedstawieniach ryb lub słoików, znaleziono również na znakach, tabliczkach, miedzianych płytach, narzędziach i ceramice.

Mimo że mamy teraz tysiące przykładów tych symboli, mamy bardzo niewielkie pojęcie, co one oznaczają. Ponad sto lat po odkryciu Cunninghama, pieczęcie pozostają nierozszyfrowane, ich przesłanie jest dla nas stracone. Czy są to litery jakiegoś starożytnego języka? A może są to tylko symbole religijne, rodzinne lub polityczne? Te gorące pytania wywołały spory wśród naukowców i zaostrzyły kulturową rywalizację o to, kto może uznać pismo za swoje dziedzictwo. Ale nowe prace badaczy wykorzystujących wyrafinowane algorytmy, uczenie maszynowe, a nawet nauki kognitywne, pomagają nam w końcu dotrzeć do krawędzi złamania pisma Indusu.

Steatytowa pieczęć z garbatym bykiem, Dolina Indusu, Mohenjo-Daro, 2500-2000 p.n.e.
Fot. CM Dixon/Print Collector/Getty Images

Obejmująca okres od 2600 do 1900 r. p.n.e. cywilizacja doliny Indusu była większa niż cywilizacje egipska i mezopotamska, obejmując ponad 1 milion kilometrów kwadratowych, które rozciągały się na terenie dzisiejszych Indii i Pakistanu. Charakteryzowała się wyrafinowaną infrastrukturą, w tym zaawansowaną gospodarką wodną i systemami odwadniania, dobrze zorganizowanymi miastami z planem ulic i jednymi z pierwszych znanych toalet. Indusi byli również gospodarzami ogromnej sieci handlowej, podróżując aż do Zatoki Perskiej. Pierwsze ślady Indusów zostały odkryte w połowie XIX wieku, kiedy to robotnicy budowlani mający połączyć dwa miasta na terenie dzisiejszego Pakistanu natrafili na ogromne ilości cegieł wśród starych ruin. Wykorzystano je do budowy prawie 100 mil torów kolejowych. Minęło trochę czasu, zanim archeolodzy zdali sobie sprawę, że te cegły pochodzą z cywilizacji doliny Indusu.

Archeologiczne wykopaliska ujawniły niewiele: co dziwne i raczej niespójne z innymi cywilizacjami epoki brązu, nie ma dowodów na istnienie potężnych władców ani ikon religijnych. Nie znaleźliśmy żadnych pałaców ani wielkich posągów, nic w rodzaju zigguratów z Mezopotamii czy piramid w Egipcie. Mamy też bardzo niewiele śladów działań wojennych, nie licząc kilku wykopanych grotów włóczni i strzał.

W rzeczywistości nie wiemy prawie nic. „Gdybyś zapytał archeologa, nie byłby w stanie powiedzieć, skąd z całą pewnością pochodzi cywilizacja Indusu, jak się skończyła lub co robiła, kiedy była w pobliżu” – mówi epigrafik Bryan Wells. Dla nas, Cywilizacja Indusu jest tak tajemnicza jak jej symbole.

Ta pieczęć pochodzi z Cywilizacji Doliny Indusu i obecnie znajduje się w Muzeum Narodowym w New Delhi.
Fot. Angelo Hornak / Corbis via Getty Images

Symbole Indusu są częścią powoli kurczącej się listy nierozszyfrowanych starożytnych skryptów. Uczeni wciąż pracują nad wieloma systemami pisma znalezionymi na całym świecie, w tym Linear A i kreteńskie hieroglify (dwa pisma ze starożytnej Grecji), Proto-Elamit (pismo z najstarszej znanej cywilizacji irańskiej), garść pism mezoamerykańskich i pismo Rongorongo z Wyspy Wielkanocnej. Niektóre symbole neolityczne, nie mające znanych potomków językowych, mogą nigdy nie zostać rozszyfrowane. Inne starożytne skrypty, takie jak Linear B, wczesny prekursor greki, zostały ostatecznie rozszyfrowane poprzez nakreślenie znaków, ustalenie, które z nich oznaczają początek zdania, a które jego koniec, w jaki sposób różne sylaby zmieniają znaczenie słowa oraz jak spółgłoski i samogłoski są zorganizowane w zdaniu. Nie jest to podobne do tego, co przedstawiono w filmie sci-fi Arrival – szukanie wzorców, sprawdzanie teorii, mnóstwo prób i błędów. Choć na badaczach Indusu ciąży nieco mniejsza presja niż na lingwistach z Arrival – ludzie nie martwią się tak bardzo o starożytne cywilizacje, jak o najeźdźców z kosmosu.

W przeszłości większość tej pracy wykonywano ręcznie. Dla Linear B, fonetyczne wykresy żmudnie doprowadziły w końcu do rozszyfrowania tego języka. Podobne podejście próbowano zastosować również w przypadku pisma Indusu. W latach trzydziestych XX wieku uczony G.R. Hunter opracował klastry znaków, które pozwoliły mu zrozumieć część struktury zawartej w piśmie. Ale Hunterowi nie udało się odblokować kodu.

„Jest kilka powodów, dla których rozszyfrowanie tego pisma było zbyt trudne”, mówi Nisha Yadav, badaczka w Departamencie Astronomii i Astrofizyki w Tata Institute of Fundamental Research w Bombaju, w Indiach. „Pierwszym z nich jest to, że teksty są naprawdę krótkie”. Przeciętny artefakt ma tylko pięć symboli. Najdłuższy wydobyty do tej pory przykład ma ich 17. Tak krótkie teksty sprawiają, że odkrycie struktury pisma jest trudne. „Problem komplikuje fakt, że nie znamy języka, który leżał u jego podstaw” – mówi Rajesh Rao, dyrektor Centrum Inżynierii Neuronów Sensorycznych Narodowej Fundacji Naukowej i profesor na Wydziale Informatyki i Inżynierii Uniwersytetu Waszyngtońskiego. „Nie znamy nawet rodziny językowej, którą posługiwali się ludzie w tamtym regionie w tamtym czasie”. A kiedy cywilizacja się skończyła, wygląda na to, że jej kultura i system pisma również. „Nie mamy żadnej kontynuacji tradycji kulturowej”, mówi Yadav. Archeolodzy nie znaleźli jeszcze wielojęzycznego tekstu jak Kamień z Rosetty, który był kluczem do rozszyfrowania egipskich hieroglifów.

Podczas gdy nasze zrozumienie pisma Indusu pozostaje minimalne, to z pewnością nie z braku prób. „Często nazywa się go najbardziej rozszyfrowanym pismem, ponieważ istnieje około 100 odszyfrowań” – mówi Wells – „ale oczywiście nikt nie lubi żadnego z nich”. Wiele osób twierdziło, że złamało pismo, często zapewniając, że jest to prekursor późniejszego języka, ale żadne z rozszyfrowań się nie utrzymało. „Przypuszczam, że najbardziej dziwacznym z nich jest tantryczny guru, który medytował i nawiązał kontakt z wielkim zaświatem, który powiedział mu, co mówi pismo” – mówi Wells.

Steatytowa pieczęć ze słoniem, Dolina Indusu, Mohenjo-Daro, 2500-2000 p.n.e.
Fot. CM Dixon / Print Collector / Getty Images

Aby rozszyfrować pismo Indusu, ważne jest, aby ustalić, na co patrzymy – czy symbole oznaczają język, czy też, jak słupy totemowe lub herby, po prostu reprezentacje takich rzeczy, jak nazwiska rodowe lub bogowie. „Biorąc pod uwagę ilość danych, którymi dysponujemy, nie możemy wydać żadnego stanowczego oświadczenia na temat treści skryptu” – mówi Yadav. „Myślę, że to, co zrobiliśmy, to próbowaliśmy poskładać razem wszystkie dowody, jakie mamy, aby zobaczyć, czy prowadzą nas w jedną lub drugą stronę”, mówi Rao. „I myślę, że, przynajmniej z pracy, którą wykonaliśmy, wydaje się, że jest to bardziej ogon w kierunku hipotezy językowej niż nie”. Większość uczonych raczej się zgadza.

W 2009 roku, Rao opublikował badanie, które zbadało sekwencyjną strukturę pisma Indusu, lub jak prawdopodobne jest, że poszczególne symbole następują po sobie lub poprzedzają inne symbole. W większości systemów językowych, słowa lub symbole następują po sobie w sposób na wpół przewidywalny. Istnieją pewne dyktujące struktury zdań, ale także spora doza elastyczności. Naukowcy nazywają tę półprzewidywalność „entropią warunkową”. Rao i jego koledzy obliczyli, jak prawdopodobne było, że jeden symbol następował po drugim w zamierzonej kolejności. „To, co nas interesowało, to czy możemy wydedukować jakieś statystyczne prawidłowości lub strukturę”, mówi Rao, „w zasadzie wykluczając, że te symbole były tylko zestawieniami symboli i że faktycznie istniały jakieś reguły lub wzory.”

Porównali oni entropię warunkową pisma Indusu do znanych systemów językowych, takich jak wedyjski sanskryt, i znanych systemów niejęzykowych, takich jak sekwencje ludzkiego DNA, i odkryli, że pismo Indusu było znacznie bardziej podobne do systemów językowych. „Nie jest to więc dowód na to, że symbole kodują język, ale jest to dodatkowy dowód na to, że symbole te nie są przypadkowymi zestawieniami arbitralnych symboli” – mówi Rao – „a ich wzorce są zgodne z tymi, których można by się spodziewać, gdyby symbole kodowały język.”

W kolejnym artykule Rao i jego koledzy wzięli wszystkie znane symbole Indusu i spojrzeli na to, gdzie znajdują się one w napisach, w których zostały znalezione. Ta statystyczna technika, znana jako model Markowa, była w stanie wskazać takie szczegóły jak to, które symbole najprawdopodobniej rozpoczynają tekst, które najprawdopodobniej go kończą, które symbole mogą się powtarzać, które symbole często występują w parach i które symbole mają tendencję do poprzedzania lub podążania za konkretnym symbolem. Model Markowa jest również przydatny, gdy chodzi o niekompletne inskrypcje. Wiele artefaktów znajduje się uszkodzonych, z brakującymi lub nieczytelnymi częściami napisów, a model Markowa może pomóc wypełnić te luki. „Można spróbować uzupełnić brakujące symbole w oparciu o statystyki innych sekwencji, które są kompletne”, wyjaśnia Rao.

Yadav przeprowadził podobną analizę przy użyciu innego typu modelu Markowa, znanego jako analiza n-gramów. Przykładem n-gramu w pracy jest pasek wyszukiwania Google. Gdy zaczynasz wpisywać zapytanie, pasek wyszukiwania wypełnia się sugestiami opartymi na tym, co wpisałeś, a gdy wpisujesz więcej słów, sugestie zmieniają się, aby dopasować się do wpisanego tekstu. Yadav i jej koledzy przyjrzeli się zarówno prawdopodobieństwu konkretnego symbolu, biorąc pod uwagę symbol go poprzedzający – bigram – oraz prawdopodobieństwu konkretnego symbolu, biorąc pod uwagę dwa symbole go poprzedzające – trygram. Uzyskane wzory sugerowały, że skrypt ma składnię, wspierając ideę, że jest językowy. I podobnie jak model Markowa, był on również w stanie wypełnić prawdopodobne symbole, gdy inskrypcjom brakowało części tekstu.

Te dwie techniki odkryły również coś nieoczekiwanego: artefakty znalezione w różnych regionach przedstawiały wyraźnie różne sekwencje symboli. Tak więc pieczęcie znalezione na terenie dzisiejszego Iraku mają sekwencje symboli, które różnią się od tych znalezionych w Indiach i Pakistanie. „To sugeruje, że być może te same symbole były tam używane do kodowania lokalnego języka” – mówi Rao. „To tak jakby eksperymentowali z pismem”, mówi Yadav. „Używali tego samego skryptu do pisania innego języka lub innych treści.”

Zapewnienie kontekstu antropologicznego i archeologicznego artefaktom, które posiadamy, pomogłoby również w lepszym zrozumieniu skryptu. Gabriel Recchia, pracownik naukowy w Cambridge Centre for Digital Knowledge na Uniwersytecie w Cambridge, opublikował metodę, która miała na celu właśnie to zrobić. W poprzednich badaniach kognitywistycznych on i jego koledzy wykazali, że można oszacować odległości między miastami na podstawie tego, jak często są one wymieniane razem w piśmie. Tak było w przypadku miast amerykańskich na podstawie ich współwystępowania w krajowych gazetach, miast bliskowschodnich i chińskich na podstawie tekstów arabskich i chińskich, a nawet miast we Władcy Pierścieni. Recchia zastosował ten pomysł do pisma Indusu, biorąc symbole z artefaktów, których pochodzenie było znane i używając ich do przewidywania, skąd pochodzą artefakty nieznanego pochodzenia z podobnymi symbolami. Recchia wyjaśnia, że wersja tej metody, która uwzględnia znacznie bardziej szczegółowe informacje, mogłaby być bardzo użyteczna. „Istnieją znaczące różnice pomiędzy artefaktami, które pojawiają się w różnych sublokacjach w obrębie stanowiska i to jest to, co jest znacznie częściej nieznane, a w wielu przypadkach mogłoby dostarczyć bardziej użytecznych informacji” – mówi Recchia. „Czy znaleziono to na śmietniku razem z wieloma innymi pieczęciami, czy też było to coś, co zostało przywiezione z innego miejsca?”

W międzyczasie Ronojoy Adhikari, profesor fizyki w Instytucie Nauk Matematycznych w Chennai w Indiach, i jego współpracownik naukowy Satish Palaniappan pracują nad programem, który może dokładnie wyodrębnić symbole ze zdjęcia artefaktu z Indusu. „Jeśli archeolog udaje się na stanowisko w Indusie i znajduje nową pieczęć, potrzeba dużo czasu, aby ją odwzorować i dodać do bazy danych, jeśli jest to robione ręcznie” – mówi Palaniappan. „W naszym przypadku ostatecznym celem jest tylko zdjęcie danej pieczęci, aby móc automatycznie wyodrębnić regiony tekstowe”. On i Adhikari pracują nad zbudowaniem aplikacji, którą archeolodzy mogą przynieść na miejsce na urządzeniu mobilnym, które natychmiast wyodrębni nowe inskrypcje.

UNSPECIFIED – CIRCA 1988: Indus Art – 2500 BC – Kamienna (steatytowa) pieczęć z doliny Indusu.
Foto By DEA / G. NIMATALLAH / De Agostini / Getty Images

Ale nie wszyscy zgadzają się, że pismo jest językiem. W 2004 r. praca napisana przez neurobiologa kulturowego i historyka porównawczego Steve’a Farmera, teoretyka obliczeniowego Richarda Sproata i filologa Michaela Witzela twierdziła, że pismo Indusu nie jest językiem. Autorzy posunęli się nawet do tego, że zaoferowali nagrodę w wysokości 10 000 dolarów dla każdego, kto znajdzie długą inskrypcję z Indusu. „Postrzeganie symboli Indusu jako części 'nie rozszyfrowanego pisma' nie jest poglądem, w który wierzy ktokolwiek spoza wysoce upolitycznionego świata Indii” – powiedział Farmer w e-mailu. Po opublikowaniu ich stanowiska w sprawie pisma, Sproat napisał dwie prace, które badały techniki entropii warunkowej stosowane przez Rao i kolegów, jak również podobne techniki stosowane przez inną grupę badającą symbole piktyjskie, inny starożytny system pisma. Sproat doszedł w nich do wniosku, że miara entropii warunkowej nie jest użyteczną techniką. „Co ci to mówi? Mówi ci, że nie jest całkowicie sztywna. Mówi ci, że nie jest całkowicie losowa. To już wiedzieliśmy. To po prostu nie jest informatywne” – mówi Sproat. „Nic ci to nie mówi.”

„Samo znalezienie struktury w grupie symboli z pewnością nie oznacza, że znalazłeś dowód na to, że te symbole kodują język. Nawet symbole heraldyczne, znaki astrologiczne czy ciągi medali harcerskich mają w sobie strukturę” – mówi Farmer. W odpowiedzi na prace Sproata, zarówno Rao i jego współpracownicy, jak i autorzy kwestionowanego przez Sproata badania symboli piktyjskich napisali odpowiedzi, w których odnieśli się do jego zastrzeżeń. Sproat, z kolei, napisał odpowiedź na odpowiedź.

„Lepiej by było, gdybyś uzyskał poradę medyczną od swojego śmieciarza, niż gdybyś czerpał pomysły na temat pisma Indusów ze słuchania Steve’a Farmera”, mówi Wells. „Żaden z trzech autorów nie ma dyplomu z archeologii, epigrafiki ani niczego, co miałoby związek ze starożytnym pismem. Ich podstawowy podtekst brzmi: 'Wszyscy jesteśmy tacy genialni, a nie potrafimy tego rozszyfrować, więc to nie może być pismo'. To niedorzeczne.” Wells porównuje fact-checking Farmera do fact-checkingu Donalda Trumpa. „Musisz sprawdzać każdą rzecz, którą mówi, ponieważ w większości jest ona błędna.”

A wołowina Wellsa z Witzlem sięga aż do jego pracy doktorskiej na temat pisma Indusów, którą Witzel próbował zablokować, według Wellsa. Później, podczas eskortowania Witzela przez Indie, Wells pokazał mu prezentację PowerPoint zatytułowaną „Dziesięć powodów, dla których nie wiesz, o czym mówisz”, siedząc w tylnej części taksówki.

Jedną rzeczą, co do której Rao i Sproat się zgadzają, jest to, że jeśli okaże się, że pismo Indusu nie koduje języka, może to być jeszcze bardziej interesujące. „Wiemy dużo o starożytnych cywilizacjach, które miały pismo, ale wiemy dużo mniej o cywilizacjach, którym pisma brakowało” – mówi Sproat. „I jeśli był to jakiś ogólny system nielingwistyczny, w pewnym sensie, byłoby to o wiele bardziej interesujące niż gdyby był to tylko jakiś rodzaj pisma.”

Rao uważa również, że były pewne niuanse jego pracy, które zostały utracone w debacie. „To była interesująca intelektualna debata z nimi i mam nadzieję, że teraz osiągnęliśmy rozejm”, mówi Rao, śmiejąc się. „Mam nadzieję, że nie będzie to debata ciągnąca się przez całe życie, ale myślę, że do tej pory zrobiliśmy co w naszej mocy po obu stronach. Jestem zdecydowanie optymistą i myślę, że będziemy mieli dużo lepsze zrozumienie pisma Indusu w ten czy inny sposób, lingwistyczny czy nie.”

Poza tą debatą, postęp w deszyfrowaniu jest również zagrożony przez współczesną politykę. W Indiach, różne frakcje walczą o to, czyj język i kultura wywodzą się z cywilizacji doliny Indusu. Na północy znajduje się region sanskrytu, na południu region drawidyjski, a pośrodku plemiona posługujące się językami plemiennymi. „Twierdzą, że ktokolwiek wywodzi się od ludzi, którzy napisali pismo Indusu, jest prawdziwym spadkobiercą Indii” – mówi Wells. „Spierają się więc o to z nowoczesnego, politycznego punktu widzenia. Znam ludzi, którzy otrzymali groźby śmierci za mówienie, że to nie sanskryt lub mówienie, że to nie drawidyjski.” A ponieważ cywilizacja doliny Indusu rozciągała się na terenie dzisiejszych Indii i Pakistanu, współczesne napięcia między tymi dwoma krajami krwawią na studia nad Indusem. Fotograficzne kolekcje artefaktów z Indusu są publikowane w dwóch oddzielnych tomach – jeden dla artefaktów znalezionych w Indiach, a drugi dla tych znalezionych w Pakistanie.

Innym wyzwaniem dla rozszyfrowania pisma jest klasyczne wyzwanie: pieniądze. Wells uważa, że dopóki uniwersytety i agencje finansujące nie podejmą wspólnego wysiłku w celu wspierania badań nad pismem Indusu, niewiele uda się osiągnąć. „To musi być wspólny wysiłek, musi być finansowany i musi mieć swój dom” – mówi Wells. Ze swojej strony Wells jest gospodarzem drugiego dorocznego spotkania poświęconego pismu induskiemu, które odbędzie się w marcu tego roku w Kolumbii Brytyjskiej. I jeśli nic więcej, nagroda w wysokości 10 000 dolarów jest w grze tak długo, jak Farmer żyje.

Nie mamy jeszcze odcyfrowania, ale Rao wierzy, że dopóki nie znajdziemy dłuższych próbek lub wielojęzycznego tekstu, strategie statystyczne są naszym najlepszym wyborem. Wells twierdzi, że postęp będzie zależał od współpracy. „Praca zespołowa – interdyscyplinarna, wielopokoleniowa, prawdopodobnie – im więcej nad tym pracujemy, tym większy czynimy postęp”. Wells i jego koledzy poczynili pewne postępy i planują przedstawić je na spotkaniu w marcu tego roku. Ich ustalenia i inne prace przedstawione na spotkaniu powinny być dostępne publicznie w kwietniu, opublikowane jako Proceedings of the Second International Meeting on Indus Epigraphy. W międzyczasie każdy, kto pracuje nad tym pismem, może przyczynić się do powstania strony internetowej Wellsa, na której znajdują się wszystkie znane symbole i różne narzędzia analityczne.

Pytany o Arrival i o to, czy umiejętność odszyfrowywania pism może pewnego dnia uratować świat, Rao śmieje się. „Cóż,” mówi, „zależy od sytuacji.”

Nauka

Dane skorygowane AstraZeneca pokazują, że szczepionka COVID-.19 szczepionka 76 procent skuteczna

Nauka

Nowy banknot brytyjski o nominale 50 funtów świętuje Alana Turinga z mnóstwem geekowskich jaj wielkanocnych

Nauka

Nowy obraz czarnej dziury pokazuje wir magnetycznego chaosu

Zobacz wszystkie historie w dziale Nauka

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *