Od stylometrii do filogenezy: w kierunku badania historii gatunków na dużą skalę
Oleg Sobchuk (Max Planck Institute for the Science of Human History)
Drzewa i sieci filogenetyczne są kluczowe dla biologii ewolucyjnej, a coraz ważniejsze dla badań nad ewolucją kulturową: języków, folkloru czy tradycji muzycznych. Ale czy możemy wykorzystać filogenezy w badaniach innego przedmiotu – literatury współczesnej? Wyobraźmy sobie „drzewo literatury”, którego gałęziami są różne grupy tematyczne, takie jak gatunki. W tym wykładzie przedstawię pracę zmierzającą do tego celu.Jak konstruować filogenezę? W ewolucji kulturowej zwykłe podejście obejmuje ręczne kodowanie pewnych cech elementów kulturowych (np. obecność lub brak określonych wydarzeń w bajce ludowej) i późniejszy pomiar podobieństwa między listami cech. Takie podejście nie sprawdziłoby się we współczesnej literaturze: jej większy rozmiar sprawia, że ręczne kodowanie jest niezwykle pracochłonne. Zamiast tego możemy jednak zmierzyć podobieństwo między książkami algorytmicznie – zapożyczając spostrzeżenia i narzędzia ze stylometrii obliczeniowej. Ale które algorytmy najlepiej uchwycą tematyczne (nie stylistyczne!) podobieństwo między książkami? Aby to ustalić, przeprowadziliśmy badanie eksperymentalne, którego wstępne wyniki zostaną przedstawione w tym wystąpieniu.