Automatyzacja analizy monet: AI dla Uniwersytetu Warszawskiego
Kontekst biznesowy
Uniwersytet Warszawski prowadzi zaawansowane badania numizmatyczne nad monetami rzymskimi i bizantyjskimi, gdzie kluczowe jest wiarygodne łączenie stempli menniczych. Dotychczasowe metody manualne były czasochłonne, podatne na błędy i trudne do skalowania w warunkach rosnących zbiorów danych.
Skala przedsięwzięcia obejmowała analizę ponad 7 000 monet przypisywanych niemal 50 władcom, przy dużym zróżnicowaniu jakości i reprezentacji materiału. We współpracy z Leaware uczelnia postawiła na stworzenie skalowalnej aplikacji webowej opartej na uczeniu maszynowym, aby zwiększyć precyzję, przepustowość i powtarzalność analiz oraz pogłębić interpretacje dotyczące dawnych systemów gospodarczych.
Wyzwanie
Największym wyzwaniem był wysoce niejednorodny zbiór danych: monety różniły się stopniem zużycia, oświetleniem, tłem zdjęć i detalami ikonograficznymi. Dodatkowo rozkład klas był nierównomierny między władcami, co utrudniało skuteczne trenowanie klasycznych modeli CNN i zwiększało ryzyko przeuczenia.
Zespół musiał zbudować rozwiązanie zdolne do wiarygodnego łączenia stempli w warunkach szumu i wartości odstających, ograniczając wpływ subiektywnych decyzji badaczy. Wymagana była powtarzalność wyników, gotowość do pracy w przeglądarce, wysoka wydajność oraz możliwość stałego doskonalenia wraz z dopływem nowych danych, przy zachowaniu standardów transparentności niezbędnych w pracy naukowej.
Rozwiązanie
Powstała aplikacja webowa hostowana na Azure z interfejsem w Angular i zapleczem C# .NET, w której komponenty uczenia maszynowego zaimplementowano w Python. Pipeline przetwarzania wstępnego obejmuje m.in. usuwanie tła, konwersję do skali szarości i kadrowanie, co normalizuje wejścia i podnosi jakość sygnału dla modeli.
Ekstrakcję cech powierzono wstępnie wytrenowanemu modelowi CNN, a identyfikację powiązań stempli oparto na hybrydzie metod nadzorowanych i nienadzorowanych. Zastosowano dwuetapowe grupowanie z redukcją wymiarów przy użyciu PCA, a następnie algorytmy K-Means do formowania klastrów, DBSCAN do zarządzania szumem i wartościami odstającymi oraz Gaussian Mixtures do wychwytywania subtelnych wzorców.
Architektura została zaprojektowana z myślą o skalowalności i ciągłym doskonaleniu: system uczy się na nowych danych i automatyzuje powtarzalne czynności, skracając czas analizy i zwiększając precyzję. Badacze zyskują spójny warsztat pracy i mogą skupić się na interpretacji wyników, wyznaczając nowy standard cyfrowej analizy numizmatycznej.
