Artykuł dr Jacka Betleji zamieszczony w Gazecie Wyborczej
https://wyborcza.pl/7,75400,29866993,pt ... entsAnchor Sposób działania programu sztucznej inteligencji Merlin dla ptasiarzy jest wprost rewolucyjny.
Sztuczna inteligencja szturmem zdobywa dostęp do każdego użytkownika sieci. Albo odwrotnie, zależy, jak na to patrzeć. W każdym razie przeszliśmy na nowy etap w relacjach między ludzkimi mózgami i zaawansowanym oprogramowaniem.
Oczywiście od wielu lat dostępne są specjalistyczne programy sztucznej inteligencji. Teraz jednak do coraz większej liczby aplikacji może mieć dostęp każdy.
W połowie maja europejscy użytkownicy bazy eBird, działającej na zasadach nauki obywatelskiej, dostali wzbogacone oprogramowanie Merlin.
To wprost czarodziejska aplikacja (Merlin to legendarny czarodziej, ale również angielska nazwa małego sokoła – drzemlika), która potrafi rozpoznawać głosy 250 europejskich ptaków.
Niby nic takiego, bo inne aplikacje robiły to już wcześniej. Ale sposób, w jaki działa Merlin, jest rewolucyjny.
Przede wszystkim rozpoznaje gatunki w czasie rzeczywistym i zaznacza, który gatunek na liście właśnie się odzywa. Pokazuje jednocześnie sonogram głosu ptaka i ten sonogram jest bardzo dobrze widoczny. Program jest odporny na głosy ludzi i inne nieptasie dźwięki, które zwyczajnie ignoruje. I jako jedyny z takich programów jest w pełni użyteczny w trybie offline.
Poprzednie programy nie były tak sprawne i w porównaniu z możliwościami Merlina są bardzo ułomne.
Merlin rozpoznaje nie tylko śpiew samców ptaków wróblowych, ale także głosy kontaktowe chruścieli, gołębi i ptaków z innych rodzin. Myli się czasami, ale dzieje się to rzadko. Za to słuchając w danym miejscu głosów ptaków i patrząc, jak pojawiają się na liście kolejne gatunki, nie można nadziwić się, jak sprawnie to robi.
Nie tylko ja, ale też moi koledzy ptasiarze, którym pokazałem możliwości tej aplikacji, są zachwyceni.
Co ciekawe, często zdarza się podczas obserwacji, że aplikacja wykrywa obecność ptaka po głosie szybciej, niż sami jesteśmy w stanie go stwierdzić. Zasięg identyfikacji głosów jest imponujący, bo na liście pojawiają się ptaki śpiewające kilkadziesiąt metrów od smartfona.
Byłem zaskoczony, że mój już kilkuletni smartfon, który już w momencie zakupu nie należał do najwyższej półki, tak świetnie działa z tą aplikacją.
Nauka obywatelska ramię w ramię ze sztuczną inteligencją
Sekret możliwości sztucznej inteligencji zaprzęgniętej do pracy terenowej tkwi nie tylko w oprogramowaniu i zaangażowaniu informatyków. Referencyjna baza głosów ptaków, która jest sercem całego systemu, powstała właśnie dzięki uczestnikom nauki obywatelskiej.
System stworzony na Uniwersytecie Cornella w mieście Ithaka niedaleko Nowego Jorku umożliwił gromadzenie nagrań głosów ptaków. Tysiące osób na całym świecie przekazywały nagrania robione w terenie z właściwym oznaczeniem gatunku, który taki głos wydaje. Bez wieloletniej pracy zaangażowanych ptasiarzy samo oprogramowanie, nawet najlepiej przygotowane, nie dałoby takich efektów.
Za to teraz ptasiarze mogą korzystać z dobrodziejstwa sztucznej inteligencji i jeszcze dokładniej prowadzić swoje obserwację.
Przy tworzeniu systemu ponad 150 regionalnych ekspertów od ptasich głosów podzieliło się swoją wiedzą, a całość została opracowana w Cornell Lab of Ornithology kierowanym przez dr Granta Van Horna i dr Benjamina Hoffmana.
Jak narodził się Merlin
Merlin identyfikuje głosy ptaków, korzystając z przełomowych technologii uczenia maszynowego do rozpoznawania gatunków na podstawie spektrogramów — wizualnych reprezentacji dźwięków. Obraz ze spektrogramu jest wprowadzany do nowoczesnego komputerowego modelu wizyjnego zwanego głęboką konwolucyjną siecią neuronową. Analiza spektrogramów odbywa się za pomocą komputerowych narzędzi podobnych do tych, które służą do identyfikacji zdjęć.
Program wykorzystuje nagrania zarchiwizowane w Bibliotece Macaulay będącej częścią bazy eBird.
Przygotowanie zbioru danych rozpoczęło się w 2020 r., a rozwój modelu rozpoczął się na początku 2021 r. Początkowo obejmował tylko gatunki północnoamerykańskie. Dwa lata temu Merlin mógł zidentyfikować po głosach 458 gatunków ptaków żyjących w USA i Kanadzie. Model był trenowany w identyfikacji na podstawie 140 godzin nagrań zawierających odgłosy ptaków oraz 126 godzin nagrań zawierających nieptasie odgłosy tła.
Obecnie Merlin może już rozpoznawać głosy ponad 1000 gatunków ptaków.
Program zostanie w przyszłości rozszerzony, aby obejmował gatunki występujące na całym świecie. Do tego jednak potrzebne jest co najmniej 150 nagrań dźwiękowych każdego gatunku, tak aby można było wyszkolić program w ich rozpoznawaniu.
Jestem oczarowany możliwościami Merlina i każdemu, kto lubi słuchać ptaków, polecam współpracę ze sztuczną inteligencją. W czerwcu i lipcu jeszcze sporo gatunków będzie śpiewać, a wakacyjny czas będzie sprzyjał relaksowaniu się wśród poznanych ptasich głosów.