Випускник Українського католицького університету Андрій Шевцов створив інноваційний проєкт, який дозволяє штучному інтелекту генерувати автентичне звучання співу різних видів птахів. Розробка була здійснена в межах його дипломної роботи та отримала схвальні відгуки з боку української наукової та природоохоронної спільноти – розповідає speka.
Суть проєкту
Проєкт полягає у застосуванні технологій генерації звуку на основі штучного інтелекту для імітації співу понад 200 видів птахів, які мешкають на території України та інших регіонів. Студент використав кілька підходів: зокрема, модифіковані моделі перетворення тексту на аудіо (text-to-audio), донавчання існуючих моделей, а також створення спеціалізованої архітектури, пристосованої для обробки складних біоакустичних патернів.
Оцінка фахівців та практичне застосування
Проєкт отримав позитивні відгуки з боку представників природоохоронних організацій, зокрема українських бердвотчерів — спеціалістів зі спостереження за птахами. Вони відзначили високу автентичність згенерованих звуків і потенціал розробки для природоохоронної та дослідницької діяльності. Серед можливих напрямів практичного застосування:
- автоматизований біоакустичний моніторинг для виявлення рідкісних чи зникаючих видів птахів;
- моделювання природного середовища в реабілітаційних центрах для тварин;
- створення освітніх продуктів, аудіо для кіновиробництва або інтерактивних експозицій;
- контроль поведінки птахів у сільському господарстві чи на летовищах (наприклад, як засіб відлякування).
Подальші плани
У межах проєкту розроблено демонстраційний вебінтерфейс, де користувач може прослухати згенеровані вокалізації 12 видів птахів. У подальшому автор планує опублікувати наукову статтю та відкрити доступ до моделей у вигляді Python-модуля з відкритим кодом.
Значення для екології та науки
Видання GALERA зазначає, що в умовах воєнних дій, забруднення середовища та втрати природних ареалів такі технології можуть відігравати важливу роль у відновленні біорізноманіття. Автоматизовані системи імітації звуків природи, зокрема пташиних голосів, дозволяють зберігати знання про види та відтворювати їх у дослідницьких чи освітніх цілях навіть у зонах обмеженого доступу.