Новини

Свіжі новини та корисні статті про штучний інтелект і машинне навчання

Штучний інтелект навчився розуміти гавкіт собак

Дослідники з Університету Мічигану досліджують можливості штучного інтелекту (ШІ) для розуміння того, що наші пухнасті друзі намагаються сказати своїм гавкотом. Новий інструмент ШІ може відрізнити грайливий гавкіт від агресивного. Він також може визначити вік, стать і породу собаки на основі його вокалізації.

Дослідження, проведене у співпраці з Мексиканським національним інститутом астрофізики, оптики та електроніки (INAOE) у Пуеблі, вивчає, як моделі штучного інтелекту, навчені на людській мові, можуть бути перепрофільовані для аналізу вокалізації тварин. Цей інноваційний підхід було представлено на Спільній міжнародній конференції з комп’ютерної лінгвістики, мовних ресурсів та оцінювання.

Однією з головних перешкод у розробці моделей ШІ для вокалізації тварин є дефіцит загальнодоступних даних. На відміну від людської мови, яку можна легко записати, збирати дані від тварин є складним завданням. "Логістично набагато складніше запитувати і записувати голоси тварин, – пояснює Артем Абзалієв, провідний автор дослідження і докторант з комп’ютерних наук та інженерії в Університеті Мічигану. "Їх необхідно пасивно записувати в природних умовах або, у випадку з домашніми тваринами, з дозволу власників".

Щоб подолати цю перешкоду, дослідники переорієнтували існуючу модель, призначену для аналізу людського мовлення.

Це дозволило їм використовувати передові моделі, які лежать в основі голосових технологій, якими ми користуємося щодня, таких як перетворення голосу в текст та мовний переклад. Ці моделі навчені виявляти тонкі варіації в людській мові, такі як тон, висота голосу та акцент, і перетворювати цю інформацію у формат, який дозволяє комп’ютерам розпізнавати вимовлені слова, ідентифікувати спікера тощо.

Модель Wav2Vec2 була модифікована для інтерпретації вокалізацій собак за допомогою набору даних, записаного з 74 собак різних порід, віку та статі. Результати вражають: модель ШІ досягла точності до 70% у класифікації різних типів гавкоту, перевершуючи моделі, спеціально навчені на даних про гавкіт собак.

Наслідки цього дослідження перспективні. Для біологів і спеціалістів з поведінки тварин ця технологія пропонує новий інструмент для вивчення комунікації тварин. Що ще важливіше, для власників домашніх тварин і ветеринарів розуміння нюансів вокалізації собак може значно покращити те, як люди інтерпретують і реагують на емоційні та фізичні потреби собак. Цей прогрес може покращити догляд за тваринами та запобігти потенційно небезпечним ситуаціям.

З повним текстом дослідження можна ознайомитися в статті, опублікованій на сервері препринтів arXiv.