Искусственный интеллект научился понимать лай собак
Исследователи из Мичиганского университета исследуют возможности искусственного интеллекта (ИИ) для понимания того, что наши пушистые друзья пытаются сказать своим лаем. Новый инструмент ИИ может отличить игривый лай от агрессивного. Он также может определить возраст, пол и породу собаки на основе ее вокализации.
Исследование, проведенное в сотрудничестве с Мексиканским национальным институтом астрофизики, оптики и электроники (INAOE) в Пуэбле, изучает, как модели искусственного интеллекта, обученные на человеческой речи, могут быть перепрофилированы для анализа вокализации животных. Этот инновационный подход был представлен на Совместной международной конференции по компьютерной лингвистике, языковым ресурсам и оценке.
Одним из главных препятствий в разработке моделей ИИ для вокализации животных является дефицит общедоступных данных. В отличие от человеческой речи, которую можно легко записать, собирать данные от животных является сложной задачей. "Логистически гораздо сложнее запрашивать и записывать голоса животных, – объясняет Артем Абзалиев, ведущий автор исследования и докторант по компьютерным наукам и инженерии в Университете Мичигана. "Их необходимо пассивно записывать в естественных условиях или, в случае с домашними животными, с разрешения владельцев".
Чтобы преодолеть это препятствие, исследователи переориентировали существующую модель, предназначенную для анализа человеческой речи.
Это позволило им использовать передовые модели, лежащие в основе голосовых технологий, которыми мы пользуемся каждый день, таких как преобразование голоса в текст и языковой перевод. Эти модели обучены выявлять тонкие вариации в человеческом речи, такие как тон, высота голоса и акцент, и преобразовывать эту информацию в формат, позволяющий компьютерам распознавать произнесенные слова, идентифицировать спикера и т.д.
Модель Wav2Vec2 была модифицирована для интерпретации вокализаций собак с помощью набора данных, записанного от 74 собак разных пород, возраста и пола. Результаты впечатляют: модель ИИ достигла точности до 70% в классификации различных типов лая, превосходя модели, специально обученные на данных о лае собак.
Последствия этого исследования многообещающие. Для биологов и специалистов по поведению животных эта технология предлагает новый инструмент для изучения коммуникации животных. Что еще важнее, для владельцев домашних животных и ветеринаров понимание нюансов вокализации собак может значительно улучшить то, как люди интерпретируют и реагируют на эмоциональные и физические потребности собак. Этот прогресс может улучшить уход за животными и предотвратить потенциально опасные ситуации.