ИИ научился расшифровывать собачий лай, отличая игривый лай от агрессивного, а также определять возраст, пол и породу собаки. Изначально обученные на человеческой речи, модели ИИ достигли впечатляющей точности и обещают значительные улучшения в коммуникации и уходе за животными.
Компания OpenAI представила GPT-4о – уникальную омнимодель, объединяющую обработку текста, звука и изображений, что позволяет ей работать быстрее и эффективнее, чем когда-либо прежде.
Amazon представил модель TTS с инновационной архитектурой, которая устанавливает новый стандарт для синтеза речи. BASE TTS не только обеспечивает непревзойденную естественность речи, но и демонстрирует чрезвычайную адаптивность в обработке различных языковых нюансов.
SeamlessM4T разрушает языковые барьеры благодаря своим комплексным возможностям перевода и транскрипции. Эта модель ИИ может легко преобразовать язык или текст, обеспечивая перевод в режиме реального времени и способствуя межкультурному взаимопониманию.
Генеративный искусственный интеллект трансформирует мир компьютерных игр, преобразуя виртуальных персонажей и улучшая их навыки общения. NVIDIA Avatar Cloud Engine (ACE) позволяет разработчикам наделять неигровых персонажей интеллектом, тем самым изменяя игровой процесс и расширяя границы возможного.
Ученые разработали новый подход к моделированию движения, используя относительное изменение положения. Они оценили способность архитектур глубоких нейронных сетей моделировать движение посредством задач распознавания и прогнозирования движения.
Исследователи разработали новый алгоритм ИИ, призванный визуализировать кластеры данных и другие макроскопические признаки так, чтобы они были максимально отчетливы, легко наблюдаемые и понятные для людей.
Ученые разработали модель DetectGPT, которая в 95% случаев может отличить текст, написанный человеком, от текста, сгенерированного с помощью популярных языковых моделей с открытым исходным кодом.
Исследователи создали новую нейроморфную вычислительную систему, поддерживающую генеративный и графический класс моделей глубокого обучения и возможность работы с нейронными моделями глубокого обучения.
Группа ученых разработала новый способ прогнозирования выбросов аминов на заводах по улавливанию углерода, используя машинное обучение и экспериментальные данные стресс-теста, проведенного на заводе в Германии.
Ученые разработали первый искусственный биореалистичный нейрон, который может эффективно взаимодействовать с настоящими биологическими нейронами.
Ученые разработали бионический палец, который может создавать 3D-карты внутренней структуры материалов, касаясь их внешней поверхности.
Беспроводная мягкая электронная кожа может как распознавать, так и передавать ощущение прикосновения, а также формировать сенсорную сеть, что открывает большие возможности для улучшения интерактивного сенсорного общения.
Meta AI запустила LLaMA, серию базовых языковых моделей, которые могут конкурировать или даже превосходить лучшие модели среди существующих, такие как GPT-3, Chinchilla и PaLM.
MusicLM – это искусственный интеллект нового поколения, создающий высококачественную музыку на основе текстовых описаний, подобно тому, как DALL-E создает изображения из текстов.
Ученые из Мичиганского университета исследовали стратегии поведения роботов для восстановления доверия между ботом и человеком. Смогут ли такие стратегии полностью восстановить доверие и насколько они эффективны после повторных ошибок ботов?
Группа исследователей создала Байесовскую машину с использованием мемристоров. Она более энергоэффективна, чем существующие аппаратные решения, и может использоваться для критических с точки зрения безопасности приложений.
Благодаря достижениям в сфере искусственного интеллекта инженеры из Колорадского Университета в Боулдере работают над новым типом трости для слепых или слабовидящих.
Исследователи Тель-Авивского университета достигли технологического прорыва: новый биологический датчик фиксирует наличие запаха и посылает информацию о нем роботу для интерпретации результатов.
Модели синтеза речи обычно требуют длительных образцов аудиофайлов для обработки, тогда как VALL-E имитирует голос всего за несколько секунд звукозаписи.
Исследователи из Стэнфордского университета разработали новый тип эластичного биосовместимого материала, который распыляется на внешнюю сторону рук и может распознавать их движения.
Point·E — это новая система текстового синтеза 3D-изображений, которая сначала формирует искусственное представление про объект, а затем на его основе создает цветные облака точек.
Беспилотные авто уже давно считаются видом транспорта нового поколения. Для обеспечения автономной навигации таких транспортных средств необходимо внедрить множество различных технологий.
Новое исследование Тихоокеанской северо-западной национальной лаборатории предполагает использование машинного обучения, анализа данных и искусственного интеллекта для обнаружения потенциальных ядерных угроз.
Исследователи разработали новые способы использования ИИ вместе с видеонаблюдением для розничной торговли, чтобы лучше понимать поведение потребителей и адаптировать планирование магазинов для увеличения продаж.
Декодирование речи на основе активности головного мозга являлось давней целью неврологов и клиницистов. Компания Meta поделилась исследованиями по разработке модели ИИ, которая способна декодировать речь с помощью неинвазивных методов исследования.
Приложение Look to Speak от Google способно помочь людям с нарушениями моторики и проблемами речи легче общаться. Используя только глаза, программа позволяет выбирать заранее подготовленные фразы и озвучивать их.
Исследователи Массачусетского технологического института разработали метод машинного обучения, который точно улавливает и моделирует основную акустику местности, используя лишь небольшое количество звукозаписей.
К 2050 году человечеству придется почти вдвое увеличить глобальные запасы продовольствия, чтобы обеспечить каждого жителя планеты достаточным количеством еды. Поскольку изменение климата происходит все быстрее, водные ресурсы сокращаются, а пахотные земли разрушаются, гарантировать устойчивое развитие станет серьезным вызовом.
За последнее десятилетие резкий рост стоимости производства видеоигр класса ААА стал одной из самых серьезных проблем в игровой индустрии. Cтудии постоянно ищут технологии, которые могли бы помочь снизить стоимость разработки игр. Последние достижения в нейронных моделях генерации изображений вселяют надежду, что реализация этой мечты может быть не так уж и далека.
Могут ли компьютеры думать? Могут ли модели искусственного интеллекта (ИИ) быть сознательными? Эти и подобные вопросы часто возникают при обсуждении недавнего прогресса ИИ, достигнутого с помощью моделей естественного языка GPT-3, LAMDA и других преобразователей. Тем не менее они все еще противоречивы и находятся на грани парадокса, потому что обычно существует множество скрытых предположений и ошибочных представлений о том, как работает мозг и что означает мышление. Нет другого пути, кроме как точно сформулировать эти предположения, а затем исследовать, как именно обработка информации человеком может быть воспроизведена машинами.
Сейчас никого не удивишь фильтрами, которые улучшают качество фотографий. Но восстановление старых портретов пока оставляет желать лучшего. Старые фотографии бывают слишком размытыми, поэтому обычные методы повышения четкости изображений на них не работают.
Компания Facebook выложила в открытый доступ проект NLLB (No Language Left Behind). Основной особенностью данной разработки является охват более двухсот языков, включая редкие языки африканских и австралийских народов. Кроме того Facebook применил новый подход к модели машинного обучения, в котором перевод осуществляется напрямую из одного языка на другой, без промежуточного перевода на английский.
Группа учёных используя машинное обучение «переоткрыла» закон Всемирного тяготения.
Анимированные аватары давно уже вошли в нашу жизнь. Но вот реалистичное моделирование анимации одежды, пока оставалось открытой задачей.
С одной стороны современные методы физического моделирования могут генерировать реалистичную геометрию одежды с интерактивной скоростью. С другой, моделирование фотореалистичного внешнего вида обычно требует физического рендеринга, который слишком дорог для интерактивных приложений.
Группа учёных используя машинное обучение «переоткрыла» закон Всемирного тяготения.
Для этого они обучили «графическую нейронную сеть» для моделирования динамики Солнца, планет и больших планет Солнечной системы из 30-летних наблюдений. Затем они использовали символическую регрессию, чтобы обнаружить аналитическое выражение закона силы, неявно изученного нейронной сетью.