QuData Новости| Все о голосовых технологиях: голосовые помощники, распознавание речи

Qudata

20 Июня, 2024

Искусственный интеллект научился понимать лай собак

ИИ научился расшифровывать собачий лай, отличая игривый лай от агрессивного, а также определять возраст, пол и породу собаки. Изначально обученные на человеческой речи, модели ИИ достигли впечатляющей точности и обещают значительные улучшения в коммуникации и уходе за животными.

ПОДРОБНЕЕ

23 Мая, 2024

Новая эпоха мультимодального ИИ с GPT-4o

Компания OpenAI представила GPT-4о – уникальную омнимодель, объединяющую обработку текста, звука и изображений, что позволяет ей работать быстрее и эффективнее, чем когда-либо прежде.

ПОДРОБНЕЕ

22 Февраля, 2024

BASE TTS: сила модели с миллиардом параметров для преобразования текста в речь

Amazon представил модель TTS с инновационной архитектурой, которая устанавливает новый стандарт для синтеза речи. BASE TTS не только обеспечивает непревзойденную естественность речи, но и демонстрирует чрезвычайную адаптивность в обработке различных языковых нюансов.

ПОДРОБНЕЕ

1 Сентября, 2023

SeamlessM4T от Meta: общение без языковых барьеров

SeamlessM4T разрушает языковые барьеры благодаря своим комплексным возможностям перевода и транскрипции. Эта модель ИИ может легко преобразовать язык или текст, обеспечивая перевод в режиме реального времени и способствуя межкультурному взаимопониманию.

ПОДРОБНЕЕ

14 Июня, 2023

Генеративный искусственный интеллект преобразует виртуальных персонажей

Генеративный искусственный интеллект трансформирует мир компьютерных игр, преобразуя виртуальных персонажей и улучшая их навыки общения. NVIDIA Avatar Cloud Engine (ACE) позволяет разработчикам наделять неигровых персонажей интеллектом, тем самым изменяя игровой процесс и расширяя границы возможного.

ПОДРОБНЕЕ

26 Апреля, 2023

Как нейронные сети обучаются движению? Интерпретация моделирования движения с использованием относительного изменения положения

Ученые разработали новый подход к моделированию движения, используя относительное изменение положения. Они оценили способность архитектур глубоких нейронных сетей моделировать движение посредством задач распознавания и прогнозирования движения.

ПОДРОБНЕЕ

19 Апреля, 2023

Эмбеддинг стохастического кластера – новый метод визуализации больших наборов данных

Исследователи разработали новый алгоритм ИИ, призванный визуализировать кластеры данных и другие макроскопические признаки так, чтобы они были максимально отчетливы, легко наблюдаемые и понятные для людей.

ПОДРОБНЕЕ

13 Апреля, 2023

Автор текста человек или робот? Ученые создают инструмент-детектор

Ученые разработали модель DetectGPT, которая в 95% случаев может отличить текст, написанный человеком, от текста, сгенерированного с помощью популярных языковых моделей с открытым исходным кодом.

ПОДРОБНЕЕ

6 Апреля, 2023

Deep neural network - нейронная сеть на основе кремниевых мемристивных синапсов

Исследователи создали новую нейроморфную вычислительную систему, поддерживающую генеративный и графический класс моделей глубокого обучения и возможность работы с нейронными моделями глубокого обучения.

ПОДРОБНЕЕ

30 Марта, 2023

Использование машинного обучения для прогнозирования выбросов аминов

Группа ученых разработала новый способ прогнозирования выбросов аминов на заводах по улавливанию углерода, используя машинное обучение и экспериментальные данные стресс-теста, проведенного на заводе в Германии.

ПОДРОБНЕЕ

24 Марта, 2023

Искусственные органические нейроны облегчают связь между биологией и электроникой

Ученые разработали первый искусственный биореалистичный нейрон, который может эффективно взаимодействовать с настоящими биологическими нейронами.

ПОДРОБНЕЕ

13 Марта, 2023

Подповерхностная тактильная томография стала возможна благодаря бионическим пальцам

Ученые разработали бионический палец, который может создавать 3D-карты внутренней структуры материалов, касаясь их внешней поверхности.

ПОДРОБНЕЕ

9 Марта, 2023

Ученые разработали электронную кожу для интерактивного сенсорного общения в виртуальном мире

Беспроводная мягкая электронная кожа может как распознавать, так и передавать ощущение прикосновения, а также формировать сенсорную сеть, что открывает большие возможности для улучшения интерактивного сенсорного общения.

ПОДРОБНЕЕ

2 Марта, 2023

Meta AI представила LLaMA – серию базовых языковых моделей

Meta AI запустила LLaMA, серию базовых языковых моделей, которые могут конкурировать или даже превосходить лучшие модели среди существующих, такие как GPT-3, Chinchilla и PaLM.

ПОДРОБНЕЕ

21 Февраля, 2023

Google выпустила MusicLM – модель генерации музыки на основе текста

MusicLM – это искусственный интеллект нового поколения, создающий высококачественную музыку на основе текстовых описаний, подобно тому, как DALL-E создает изображения из текстов.

ПОДРОБНЕЕ

13 Февраля, 2023

Как чат-боты и роботы после совершенных ошибок могут вернуть доверие людей

Ученые из Мичиганского университета исследовали стратегии поведения роботов для восстановления доверия между ботом и человеком. Смогут ли такие стратегии полностью восстановить доверие и насколько они эффективны после повторных ошибок ботов?

ПОДРОБНЕЕ

6 Февраля, 2023

Байесовская машина на мемристорах

Группа исследователей создала Байесовскую машину с использованием мемристоров. Она более энергоэффективна, чем существующие аппаратные решения, и может использоваться для критических с точки зрения безопасности приложений.

ПОДРОБНЕЕ

31 Января, 2023

Новая "смарт" трость облегчит выполнение ежедневных задач для людей с недостатками зрения

Благодаря достижениям в сфере искусственного интеллекта инженеры из Колорадского Университета в Боулдере работают над новым типом трости для слепых или слабовидящих.

ПОДРОБНЕЕ

25 Января, 2023

Робота обучили распознавать запахи с помощью биологического датчика

Исследователи Тель-Авивского университета достигли технологического прорыва: новый биологический датчик фиксирует наличие запаха и посылает информацию о нем роботу для интерпретации результатов.

ПОДРОБНЕЕ

19 Января, 2023

Модель синтеза речи – VALL-E может воспроизводить голос из трехсекундной аудиозаписи

Модели синтеза речи обычно требуют длительных образцов аудиофайлов для обработки, тогда как VALL-E имитирует голос всего за несколько секунд звукозаписи.

ПОДРОБНЕЕ

11 Января, 2023

Smart Skin использует искусственный интеллект для мгновенной интерпретации движений рук

Исследователи из Стэнфордского университета разработали новый тип эластичного биосовместимого материала, который распыляется на внешнюю сторону рук и может распознавать их движения.

ПОДРОБНЕЕ

5 Января, 2023

OpenAI объявила о нововой системе для создания 3D-объектов — Point-E

Point·E — это новая система текстового синтеза 3D-изображений, которая сначала формирует искусственное представление про объект, а затем на его основе создает цветные облака точек.

ПОДРОБНЕЕ

19 Декабря, 2022

Повышение безопасности самоуправляемых автомобилей с помощью распознавания объектов на основе методов глубокого обучения

Беспилотные авто уже давно считаются видом транспорта нового поколения. Для обеспечения автономной навигации таких транспортных средств необходимо внедрить множество различных технологий.

ПОДРОБНЕЕ

13 Декабря, 2022

Обнаружение ядерных угроз с помощью искусственного интеллекта

Новое исследование Тихоокеанской северо-западной национальной лаборатории предполагает использование машинного обучения, анализа данных и искусственного интеллекта для обнаружения потенциальных ядерных угроз.

ПОДРОБНЕЕ

7 Декабря, 2022

Практическая значимость ИИ для обслуживания клиентов в сфере розничной торговле

Исследователи разработали новые способы использования ИИ вместе с видеонаблюдением для розничной торговли, чтобы лучше понимать поведение потребителей и адаптировать планирование магазинов для увеличения продаж.

ПОДРОБНЕЕ

29 Ноября, 2022

Компания Meta разработала модель искусственного интеллекта для декодирования речи при считывании мозговой активности

Декодирование речи на основе активности головного мозга являлось давней целью неврологов и клиницистов. Компания Meta поделилась исследованиями по разработке модели ИИ, которая способна декодировать речь с помощью неинвазивных методов исследования.

ПОДРОБНЕЕ

21 Ноября, 2022

Возможности приложения Look to Speak

Приложение Look to Speak от Google способно помочь людям с нарушениями моторики и проблемами речи легче общаться. Используя только глаза, программа позволяет выбирать заранее подготовленные фразы и озвучивать их.

ПОДРОБНЕЕ

14 Ноября, 2022

Использование звука для моделирования местности

Исследователи Массачусетского технологического института разработали метод машинного обучения, который точно улавливает и моделирует основную акустику местности, используя лишь небольшое количество звукозаписей.

ПОДРОБНЕЕ

7 Ноября, 2022

Microsoft работает над набором инструментов с открытым исходным кодом для создания «фермы будущего»

К 2050 году человечеству придется почти вдвое увеличить глобальные запасы продовольствия, чтобы обеспечить каждого жителя планеты достаточным количеством еды. Поскольку изменение климата происходит все быстрее, водные ресурсы сокращаются, а пахотные земли разрушаются, гарантировать устойчивое развитие станет серьезным вызовом.

ПОДРОБНЕЕ

10 Октября, 2022

Новая модель искусственного интеллекта создает 3D объекты и персонажей для виртуального мира игр

За последнее десятилетие резкий рост стоимости производства видеоигр класса ААА стал одной из самых серьезных проблем в игровой индустрии. Cтудии постоянно ищут технологии, которые могли бы помочь снизить стоимость разработки игр. Последние достижения в нейронных моделях генерации изображений вселяют надежду, что реализация этой мечты может быть не так уж и далека.

ПОДРОБНЕЕ

26 Сентября, 2022

Философы vs преобразователи: нейронная сеть выдает себя за известного ученого-когнитивиста

Могут ли компьютеры думать? Могут ли модели искусственного интеллекта (ИИ) быть сознательными? Эти и подобные вопросы часто возникают при обсуждении недавнего прогресса ИИ, достигнутого с помощью моделей естественного языка GPT-3, LAMDA и других преобразователей. Тем не менее они все еще противоречивы и находятся на грани парадокса, потому что обычно существует множество скрытых предположений и ошибочных представлений о том, как работает мозг и что означает мышление. Нет другого пути, кроме как точно сформулировать эти предположения, а затем исследовать, как именно обработка информации человеком может быть воспроизведена машинами.

ПОДРОБНЕЕ

8 Августа, 2022

Восстановление старых фотопортретов с помощью нейронных сетей

Сейчас никого не удивишь фильтрами, которые улучшают качество фотографий. Но восстановление старых портретов пока оставляет желать лучшего. Старые фотографии бывают слишком размытыми, поэтому обычные методы повышения четкости изображений на них не работают.

ПОДРОБНЕЕ

1 Августа, 2022

Ни один язык не будет забыт

Компания Facebook выложила в открытый доступ проект NLLB (No Language Left Behind). Основной особенностью данной разработки является охват более двухсот языков, включая редкие языки африканских и австралийских народов. Кроме того Facebook применил новый подход к модели машинного обучения, в котором перевод осуществляется напрямую из одного языка на другой, без промежуточного перевода на английский.

ПОДРОБНЕЕ

25 Июля, 2022

Фотореалистичная анимированная одежда для аватаров

Группа учёных используя машинное обучение «переоткрыла» закон Всемирного тяготения.

Анимированные аватары давно уже вошли в нашу жизнь. Но вот реалистичное моделирование анимации одежды, пока оставалось открытой задачей.

С одной стороны современные методы физического моделирования могут генерировать реалистичную геометрию одежды с интерактивной скоростью. С другой, моделирование фотореалистичного внешнего вида обычно требует физического рендеринга, который слишком дорог для интерактивных приложений.

ПОДРОБНЕЕ

18 Июля, 2022

Переоткрытие небесной механики с помощью ML

Группа учёных используя машинное обучение «переоткрыла» закон Всемирного тяготения.

Для этого они обучили «графическую нейронную сеть» для моделирования динамики Солнца, планет и больших планет Солнечной системы из 30-летних наблюдений. Затем они использовали символическую регрессию, чтобы обнаружить аналитическое выражение закона силы, неявно изученного нейронной сетью.

ПОДРОБНЕЕ

21 Апреля, 2022

Украина использует Clearview AI для идентификации погибших граждан и убитых российских солдат

Украина начала использовать программное обеспечение для распознавания лиц Clearview AI для идентификации погибших российских солдат и украинцев, убитых в ходе конфликта. Хоан Тон-Тхат, исполнительный директор компании Clearview, сообщил Reuters, что Министерство обороны Украины начало использовать указанную технологию в марте текущего года.

ПОДРОБНЕЕ

14 Апреля, 2022

На защите планеты: как аналитика поддерживает устойчивое развитие

Благодаря SAS Customer Intelligence 360, организация Nature Conservancy пересмотрела свою маркетинговую стратегию посредством цифровой трансформации. В результате, международная природоохранная некоммерческая организация продемонстрировала лучший год по доходам от членства. Такой показатель, как ничто другое, способствует продвижению ее миссии по созданию более устойчивого будущего.

ПОДРОБНЕЕ

7 Апреля, 2022

Новообретенные творческие способности ИИ: что нужно знать о фундаментальных моделях и как они помогают роботам шутить

Вы когда-нибудь видели фото чайника в форме авокадо или читали интересную статью, идеи которой странным образом уходят от заданной темы? Если да, то, возможно, вы столкнулись с последними тенденциями в области искусственного интеллекта (ИИ).

ПОДРОБНЕЕ

15 Ноября, 2021

Новое исследование сочетает в себе рекуррентные нейронные сети (RNN) с концепцией отжига для решения реальных проблем оптимизации

Задачи оптимизации включают определение наиболее оптимального ответа из множества вариантов, которые часто можно увидеть как в реальных ситуациях, так и в большинстве областей научных исследований. Однако многие сложные проблемы не могут быть решены простыми вычислительными методами или требуют больших затрат времени.

ПОДРОБНЕЕ

3 Сентября, 2021

W2V-BERT: Объединение контрастивного обучения и языка моделирования с маской для самоконтролируемого предварительного обучения речи

Мотивированные успехом моделирования масочного языка (MLM) в предварительном обучении моделей обработки естественного языка до обучения, авторы предлагают модель w2v-BERT, которая исследует MLM для самостоятельного обучения представлению речи.

ПОДРОБНЕЕ

1 Апреля, 2021

Новейшая нейронная сеть OpenAI создает изображение по текстовому описанию

"Мы обнаружили, что DALL·E обладает способностью создавать правдоподобные фотографии для фантастического диапазона предложений, которые открывают композиционную структуру языка", - объясняет OpenAI. Полученные изображения могут варьироваться от иллюстраций до объектов, а также скорректированных изображений реального мира. Ниже приведены некоторые примеры каждого из них, поставляемые OpenAI.

ПОДРОБНЕЕ

31 Марта, 2021

Автоматизация может заменить более 1,4 миллиона рабочих мест

Работодатели и сотрудники должны изменить свою точку зрения. Будущее уже наступило, и внедрение современных технологий по-разному влияет на распределение рабочих ресурсов. Мы должны понять, в какой мере технологии дополняют человеческий труд, и целенаправленно инвестировать в развитие новых навыков, определить новые создаваемые современными технологиями функции, чтобы оптимизировать совместную работу машины и человека.

ПОДРОБНЕЕ

31 Марта, 2021

Практика построения движков на основе ИИ

Движки на базе искусственного интеллекта оценивают и интерпретируют данные в базе знаний, обрабатывают развертывание модели и контролируют производительность. Они представляют собой совершенно новый мир, в котором приложения смогут использовать технологии искусственного интеллекта для повышения операционной эффективности и решения важных производственных задач.

ПОДРОБНЕЕ

31 Марта, 2021

Использование ИИ для оценки пассажиров транспортных средств

“Наш патентный портфель отражает наше стремление расширить границы компьютерного зрения, машинного обучения, глубокого обучения и искусственного интеллекта свидетельствует о лидерстве нашей компании во определении множества креативных применений ИИ человеческого восприятия, которые формируют различные отрасли сегодня и в будущем”.

ПОДРОБНЕЕ

31 Марта, 2021

Как искусственный интеллект может защитить вас онлайн

С ростом использования социальных сетей всё большая часть нашей жизни проходит онлайн, поэтому мы должны попытаться найти способы уменьшить угрозы, защитить нашу безопасность и устранить взаимодействия, которые вызывают беспокойство. Искусственный интеллект (ИИ) – прогрессивная технология машинного обучения, которая играет важную роль в современной жизни и в функционировании современных социальных сетей в частности.

ПОДРОБНЕЕ

30 Марта, 2021

Развитие искусственного интеллекта

Возможности современных компьютерных систем впечатляют. На раннем этапе компьютеры не только помогали людям решать сложные математические задачи, но и хранили большие объемы информации. Сегодня машины управляют сложным оборудованием и системами, чтобы предотвратить человеческие ошибки.

ПОДРОБНЕЕ

25 Марта, 2021

Алгоритмы ИИ для мягкой робототехники

Ученые Массачусетского технологического института создали алгоритм, помогающий инженерам разрабатывать мягкую робототехнику, которая собирает больше полезной информации об окружающей среде. Алгоритм глубокого обучения предполагает улучшенное позиционирование датчиков внутри тела робота, что позволяет ему успешно взаимодействовать с окружением и выполнять назначенные задачи. Разработка является шагом на пути к автоматизации робототехнического проектирования.

ПОДРОБНЕЕ