Новый искусственный интеллект от Anthropic – Claude 3.5 Sonnet теперь может управлять компьютером так же, как человек. Модель использует скриншоты экрана для навигации в приложениях и выполнения таких задач, как нажатие кнопок, ввод текста или сбор информации.
Последний релиз от Stability AI представил новые модели, обеспечившие повышенное качество и скорость генерации изображений, а также доступность для потребительского оборудования. Модели бесплатны для некоммерческого использования и интегрируют современные функции безопасности.
Meta представила Movie Gen – AI инструмент, который создает видео высокой четкости с синхронизированным звуком, используя простые текстовые промпты. Модель предлагает расширенные возможности для генерации и редактирования видео, предоставляя пользователям больше контроля над новым контентом.
Благодаря снижению цен, увеличению лимитов на запросы и ускорению работы, новые модели Gemini от Google делают ИИ более доступным для разработчиков по всему миру. Они снижают затраты и улучшают производительность для таких задач, как обработка текста, кода и мультимодальных приложений.
OpenAI o1 создано для выполнения сложных задач по логическому мышлению в таких областях, как наука, программирование и математика. Имитируя мышление человека, новая модель улучшает точность ответов и учитывает вопросы безопасности, способствуя более надежному и ответственному использованию ИИ.
Последняя модель генерации изображений от Ideogram AI предлагает значительные улучшения, превосходящие возможности таких ИИ-генераторов, как MidJourney и Leonardo AI. Новые функции уже доступны, включая разнообразные стили, повышенную реалистичность и расширенные инструменты для промптов.
Модель Gen-3 Alpha обладает мощными инструментами для создания высококачественного видео, предлагая пользователям беспрецедентный уровень контроля и реалистичности. Благодаря усовершенствованным функциям и исключительному качеству, модель опережает конкурентов и расширяет границы создания контента с помощью ИИ.
Компания OpenAI представила GPT-4о – уникальную омнимодель, объединяющую обработку текста, звука и изображений, что позволяет ей работать быстрее и эффективнее, чем когда-либо прежде.
SenseNova – последняя модель искусственного интеллекта от SenseTime Group вызвала всплеск интереса на рынке благодаря своим впечатляющим достижениям, включая усовершенствованную обработку информации, математическое мышление и лингвистические способности.
Последняя разработка от компании Meta AI – Llama 3 может похвастаться непревзойденной обработкой речи, что улучшает ее способность выполнять сложные задачи. Благодаря увеличенному словарному запасу и расширенным функциям безопасности повышена производительность и универсальность модели.
DeepMind от Google разработал SAFE – новый метод фактологии для больших языковых моделей, таких как ChatGPT. Проверка фактов искусственным интеллектом уже продемонстрировала поразительные результаты, превосходя показатели точности специалистов, выполняющих фактчекинг.
Stability AI представила новый прорыв в моделях ИИ для генерации изображений – Stable Diffusion 3. Ее расширенный диапазон параметров и архитектура диффузионного трансформатора гарантируют создание сложных, высококачественных изображений и точный перевод текста в визуальный контент.
Последнее творение от OpenAI – Sora – создает увлекательные видео, демонстрируя непревзойденную реалистичность визуальных композиций. Благодаря сочетанию обработки речи и генерации видео, модель может интерпретировать текстовые подсказки, приспосабливаться к разным способам ввода данных и имитировать динамическое движение камеры.
Черпая вдохновение от Gemini, Gemma сфокусирована на открытости и доступности, предлагая универсальные модели, подходящие для различных устройств и фреймворков. Модель знаменует собой значительный шаг к демократизации ИИ, отмечая прозрачность и ответственное развитие технологий.
Новая модель Gemini AI намерена превзойти все существующие достижения в сфере искусственного интеллекта. Благодаря своей мультимодальности, масштабируемости в различных сферах и потенциалу интегрироваться в экосистему Google, Gemini AI делает значительный скачок в развитии технологий ИИ.
Команда из Стенфорда разработала новый подход для оптимизации предварительного обучения БЯМ. Благодаря двум ключевым методам им удалось значительно снизить затраты, сделав процесс более доступным для небольших компаний и групп исследователей.
Ученые разработали новый подход к моделированию движения, используя относительное изменение положения. Они оценили способность архитектур глубоких нейронных сетей моделировать движение посредством задач распознавания и прогнозирования движения.
Исследователи разработали новый алгоритм ИИ, призванный визуализировать кластеры данных и другие макроскопические признаки так, чтобы они были максимально отчетливы, легко наблюдаемые и понятные для людей.
Ученые разработали модель DetectGPT, которая в 95% случаев может отличить текст, написанный человеком, от текста, сгенерированного с помощью популярных языковых моделей с открытым исходным кодом.
Исследователи создали новую нейроморфную вычислительную систему, поддерживающую генеративный и графический класс моделей глубокого обучения и возможность работы с нейронными моделями глубокого обучения.
Группа ученых разработала новый способ прогнозирования выбросов аминов на заводах по улавливанию углерода, используя машинное обучение и экспериментальные данные стресс-теста, проведенного на заводе в Германии.
Ученые разработали первый искусственный биореалистичный нейрон, который может эффективно взаимодействовать с настоящими биологическими нейронами.
Ученые разработали бионический палец, который может создавать 3D-карты внутренней структуры материалов, касаясь их внешней поверхности.
Беспроводная мягкая электронная кожа может как распознавать, так и передавать ощущение прикосновения, а также формировать сенсорную сеть, что открывает большие возможности для улучшения интерактивного сенсорного общения.
Meta AI запустила LLaMA, серию базовых языковых моделей, которые могут конкурировать или даже превосходить лучшие модели среди существующих, такие как GPT-3, Chinchilla и PaLM.
MusicLM – это искусственный интеллект нового поколения, создающий высококачественную музыку на основе текстовых описаний, подобно тому, как DALL-E создает изображения из текстов.
Ученые из Мичиганского университета исследовали стратегии поведения роботов для восстановления доверия между ботом и человеком. Смогут ли такие стратегии полностью восстановить доверие и насколько они эффективны после повторных ошибок ботов?
Группа исследователей создала Байесовскую машину с использованием мемристоров. Она более энергоэффективна, чем существующие аппаратные решения, и может использоваться для критических с точки зрения безопасности приложений.
Благодаря достижениям в сфере искусственного интеллекта инженеры из Колорадского Университета в Боулдере работают над новым типом трости для слепых или слабовидящих.
Исследователи Тель-Авивского университета достигли технологического прорыва: новый биологический датчик фиксирует наличие запаха и посылает информацию о нем роботу для интерпретации результатов.
Модели синтеза речи обычно требуют длительных образцов аудиофайлов для обработки, тогда как VALL-E имитирует голос всего за несколько секунд звукозаписи.
Исследователи из Стэнфордского университета разработали новый тип эластичного биосовместимого материала, который распыляется на внешнюю сторону рук и может распознавать их движения.
Point·E — это новая система текстового синтеза 3D-изображений, которая сначала формирует искусственное представление про объект, а затем на его основе создает цветные облака точек.
Беспилотные авто уже давно считаются видом транспорта нового поколения. Для обеспечения автономной навигации таких транспортных средств необходимо внедрить множество различных технологий.
Новое исследование Тихоокеанской северо-западной национальной лаборатории предполагает использование машинного обучения, анализа данных и искусственного интеллекта для обнаружения потенциальных ядерных угроз.
Исследователи разработали новые способы использования ИИ вместе с видеонаблюдением для розничной торговли, чтобы лучше понимать поведение потребителей и адаптировать планирование магазинов для увеличения продаж.
Декодирование речи на основе активности головного мозга являлось давней целью неврологов и клиницистов. Компания Meta поделилась исследованиями по разработке модели ИИ, которая способна декодировать речь с помощью неинвазивных методов исследования.
Приложение Look to Speak от Google способно помочь людям с нарушениями моторики и проблемами речи легче общаться. Используя только глаза, программа позволяет выбирать заранее подготовленные фразы и озвучивать их.
Исследователи Массачусетского технологического института разработали метод машинного обучения, который точно улавливает и моделирует основную акустику местности, используя лишь небольшое количество звукозаписей.
К 2050 году человечеству придется почти вдвое увеличить глобальные запасы продовольствия, чтобы обеспечить каждого жителя планеты достаточным количеством еды. Поскольку изменение климата происходит все быстрее, водные ресурсы сокращаются, а пахотные земли разрушаются, гарантировать устойчивое развитие станет серьезным вызовом.
За последнее десятилетие резкий рост стоимости производства видеоигр класса ААА стал одной из самых серьезных проблем в игровой индустрии. Cтудии постоянно ищут технологии, которые могли бы помочь снизить стоимость разработки игр. Последние достижения в нейронных моделях генерации изображений вселяют надежду, что реализация этой мечты может быть не так уж и далека.
Могут ли компьютеры думать? Могут ли модели искусственного интеллекта (ИИ) быть сознательными? Эти и подобные вопросы часто возникают при обсуждении недавнего прогресса ИИ, достигнутого с помощью моделей естественного языка GPT-3, LAMDA и других преобразователей. Тем не менее они все еще противоречивы и находятся на грани парадокса, потому что обычно существует множество скрытых предположений и ошибочных представлений о том, как работает мозг и что означает мышление. Нет другого пути, кроме как точно сформулировать эти предположения, а затем исследовать, как именно обработка информации человеком может быть воспроизведена машинами.
Сейчас никого не удивишь фильтрами, которые улучшают качество фотографий. Но восстановление старых портретов пока оставляет желать лучшего. Старые фотографии бывают слишком размытыми, поэтому обычные методы повышения четкости изображений на них не работают.
Компания Facebook выложила в открытый доступ проект NLLB (No Language Left Behind). Основной особенностью данной разработки является охват более двухсот языков, включая редкие языки африканских и австралийских народов. Кроме того Facebook применил новый подход к модели машинного обучения, в котором перевод осуществляется напрямую из одного языка на другой, без промежуточного перевода на английский.
Группа учёных используя машинное обучение «переоткрыла» закон Всемирного тяготения.
Анимированные аватары давно уже вошли в нашу жизнь. Но вот реалистичное моделирование анимации одежды, пока оставалось открытой задачей.
С одной стороны современные методы физического моделирования могут генерировать реалистичную геометрию одежды с интерактивной скоростью. С другой, моделирование фотореалистичного внешнего вида обычно требует физического рендеринга, который слишком дорог для интерактивных приложений.
Группа учёных используя машинное обучение «переоткрыла» закон Всемирного тяготения.
Для этого они обучили «графическую нейронную сеть» для моделирования динамики Солнца, планет и больших планет Солнечной системы из 30-летних наблюдений. Затем они использовали символическую регрессию, чтобы обнаружить аналитическое выражение закона силы, неявно изученного нейронной сетью.