Новости

Свежие новости и полезные статьи про искусственный интеллект и машинное обучение

Интерактивные миры – новый тренд в сфере AI

Погрузитесь в картины Ван Гога и исследуйте целые виртуальные миры, созданные ИИ! На World Labs Hackathon хакеры создали полностью интерактивные среды всего за несколько часов, а Project Genie от Google позволяет любому превращать простые промпты или изображения в увлекательные миры в реальном времени.

Потенциал Qwen3.5 от малых до флагманских моделей

Qwen3.5 от Alibaba – это новое поколение мультимодальных моделей с нативной интеграцией зрения и языка и эффективной MoE-архитектурой. Они обеспечивают логическое мышление, длинный контекст и значительно ниже вычислительные затраты, делая передовой ИИ доступным как для локальных устройств, так и для облачных систем.

APOLLO: Раскрытие тайн клеточного кода

Новый фреймворк APOLLO разделяет общие биологические сигналы между разными методами измерения и выделяет уникальные для каждого из них. Это позволяет лучше анализировать состояние клеток, прогнозировать неизмеримые характеристики, точнее выявлять биомаркеры заболеваний и ускорять открытия в исследованиях рака, Альцгеймера и др.

Самообучающийся ИИ переосмысливает компьютерное зрение

Обученная на 1,7 млрд изображений, модель DINOv3 от Meta AI задает новые стандарты в классификации изображений и обнаружении объектов. Благодаря инновациям, таким как Gram anchoring, и практическому влиянию: от мониторинга вырубки лесов до поддержки исследований NASA на Марсе – DINOv3 является настоящим прорывом в сфере компьютерного зрения.

Как роботы учатся мыслить вместе

MultiRobot FrameWork позволяет роботам обмениваться информацией в режиме реального времени о своем окружении, положении и задачах, воспроизводя коллективное поведение, присущее колониям насекомых, но с помощью современных датчиков и вычислительных мощностей.

ИИ преодолевает нехватку данных в медицинской визуализации

Новый фреймворк GenSeg значительно сокращает потребность в размеченных данных и обеспечивает высокую точность сегментации медицинских снимков всего с 40-50 образцов. Создавая синтетические датасеты с маркировкой, он способствует разработке передовых методов диагностически даже в условиях ограниченного количества данных.

Искусственный интеллект научился распознавать цвета

Искусственный синапс с автономным питанием может имитировать цветовосприятие человеком с разрешением 10 нанометров с помощью солнечных элементов, чувствительных к красителям. Эта технология создает энергоэффективные системы ИИ, способные к распознаванию цветов и их логической обработке.

Искусственный интеллект учится объединять зрение и слух

Исследователи из MIT разработали CAV-MAE Sync – AI модель, которая учится точно связывать звуки с соответствующими визуальными эффектами в видео без каких-либо пометок. Такая технология может приблизить нас к более умному ИИ, способного видеть, слышать и понимать мир так же, как человек.

Новая ИИ-модель улучшает рентген-диагностику

ItpCtrl-AI улучшает диагностику рентгеновских снимков, имитируя взгляд радиологов и создавая интерпретированные тепловые карты, которые повышают прозрачность и доверие к ИИ в медицинской визуализации. Фильтруя несущественные данные и фокусируясь на ключевых зонах, модель обеспечивает более точные и понятные результаты.

Достижение автономной посадки – новая эра для дронов

Патентное ведомство Индии выдало патент на инновационную систему посадки мини-БПЛА. Эта технология обеспечивает точное приземление в сложных местностях и имеет потенциальное применение как в военной, так и гражданской логистике, включая экстренную помощь и доставку на большой высоте.

Система предотвращения столкновений трансформирует навигацию дронов

Новая система избегания столкновений для беспилотников использует бортовые датчики и камеры для автономного предотвращения аварий в воздухе. Целью этой технологии является содействие безопасной и эффективной работе БПЛА во все более переполненном воздушном пространстве.

Усовершенствованная система зрения, созданная по примеру глаз богомола

Новая система компьютерного зрения значительно уменьшает энергопотребление и обеспечивает пространственное осознание в режиме реального времени. Она улучшает способность ИИ точно воспринимать 3D-пространство и имеет решающее значение для таких технологий, как беспилотные автомобили и дроны.

MAIA: автоматизированный агент для интерпретации моделей ИИ

Проводя эксперименты и совершенствуя их анализ, MAIA может интерпретировать нейронные сети, что повышает понимание работы ИИ моделей. Этот агент может определять активность нейронов, удалять нерелевантные функции и выявлять предубеждения, делая системы ИИ более безопасными и прозрачными.

Изучение поведения муравьев привело к прорыву в навигации роботов

Вдохновленные насекомыми, ученые создают автономные навигационные стратегии для маленьких, легких роботов. Протестированная на 56-граммовом беспилотнике, система настраивает его возвращение домой после длительных путешествий, используя минимальные вычисления и память.

Цифровые модели рельефа на основе открытых данных

Благодаря радарным спутникам, предоставляющим высокоточные данные о поверхности Земли, быстрому и доступному программному обеспечению с открытым кодом, цифровые модели рельефа создаются всего в один клик. Это позволяет эффективно отслеживать все изменения рельефа и природные явления.

Стратегии компьютерного зрения на основе глубокого обучения и нескольких камер для отслеживания дронов

С увеличением использования БПЛА в последние годы растет и беспокойство по поводу безопасности их применения. В связи с этим была разработана новая система, использующая компьютерное зрение и алгоритмы глубокого обучения для точного и быстрого обнаружения и отслеживания беспилотников.

Дрон Zephyr бьет рекорды в стратосфере

Разработанный корпорацией Airbus, беспилотник на солнечных батареях Zephyr устанавливает новые мировые рекорды по продолжительности и высоте полета, оставаясь в воздухе в течение 64 дней на высоте до 22,86 км.

Цифровая магия с "Alchemist": трансформация материалов на изображениях

Исследователи из Лаборатории компьютерных наук и искусственного интеллекта МИТ и Google Research свершили настоящую магию со своей последней разработкой – диффузионная модель, которая может изменять свойства материала объектов на изображениях.

Машинное "разобучение" защищает генеративный ИИ от проблем с авторским правом

Машинное "разобучение" позволяет генеративному ИИ избирательно забывать проблемные данные без длительного переучивания. Этот метод может обеспечить соблюдение правовых и нравственных норм, сохраняя при этом творческие способности моделей для генерации изображений.

Достижение MIT: ИИ генерирует высококачественные изображения в 30 раз быстрее

Исследователи из МІТ разработали новый метод, который упрощает генерацию изображений до одного шага. Команда усовершенствовала существующие модели, такие как Stable Diffusion, продемонстрировав способность нового фреймворка быстро создавать высококачественный визуальный контент.

Stable Diffusion 3 – генератор изображений нового поколения

Stability AI представила новый прорыв в моделях ИИ для генерации изображений – Stable Diffusion 3. Ее расширенный диапазон параметров и архитектура диффузионного трансформатора гарантируют создание сложных, высококачественных изображений и точный перевод текста в визуальный контент.

SORA: новые возможности ИИ для преобразования текста в видео

Последнее творение от OpenAI – Sora – создает увлекательные видео, демонстрируя непревзойденную реалистичность визуальных композиций. Благодаря сочетанию обработки речи и генерации видео, модель может интерпретировать текстовые подсказки, приспосабливаться к разным способам ввода данных и имитировать динамическое движение камеры.

Новое решение от QuData для выявления рака молочной железы с помощью ИИ

QuData представляет компьютеризированную систему диагностики рака молочной железы на основе ИИ. Эта инновационная технология обеспечивает раннее выявление онкопатологий и оперативное вмешательство, знаменуя значительный шаг вперед к доступному, точному и своевременному лечению с лучшими результатами.

Следите за каждым пикселем: оценка движения с OmniMotion

Новейший метод оценки движения позволяет извлекать долгосрочные траектории движения для каждого пикселя в кадре, даже в случае быстрых движений и сложных сцен. Узнайте больше о захватывающей технологии и будущем анализа движения в статье об OmniMotion.

Будущее медицинского обследования: техника отображения позы на основе МО

Новая методика использует видеоанализ для проведения клинической оценки моторной функции на основе конкретных шаблонах поз, что уменьшает необходимость в частых личных медосмотрах и улучшает уход за пациентами.

Мощность гибридного компьютерного зрения: сочетание физики и big data

Новое исследование по совершенствованию технологий компьютерного зрения сочетает науку о больших данных и физику. Такое гибридное компьютерное зрение позволяет ИИ осознанно воспринимать, взаимодействовать и реагировать на внешнюю среду в реальном времени.

Новый метод для повышения точности компьютерного зрения

Исследователи использовали набор простых программ для генерации изображений, чтобы создать набор данных для обучения моделей компьютерного зрения. Такой подход способствует улучшению производительности моделей классификации изображений, обученных на синтетических данных.

Новая "смарт" трость облегчит выполнение ежедневных задач для людей с недостатками зрения

Благодаря достижениям в сфере искусственного интеллекта инженеры из Колорадского Университета в Боулдере работают над новым типом трости для слепых или слабовидящих.

Практическая значимость ИИ для обслуживания клиентов в сфере розничной торговле

Исследователи разработали новые способы использования ИИ вместе с видеонаблюдением для розничной торговли, чтобы лучше понимать поведение потребителей и адаптировать планирование магазинов для увеличения продаж.

Возможности приложения Look to Speak

Приложение Look to Speak от Google способно помочь людям с нарушениями моторики и проблемами речи легче общаться. Используя только глаза, программа позволяет выбирать заранее подготовленные фразы и озвучивать их.

Использование звука для моделирования местности

Исследователи Массачусетского технологического института разработали метод машинного обучения, который точно улавливает и моделирует основную акустику местности, используя лишь небольшое количество звукозаписей.