QuData Новости| За пределами человеческого зрения: последние достижения в области компьютерного зрения

13 Марта, 2026

Интерактивные миры – новый тренд в сфере AI

Погрузитесь в картины Ван Гога и исследуйте целые виртуальные миры, созданные ИИ! На World Labs Hackathon хакеры создали полностью интерактивные среды всего за несколько часов, а Project Genie от Google позволяет любому превращать простые промпты или изображения в увлекательные миры в реальном времени.

ПОДРОБНЕЕ

6 Марта, 2026

Потенциал Qwen3.5 от малых до флагманских моделей

Qwen3.5 от Alibaba – это новое поколение мультимодальных моделей с нативной интеграцией зрения и языка и эффективной MoE-архитектурой. Они обеспечивают логическое мышление, длинный контекст и значительно ниже вычислительные затраты, делая передовой ИИ доступным как для локальных устройств, так и для облачных систем.

ПОДРОБНЕЕ

27 Февраля, 2026

APOLLO: Раскрытие тайн клеточного кода

Новый фреймворк APOLLO разделяет общие биологические сигналы между разными методами измерения и выделяет уникальные для каждого из них. Это позволяет лучше анализировать состояние клеток, прогнозировать неизмеримые характеристики, точнее выявлять биомаркеры заболеваний и ускорять открытия в исследованиях рака, Альцгеймера и др.

ПОДРОБНЕЕ

28 Августа, 2025

Самообучающийся ИИ переосмысливает компьютерное зрение

Обученная на 1,7 млрд изображений, модель DINOv3 от Meta AI задает новые стандарты в классификации изображений и обнаружении объектов. Благодаря инновациям, таким как Gram anchoring, и практическому влиянию: от мониторинга вырубки лесов до поддержки исследований NASA на Марсе – DINOv3 является настоящим прорывом в сфере компьютерного зрения.

ПОДРОБНЕЕ

21 Августа, 2025

Как роботы учатся мыслить вместе

MultiRobot FrameWork позволяет роботам обмениваться информацией в режиме реального времени о своем окружении, положении и задачах, воспроизводя коллективное поведение, присущее колониям насекомых, но с помощью современных датчиков и вычислительных мощностей.

ПОДРОБНЕЕ

15 Августа, 2025

ИИ преодолевает нехватку данных в медицинской визуализации

Новый фреймворк GenSeg значительно сокращает потребность в размеченных данных и обеспечивает высокую точность сегментации медицинских снимков всего с 40-50 образцов. Создавая синтетические датасеты с маркировкой, он способствует разработке передовых методов диагностически даже в условиях ограниченного количества данных.

ПОДРОБНЕЕ

20 Июня, 2025

Искусственный интеллект научился распознавать цвета

Искусственный синапс с автономным питанием может имитировать цветовосприятие человеком с разрешением 10 нанометров с помощью солнечных элементов, чувствительных к красителям. Эта технология создает энергоэффективные системы ИИ, способные к распознаванию цветов и их логической обработке.

ПОДРОБНЕЕ

5 Июня, 2025

Искусственный интеллект учится объединять зрение и слух

Исследователи из MIT разработали CAV-MAE Sync – AI модель, которая учится точно связывать звуки с соответствующими визуальными эффектами в видео без каких-либо пометок. Такая технология может приблизить нас к более умному ИИ, способного видеть, слышать и понимать мир так же, как человек.

ПОДРОБНЕЕ

14 Марта, 2025

Новая ИИ-модель улучшает рентген-диагностику

ItpCtrl-AI улучшает диагностику рентгеновских снимков, имитируя взгляд радиологов и создавая интерпретированные тепловые карты, которые повышают прозрачность и доверие к ИИ в медицинской визуализации. Фильтруя несущественные данные и фокусируясь на ключевых зонах, модель обеспечивает более точные и понятные результаты.

ПОДРОБНЕЕ

5 Сентября, 2024

Достижение автономной посадки – новая эра для дронов

Патентное ведомство Индии выдало патент на инновационную систему посадки мини-БПЛА. Эта технология обеспечивает точное приземление в сложных местностях и имеет потенциальное применение как в военной, так и гражданской логистике, включая экстренную помощь и доставку на большой высоте.

ПОДРОБНЕЕ

22 Августа, 2024

Система предотвращения столкновений трансформирует навигацию дронов

Новая система избегания столкновений для беспилотников использует бортовые датчики и камеры для автономного предотвращения аварий в воздухе. Целью этой технологии является содействие безопасной и эффективной работе БПЛА во все более переполненном воздушном пространстве.

ПОДРОБНЕЕ

15 Августа, 2024

Усовершенствованная система зрения, созданная по примеру глаз богомола

Новая система компьютерного зрения значительно уменьшает энергопотребление и обеспечивает пространственное осознание в режиме реального времени. Она улучшает способность ИИ точно воспринимать 3D-пространство и имеет решающее значение для таких технологий, как беспилотные автомобили и дроны.

ПОДРОБНЕЕ

8 Августа, 2024

MAIA: автоматизированный агент для интерпретации моделей ИИ

Проводя эксперименты и совершенствуя их анализ, MAIA может интерпретировать нейронные сети, что повышает понимание работы ИИ моделей. Этот агент может определять активность нейронов, удалять нерелевантные функции и выявлять предубеждения, делая системы ИИ более безопасными и прозрачными.

ПОДРОБНЕЕ

25 Июля, 2024

Изучение поведения муравьев привело к прорыву в навигации роботов

Вдохновленные насекомыми, ученые создают автономные навигационные стратегии для маленьких, легких роботов. Протестированная на 56-граммовом беспилотнике, система настраивает его возвращение домой после длительных путешествий, используя минимальные вычисления и память.

ПОДРОБНЕЕ

11 Июля, 2024

Цифровые модели рельефа на основе открытых данных

Благодаря радарным спутникам, предоставляющим высокоточные данные о поверхности Земли, быстрому и доступному программному обеспечению с открытым кодом, цифровые модели рельефа создаются всего в один клик. Это позволяет эффективно отслеживать все изменения рельефа и природные явления.

ПОДРОБНЕЕ

2 Июля, 2024

Стратегии компьютерного зрения на основе глубокого обучения и нескольких камер для отслеживания дронов

С увеличением использования БПЛА в последние годы растет и беспокойство по поводу безопасности их применения. В связи с этим была разработана новая система, использующая компьютерное зрение и алгоритмы глубокого обучения для точного и быстрого обнаружения и отслеживания беспилотников.

ПОДРОБНЕЕ

13 Июня, 2024

Дрон Zephyr бьет рекорды в стратосфере

Разработанный корпорацией Airbus, беспилотник на солнечных батареях Zephyr устанавливает новые мировые рекорды по продолжительности и высоте полета, оставаясь в воздухе в течение 64 дней на высоте до 22,86 км.

ПОДРОБНЕЕ

30 Мая, 2024

Цифровая магия с "Alchemist": трансформация материалов на изображениях

Исследователи из Лаборатории компьютерных наук и искусственного интеллекта МИТ и Google Research свершили настоящую магию со своей последней разработкой – диффузионная модель, которая может изменять свойства материала объектов на изображениях.

ПОДРОБНЕЕ

23 Мая, 2024

Новая эпоха мультимодального ИИ с GPT-4o

Компания OpenAI представила GPT-4о – уникальную омнимодель, объединяющую обработку текста, звука и изображений, что позволяет ей работать быстрее и эффективнее, чем когда-либо прежде.

ПОДРОБНЕЕ

11 Апреля, 2024

Машинное "разобучение" защищает генеративный ИИ от проблем с авторским правом

Машинное "разобучение" позволяет генеративному ИИ избирательно забывать проблемные данные без длительного переучивания. Этот метод может обеспечить соблюдение правовых и нравственных норм, сохраняя при этом творческие способности моделей для генерации изображений.

ПОДРОБНЕЕ

28 Марта, 2024

Достижение MIT: ИИ генерирует высококачественные изображения в 30 раз быстрее

Исследователи из МІТ разработали новый метод, который упрощает генерацию изображений до одного шага. Команда усовершенствовала существующие модели, такие как Stable Diffusion, продемонстрировав способность нового фреймворка быстро создавать высококачественный визуальный контент.

ПОДРОБНЕЕ

14 Марта, 2024

Stable Diffusion 3 – генератор изображений нового поколения

Stability AI представила новый прорыв в моделях ИИ для генерации изображений – Stable Diffusion 3. Ее расширенный диапазон параметров и архитектура диффузионного трансформатора гарантируют создание сложных, высококачественных изображений и точный перевод текста в визуальный контент.

ПОДРОБНЕЕ

7 Марта, 2024

SORA: новые возможности ИИ для преобразования текста в видео

Последнее творение от OpenAI – Sora – создает увлекательные видео, демонстрируя непревзойденную реалистичность визуальных композиций. Благодаря сочетанию обработки речи и генерации видео, модель может интерпретировать текстовые подсказки, приспосабливаться к разным способам ввода данных и имитировать динамическое движение камеры.

ПОДРОБНЕЕ

20 Декабря, 2023

Новое решение от QuData для выявления рака молочной железы с помощью ИИ

QuData представляет компьютеризированную систему диагностики рака молочной железы на основе ИИ. Эта инновационная технология обеспечивает раннее выявление онкопатологий и оперативное вмешательство, знаменуя значительный шаг вперед к доступному, точному и своевременному лечению с лучшими результатами.

ПОДРОБНЕЕ

25 Октября, 2023

Следите за каждым пикселем: оценка движения с OmniMotion

Новейший метод оценки движения позволяет извлекать долгосрочные траектории движения для каждого пикселя в кадре, даже в случае быстрых движений и сложных сцен. Узнайте больше о захватывающей технологии и будущем анализа движения в статье об OmniMotion.

ПОДРОБНЕЕ

22 Сентября, 2023

Будущее медицинского обследования: техника отображения позы на основе МО

Новая методика использует видеоанализ для проведения клинической оценки моторной функции на основе конкретных шаблонах поз, что уменьшает необходимость в частых личных медосмотрах и улучшает уход за пациентами.

ПОДРОБНЕЕ

7 Сентября, 2023

Эмпирическое исследование и оценка современных CAPTCHA

Последние исследования показывают, что, несмотря на широкое использование CAPTCHA в качестве защиты от автоматизации, современные боты лучше и быстрее решают задачи CAPTCHA, чем люди.

ПОДРОБНЕЕ

4 Августа, 2023

Мощность гибридного компьютерного зрения: сочетание физики и big data

Новое исследование по совершенствованию технологий компьютерного зрения сочетает науку о больших данных и физику. Такое гибридное компьютерное зрение позволяет ИИ осознанно воспринимать, взаимодействовать и реагировать на внешнюю среду в реальном времени.

ПОДРОБНЕЕ

3 Мая, 2023

Новый метод для повышения точности компьютерного зрения

Исследователи использовали набор простых программ для генерации изображений, чтобы создать набор данных для обучения моделей компьютерного зрения. Такой подход способствует улучшению производительности моделей классификации изображений, обученных на синтетических данных.

ПОДРОБНЕЕ

31 Января, 2023

Новая "смарт" трость облегчит выполнение ежедневных задач для людей с недостатками зрения

Благодаря достижениям в сфере искусственного интеллекта инженеры из Колорадского Университета в Боулдере работают над новым типом трости для слепых или слабовидящих.

ПОДРОБНЕЕ

7 Декабря, 2022

Практическая значимость ИИ для обслуживания клиентов в сфере розничной торговле

Исследователи разработали новые способы использования ИИ вместе с видеонаблюдением для розничной торговли, чтобы лучше понимать поведение потребителей и адаптировать планирование магазинов для увеличения продаж.

ПОДРОБНЕЕ

21 Ноября, 2022

Возможности приложения Look to Speak

Приложение Look to Speak от Google способно помочь людям с нарушениями моторики и проблемами речи легче общаться. Используя только глаза, программа позволяет выбирать заранее подготовленные фразы и озвучивать их.

ПОДРОБНЕЕ

14 Ноября, 2022

Использование звука для моделирования местности

Исследователи Массачусетского технологического института разработали метод машинного обучения, который точно улавливает и моделирует основную акустику местности, используя лишь небольшое количество звукозаписей.

ПОДРОБНЕЕ