QuData Новини| За межами людського зору: останні досягнення в галузі комп'ютерного зору

13 Березня, 2026

Інтерактивні світи – новий тренд у сфері AI

Завітайте всередину картин Ван Гога та досліджуйте цілі світи, створені ШІ! На World Labs Hackathon хакери збудували повністю інтерактивні середовища всього за кілька годин, а Project Genie від Google дозволяє будь-кому перетворювати прості промпти або зображення на захопливі світи в реальному часі.

ДІЗНАТИСЯ БІЛЬШЕ

6 Березня, 2026

Потенціал Qwen3.5 від малих до флагманських моделей

Qwen3.5 від Alibaba – це нове покоління мультимодальних ШІ-моделей із нативною інтеграцією зору й мови та ефективною MoE-архітектурою. Вони забезпечують логічне мислення, довгий контекст і значно нижчі обчислювальні витрати, роблячи передовий ШІ доступним як для локальних пристроїв, так і для хмарних систем.

ДІЗНАТИСЯ БІЛЬШЕ

27 Лютого, 2026

APOLLO: Розкриття таємниць клітинного коду

Новий фреймворк APOLLO розділяє загальні біологічні сигнали між різними методами вимірювання та виділяє унікальні для кожного з них. Це дає змогу краще аналізувати стан клітин, прогнозувати невиміряні характеристики, точніше виявляти біомаркери захворювань і прискорювати відкриття у дослідженнях раку, Альцгаймера та інших хвороб.

ДІЗНАТИСЯ БІЛЬШЕ

28 Серпня, 2025

Самонавчальний ШІ переосмислює комп’ютерний зір

Натренована на 1,7 млрд зображень, модель DINOv3 від Meta AI встановлює нові стандарти у класифікації зображень та виявленні об’єктів. Завдяки інноваціям, таким як Gram anchoring, і практичному впливу: від моніторингу вирубки лісів до підтримки досліджень NASA на Марсі – DINOv3 знаменує собою справжній прорив у сфері комп’ютерного зору.

ДІЗНАТИСЯ БІЛЬШЕ

21 Серпня, 2025

Як роботи вчаться мислити разом

MultiRobot FrameWork дозволяє роботам обмінюватися інформацією в режимі реального часу про своє оточення, положення та завдання, відтворюючи колективну поведінку, яка притаманна колоніям комах, але за допомогою сучасних датчиків та обчислювальних потужностей.

ДІЗНАТИСЯ БІЛЬШЕ

15 Серпня, 2025

ШI долає нестачу даних у медичній візуалізації

Новий фреймворк GenSeg значно скорочує потребу в розмічених експертами даних і забезпечує високу точність сегментації медичних зображень лише з 40-50 зразків. Створюючи реалістичні синтетичні датасети з маркуванням, він сприяє розробці передових методів діагностики навіть в умовах обмеженої кількості даних.

ДІЗНАТИСЯ БІЛЬШЕ

20 Червня, 2025

Штучний інтелект отримав кольоровий зір

Штучний синапс з автономним живленням може імітувати сприйняття кольору людиною з роздільною здатністю 10 нанометрів за допомогою сонячних елементів, чутливих до барвників. Ця технологія створює енергоефективні системи ШІ, які здатні до розпізнавання кольорів та їх логічної обробки.

ДІЗНАТИСЯ БІЛЬШЕ

5 Червня, 2025

Штучний інтелект вчиться поєднувати зір і слух

Дослідники з MIT розробили CAV-MAE Sync – AI модель, яка навчається точно пов’язувати звуки з відповідними візуальними ефектами у відео без жодних позначок. Така технологія може наблизити нас до розумнішого ШІ, здатного бачити, чути та розуміти світ так само, як людина.

ДІЗНАТИСЯ БІЛЬШЕ

14 Березня, 2025

Нова АІ-модель покращує рентген-діагностику

ItpCtrl-AI вдосконалює діагностику рентгенівських знімків, імітуючи погляд радіологів та створюючи інтерпретовані теплові карти, що підвищують прозорість і довіру до ШІ в медичній візуалізації. Відфільтровуючи несуттєві дані та зосереджуючись на ключових зонах, модель забезпечує більш точні та зрозумілі результати.

ДІЗНАТИСЯ БІЛЬШЕ

5 Вересня, 2024

Досягнення автономної посадки – нова ера для дронів

Патентне відомство Індії видало патент на інноваційну систему посадки міні-БПЛА. Ця технологія забезпечує точне приземлення у складних місцевостях і має потенційне застосування як у військовій, так і в цивільній логістиці, включаючи екстрену допомогу та доставку на великій висоті.

ДІЗНАТИСЯ БІЛЬШЕ

22 Серпня, 2024

Система запобігання зіткненням трансформує навігацію дронів

Нова система уникнення зіткнень для безпілотників використовує бортові датчики і камери для автономного запобігання аварій у повітрі. Ця технологія має на меті сприяти безпечній та ефективній роботі БПЛА у все більш переповненому повітряному просторі.

ДІЗНАТИСЯ БІЛЬШЕ

15 Серпня, 2024

Удосконалена система зору, створена за прикладом очей богомола

Нова система комп’ютерного зору значно зменшує енергоспоживання і забезпечує просторове усвідомлення в режимі реального часу. Вона покращує здатність ШІ точно сприймати 3D-простір і має вирішальне значення для таких технологій, як безпілотні автомобілі та дрони.

ДІЗНАТИСЯ БІЛЬШЕ

8 Серпня, 2024

MAIA: автоматизований агент для інтерпретації моделей ШІ

Проводячи експерименти та покращуючи їх аналіз, MAIA може інтерпретувати нейронні мережі, що підвищує розуміння роботи ШІ моделей. Цей агент може визначати активність нейронів, видаляти нерелевантні функції та виявляти упередження, роблячи системи ШІ безпечнішими та більш прозорими.

ДІЗНАТИСЯ БІЛЬШЕ

25 Липня, 2024

Розуміння поведінки мурах призвело до прориву в навігації роботів

Натхненні можливостями комах, дослідники створюють автономні навігаційні стратегії для маленьких, легких роботів. Протестована на 56-грамовому безпілотнику, система налаштовує його повернення додому після тривалих подорожей, використовуючи мінімальні обчислення та пам’ять.

ДІЗНАТИСЯ БІЛЬШЕ

11 Липня, 2024

Цифрові моделі рельєфу на основі відкритих даних

Завдяки радарним супутникам, які надають безперервні, високоточні дані про поверхню Землі, та швидкому й доступному програмному забезпеченню з відкритим кодом, цифрові моделі рельєфу створюються усього в один клік. Це дозволяє ефективно відстежувати зміни рельєфу та природні явища.

ДІЗНАТИСЯ БІЛЬШЕ

2 Липня, 2024

Стратегії комп'ютерного зору на основі глибокого навчання та декількох камер для відстеження дронів

Зі значним збільшенням використання БПЛА в останні роки зростає і занепокоєння щодо безпеки їх застосування. У зв'язку з цим була розроблена нова система, яка використовує комп'ютерний зір та алгоритми глибокого навчання для точного та швидкого виявлення і відстеження дронів.

ДІЗНАТИСЯ БІЛЬШЕ

13 Червня, 2024

Дрон Zephyr б’є рекорди в стратосфері

Розроблений корпорацією Airbus, безпілотник на сонячних батареях Zephyr встановлює нові світові рекорди з тривалості та висоти польоту, залишаючись у повітрі протягом 64 днів на висоті до 22,86 км.

ДІЗНАТИСЯ БІЛЬШЕ

30 Травня, 2024

Цифрова магія з “Alchemist”: трансформація матеріалів на зображеннях

Дослідники з Лабораторія комп’ютерних наук і штучного інтелекту МІТ та Google Research вчинили справжню магію зі своєю останньою розробкою – дифузійна модель, яка може змінювати властивості матеріалу об’єктів на зображеннях.

ДІЗНАТИСЯ БІЛЬШЕ

23 Травня, 2024

Нова ера мультимодального ШІ з GPT-4o

Компанія OpenAI презентувала GPT-4о – унікальну омнімодель, яка поєднує обробку тексту, звуку та зображень, що дозволяє їй працювати швидше та ефективніше, ніж будь-коли раніше.

ДІЗНАТИСЯ БІЛЬШЕ

11 Квітня, 2024

Машинне “відучування” захищає генеративний ШІ від проблем з авторськими правами

Машинне "відучування" дозволяє генеративному ШІ вибірково забувати проблемні дані без тривалого перенавчання. Цей метод здатний забезпечити дотримання правових та етичних норм, зберігаючи при цьому творчі здібності моделей з генерації зображень.

ДІЗНАТИСЯ БІЛЬШЕ

28 Березня, 2024

Досягнення МІТ: ШI генерує високоякісні зображення в 30 разів швидше

Дослідники з МІТ розробили новий метод, який спрощує генерацію зображень до одного кроку. Команда вдосконалила існуючі моделі, такі як Stable Diffusion, продемонструвавши здатність нового фреймворку швидко створювати високоякісний візуальний контент.

ДІЗНАТИСЯ БІЛЬШЕ

14 Березня, 2024

Stable Diffusion 3 – генератор зображень нового покоління

Stability AI представила новий прорив у моделях ШІ для генерації зображень – Stable Diffusion 3. Її розширений діапазон параметрів та архітектура дифузійного трансформатора гарантують створення складних, високоякісних зображень та точний переклад тексту в візуальний контент.

ДІЗНАТИСЯ БІЛЬШЕ

7 Березня, 2024

SORA: нові можливості ШІ для перетворення тексту у відео

Останнє творіння від OpenAI – Sora – створює захоплюючі відео, демонструючи неперевершену реалістичність візуальних композицій. Завдяки поєднанню обробки мови та генерації відео, модель може інтерпретувати текстові підказки, пристосовуватися до різних способів введення даних та імітувати динамічний рух камери.

ДІЗНАТИСЯ БІЛЬШЕ

20 Грудня, 2023

Нове рішення від QuData для виявлення раку молочної залози за допомогою ШІ

QuData представляє комп'ютеризовану систему діагностики раку молочної залози на основі ШІ. Ця інноваційна технологія забезпечує раннє виявлення онкопатологій та оперативне втручання, знаменуючи значний крок уперед до доступного, точного та своєчасного лікування з кращими результатами.

ДІЗНАТИСЯ БІЛЬШЕ

25 Жовтня, 2023

Слідкуйте за кожним пікселем: оцінка руху з OmniMotion

Новий метод оцінки руху дозволяє отримувати довгострокові траєкторії руху для кожного пікселя в кадрі, навіть у разі швидких рухів та складних сцен. Дізнайтеся більше про захоплюючу технологію та майбутній аналіз руху в статті про OmniMotion.

ДІЗНАТИСЯ БІЛЬШЕ

22 Вересня, 2023

Майбутнє медичного обстеження: техніка відображення пози на основі МН

Нова методика використовує відеоаналіз для проведення клінічної оцінки моторної функції на основі конкретних шаблонів поз, що зменшує необхідність у частих особистих медоглядах та покращує догляд за пацієнтами.

ДІЗНАТИСЯ БІЛЬШЕ

7 Вересня, 2023

Емпіричне дослідження та оцінка сучасних CAPTCHA

Останні дослідження демонструють, що, незважаючи на широке використання CAPTCHA як захисту від автоматизації, сучасні боти краще і швидше вирішують завдання CAPTCHA ніж люди.

ДІЗНАТИСЯ БІЛЬШЕ

4 Серпня, 2023

Потужність гібридного комп’ютерного зору: поєднання фізики та big data

Нове дослідження по вдосконаленню технологій комп’ютерного зору поєднує науки про великі дані та фізику. Таке гібридне комп’ютерне бачення дозволяє ШІ усвідомленно сприймати, взаємодіяти та реагувати на зовнішнє середовище в реальному часі.

ДІЗНАТИСЯ БІЛЬШЕ

3 Травня, 2023

Новий метод для підвищення точності комп'ютерного зору

Дослідники використали набір простих програм для генерації зображень, щоб створити набір даних та навчити модель комп'ютерного зору. Такий підхід сприяє покращенню продуктивності моделей класифікації зображень, навчених на синтетичних даних.

ДІЗНАТИСЯ БІЛЬШЕ

31 Січня, 2023

Нова "смарт" палиця полегшить виконання щоденних завдань для людей із вадами зору

Завдяки досягненням у сфері штучного інтелекту інженери з Колорадського Університету в Боулдері працюють над новим типом тростини для сліпих або людей із вадами зору.

ДІЗНАТИСЯ БІЛЬШЕ

7 Грудня, 2022

Практичне значення ШІ для обслуговування клієнтів у сфері роздрібної торгівлі

Дослідники запропонували нові способи використання ШІ разом із відеоспостереженням для роздрібної торгівлі, щоб краще розуміти поведінку споживачів та адаптувати планування магазинів для збільшення продажів.

ДІЗНАТИСЯ БІЛЬШЕ

21 Листопада, 2022

Можливості додатку Look to Speak

Додаток Look to Speak від Google здатний допомогти людям з порушеннями моторики та проблемами мовлення легше спілкуватися. Використовуючи лише очі, програма дозволяє вибирати заздалегідь підготовлені фрази і озвучувати їх.

ДІЗНАТИСЯ БІЛЬШЕ

14 Листопада, 2022

Використання звуку для моделювання місцевості

Дослідники з Массачусетського технологічного інституту розробили техніку машинного навчання, яка точно фіксує та моделює основну акустику місцевості лише з невеликої кількості звукових записів.

ДІЗНАТИСЯ БІЛЬШЕ