Новини

Свіжі новини та корисні статті про штучний інтелект і машинне навчання

Інтерактивні світи – новий тренд у сфері AI

Завітайте всередину картин Ван Гога та досліджуйте цілі світи, створені ШІ! На World Labs Hackathon хакери збудували повністю інтерактивні середовища всього за кілька годин, а Project Genie від Google дозволяє будь-кому перетворювати прості промпти або зображення на захопливі світи в реальному часі.

Потенціал Qwen3.5 від малих до флагманських моделей

Qwen3.5 від Alibaba – це нове покоління мультимодальних ШІ-моделей із нативною інтеграцією зору й мови та ефективною MoE-архітектурою. Вони забезпечують логічне мислення, довгий контекст і значно нижчі обчислювальні витрати, роблячи передовий ШІ доступним як для локальних пристроїв, так і для хмарних систем.

APOLLO: Розкриття таємниць клітинного коду

Новий фреймворк APOLLO розділяє загальні біологічні сигнали між різними методами вимірювання та виділяє унікальні для кожного з них. Це дає змогу краще аналізувати стан клітин, прогнозувати невиміряні характеристики, точніше виявляти біомаркери захворювань і прискорювати відкриття у дослідженнях раку, Альцгаймера та інших хвороб.

Самонавчальний ШІ переосмислює комп’ютерний зір

Натренована на 1,7 млрд зображень, модель DINOv3 від Meta AI встановлює нові стандарти у класифікації зображень та виявленні об’єктів. Завдяки інноваціям, таким як Gram anchoring, і практичному впливу: від моніторингу вирубки лісів до підтримки досліджень NASA на Марсі – DINOv3 знаменує собою справжній прорив у сфері комп’ютерного зору.

Як роботи вчаться мислити разом

MultiRobot FrameWork дозволяє роботам обмінюватися інформацією в режимі реального часу про своє оточення, положення та завдання, відтворюючи колективну поведінку, яка притаманна колоніям комах, але за допомогою сучасних датчиків та обчислювальних потужностей.

ШI долає нестачу даних у медичній візуалізації

Новий фреймворк GenSeg значно скорочує потребу в розмічених експертами даних і забезпечує високу точність сегментації медичних зображень лише з 40-50 зразків. Створюючи реалістичні синтетичні датасети з маркуванням, він сприяє розробці передових методів діагностики навіть в умовах обмеженої кількості даних.

Штучний інтелект отримав кольоровий зір

Штучний синапс з автономним живленням може імітувати сприйняття кольору людиною з роздільною здатністю 10 нанометрів за допомогою сонячних елементів, чутливих до барвників. Ця технологія створює енергоефективні системи ШІ, які здатні до розпізнавання кольорів та їх логічної обробки.

Штучний інтелект вчиться поєднувати зір і слух

Дослідники з MIT розробили CAV-MAE Sync – AI модель, яка навчається точно пов’язувати звуки з відповідними візуальними ефектами у відео без жодних позначок. Така технологія може наблизити нас до розумнішого ШІ, здатного бачити, чути та розуміти світ так само, як людина.

Нова АІ-модель покращує рентген-діагностику

ItpCtrl-AI вдосконалює діагностику рентгенівських знімків, імітуючи погляд радіологів та створюючи інтерпретовані теплові карти, що підвищують прозорість і довіру до ШІ в медичній візуалізації. Відфільтровуючи несуттєві дані та зосереджуючись на ключових зонах, модель забезпечує більш точні та зрозумілі результати.

Досягнення автономної посадки – нова ера для дронів

Патентне відомство Індії видало патент на інноваційну систему посадки міні-БПЛА. Ця технологія забезпечує точне приземлення у складних місцевостях і має потенційне застосування як у військовій, так і в цивільній логістиці, включаючи екстрену допомогу та доставку на великій висоті.

Система запобігання зіткненням трансформує навігацію дронів

Нова система уникнення зіткнень для безпілотників використовує бортові датчики і камери для автономного запобігання аварій у повітрі. Ця технологія має на меті сприяти безпечній та ефективній роботі БПЛА у все більш переповненому повітряному просторі.

Удосконалена система зору, створена за прикладом очей богомола

Нова система комп’ютерного зору значно зменшує енергоспоживання і забезпечує просторове усвідомлення в режимі реального часу. Вона покращує здатність ШІ точно сприймати 3D-простір і має вирішальне значення для таких технологій, як безпілотні автомобілі та дрони.

MAIA: автоматизований агент для інтерпретації моделей ШІ

Проводячи експерименти та покращуючи їх аналіз, MAIA може інтерпретувати нейронні мережі, що підвищує розуміння роботи ШІ моделей. Цей агент може визначати активність нейронів, видаляти нерелевантні функції та виявляти упередження, роблячи системи ШІ безпечнішими та більш прозорими.

Розуміння поведінки мурах призвело до прориву в навігації роботів

Натхненні можливостями комах, дослідники створюють автономні навігаційні стратегії для маленьких, легких роботів. Протестована на 56-грамовому безпілотнику, система налаштовує його повернення додому після тривалих подорожей, використовуючи мінімальні обчислення та пам’ять.

Цифрові моделі рельєфу на основі відкритих даних

Завдяки радарним супутникам, які надають безперервні, високоточні дані про поверхню Землі, та швидкому й доступному програмному забезпеченню з відкритим кодом, цифрові моделі рельєфу створюються усього в один клік. Це дозволяє ефективно відстежувати зміни рельєфу та природні явища.

Стратегії комп'ютерного зору на основі глибокого навчання та декількох камер для відстеження дронів

Зі значним збільшенням використання БПЛА в останні роки зростає і занепокоєння щодо безпеки їх застосування. У зв'язку з цим була розроблена нова система, яка використовує комп'ютерний зір та алгоритми глибокого навчання для точного та швидкого виявлення і відстеження дронів.

Цифрова магія з “Alchemist”: трансформація матеріалів на зображеннях

Дослідники з Лабораторія комп’ютерних наук і штучного інтелекту МІТ та Google Research вчинили справжню магію зі своєю останньою розробкою – дифузійна модель, яка може змінювати властивості матеріалу об’єктів на зображеннях.

Машинне “відучування” захищає генеративний ШІ від проблем з авторськими правами

Машинне "відучування" дозволяє генеративному ШІ вибірково забувати проблемні дані без тривалого перенавчання. Цей метод здатний забезпечити дотримання правових та етичних норм, зберігаючи при цьому творчі здібності моделей з генерації зображень.

Досягнення МІТ: ШI генерує високоякісні зображення в 30 разів швидше

Дослідники з МІТ розробили новий метод, який спрощує генерацію зображень до одного кроку. Команда вдосконалила існуючі моделі, такі як Stable Diffusion, продемонструвавши здатність нового фреймворку швидко створювати високоякісний візуальний контент.

Stable Diffusion 3 – генератор зображень нового покоління

Stability AI представила новий прорив у моделях ШІ для генерації зображень – Stable Diffusion 3. Її розширений діапазон параметрів та архітектура дифузійного трансформатора гарантують створення складних, високоякісних зображень та точний переклад тексту в візуальний контент.

SORA: нові можливості ШІ для перетворення тексту у відео

Останнє творіння від OpenAI – Sora – створює захоплюючі відео, демонструючи неперевершену реалістичність візуальних композицій. Завдяки поєднанню обробки мови та генерації відео, модель може інтерпретувати текстові підказки, пристосовуватися до різних способів введення даних та імітувати динамічний рух камери.

Нове рішення від QuData для виявлення раку молочної залози за допомогою ШІ

QuData представляє комп'ютеризовану систему діагностики раку молочної залози на основі ШІ. Ця інноваційна технологія забезпечує раннє виявлення онкопатологій та оперативне втручання, знаменуючи значний крок уперед до доступного, точного та своєчасного лікування з кращими результатами.

Слідкуйте за кожним пікселем: оцінка руху з OmniMotion

Новий метод оцінки руху дозволяє отримувати довгострокові траєкторії руху для кожного пікселя в кадрі, навіть у разі швидких рухів та складних сцен. Дізнайтеся більше про захоплюючу технологію та майбутній аналіз руху в статті про OmniMotion.

Майбутнє медичного обстеження: техніка відображення пози на основі МН

Нова методика використовує відеоаналіз для проведення клінічної оцінки моторної функції на основі конкретних шаблонів поз, що зменшує необхідність у частих особистих медоглядах та покращує догляд за пацієнтами.

Потужність гібридного комп’ютерного зору: поєднання фізики та big data

Нове дослідження по вдосконаленню технологій комп’ютерного зору поєднує науки про великі дані та фізику. Таке гібридне комп’ютерне бачення дозволяє ШІ усвідомленно сприймати, взаємодіяти та реагувати на зовнішнє середовище в реальному часі.

Новий метод для підвищення точності комп'ютерного зору

Дослідники використали набір простих програм для генерації зображень, щоб створити набір даних та навчити модель комп'ютерного зору. Такий підхід сприяє покращенню продуктивності моделей класифікації зображень, навчених на синтетичних даних.

Нова "смарт" палиця полегшить виконання щоденних завдань для людей із вадами зору

Завдяки досягненням у сфері штучного інтелекту інженери з Колорадського Університету в Боулдері працюють над новим типом тростини для сліпих або людей із вадами зору.

Практичне значення ШІ для обслуговування клієнтів у сфері роздрібної торгівлі

Дослідники запропонували нові способи використання ШІ разом із відеоспостереженням для роздрібної торгівлі, щоб краще розуміти поведінку споживачів та адаптувати планування магазинів для збільшення продажів.

Можливості додатку Look to Speak

Додаток Look to Speak від Google здатний допомогти людям з порушеннями моторики та проблемами мовлення легше спілкуватися. Використовуючи лише очі, програма дозволяє вибирати заздалегідь підготовлені фрази і озвучувати їх.

Використання звуку для моделювання місцевості

Дослідники з Массачусетського технологічного інституту розробили техніку машинного навчання, яка точно фіксує та моделює основну акустику місцевості лише з невеликої кількості звукових записів.