Новини

Свіжі новини та корисні статті про штучний інтелект і машинне навчання

Справжній трансформер: дрон змінює форму в польоті

ATMO – це робот, який змінює форму просто в повітрі, перетворюючись із літаючого дрона на наземний всюдихід. Подолавши проблему гібридних роботів, що застряють на пересіченій місцевості, це інженерне досягнення відкриває нові можливості для автономної доставки, реагування на надзвичайні ситуації та дослідження інших планет.

Штучний інтелект вчиться поєднувати зір і слух

Дослідники з MIT розробили CAV-MAE Sync – AI модель, яка навчається точно пов’язувати звуки з відповідними візуальними ефектами у відео без жодних позначок. Така технологія може наблизити нас до розумнішого ШІ, здатного бачити, чути та розуміти світ так само, як людина.

Google I/O 2025: АІ в основі повсякденних технологій

Ми зібрали найцікавіші інновації з конференції Google I/O 2025, які демонструють як ШІ кардинально змінює пошук, відеогенерацію та спілкування. Нові досягнення переосмислюють повсякденні технології, роблячи їх розумнішими, більш інтуїтивними та персоналізованими, ніж будь-коли раніше.

Проблема “галюцинацій” штучного інтелекту загострюється

Найсучасніші моделі штучного інтелекту від технологічних лідерів, таких як OpenAI та DeepSeek, почали дедалі частіше генерувати неправдиву інформацію. Причини цього досі невідомі. Стрімке зростання “галюцинацій” ставить під загрозу довіру користувачів до ШІ.

Phi-4 – малі моделі, великі результати

Сімейство Phi-4 від Microsoft – це нове покоління малих мовних моделей, які створені для вирішення складних завдань, таких як програмування, математика та планування, і які часто перевершують великі моделі. Вони наводять переконливі міркування, залишаючись при цьому ефективними для використання в середовищах з низькою затримкою.

Програмування без правил! Що таке вайб-кодинг?

Навіщо перейматись кожним рядком коду, якщо ШІ може "вловити вайб" і написати все за вас? Вайб-кодинг – це стрімко зростаючий тренд, у якому розробники дозволяють АІ взяти контроль за написання коду, перетворюючи програмування на більш інтуїтивний та спонтанний процес.

NVIDIA відкрила ігрову фізику для всіх

NVIDIA офіційно зробила рушій PhysX та Flow SDK повністю відкритими, включаючи довгоочікуваний код ядра GPU-симуляції, під ліцензією BSD-3. Тепер розробники можуть налаштовувати, переносити та відновлювати складні симуляції на різних платформах – навіть на графічних процесорах не від NVIDIA.

Швидше, розумніше, реалістичніше – чим здивує Midjourney?

Midjourney випустила V7, свою найпотужнішу модель генерації зображень, яка вражає кращим розумінням текстових промптів та персоналізацією арту в реальному часі. Оновлена архітектура V7 забезпечує кращу узгодженість об'єктів і реалістичність текстур та впроваджує новий режим Draft для швидких ітерацій зображень.

Super-Turing AI: Імітація навчання людського мозку

Нова нейронна система, яка імітує процеси навчання мозку, відкриває шлях до швидшого і більш ефективного ШІ. Використовуючи принципи геббіанського навчання та пластичність, залежну від часу спайків, ця технологія може значно підвищити продуктивність ШІ, водночас зменшуючи екологічні та економічні витрати.

Нова АІ-модель покращує рентген-діагностику

ItpCtrl-AI вдосконалює діагностику рентгенівських знімків, імітуючи погляд радіологів та створюючи інтерпретовані теплові карти, що підвищують прозорість і довіру до ШІ в медичній візуалізації. Відфільтровуючи несуттєві дані та зосереджуючись на ключових зонах, модель забезпечує більш точні та зрозумілі результати.

GPT-4.5 – новий етап у розвитку штучного інтелекту

GPT-4.5, найдосконаліший ШІ від OpenAI, має покращене розуміння природної мови, посилений емоційний інтелект та більш природні діалоги. Модель чудово справляється з креативним письмом, мозковим штурмом і вирішенням проблем, мінімізуючи галюцинації ШІ для більш надійних результатів.

Політ наосліп: як керувати дроном у повній темряві

Дослідники розробили MiFly – малопотужну радіочастотну систему, яка дозволяє БПЛА самостійно орієнтуватися в умовах недостатньої видимості чи повної темряви. Мітка зворотного розсіювання та радар із подвійною поляризацією дозволяють MiFly рухатись, не покладаючись на візуальні підказки чи зовнішню інфраструктуру.

NVIDIA Cosmos – секретна зброя робототехніки

Платформа NVIDIA Cosmos прискорює розвиток робототехніки, безпілотного транспорту та промислової автоматизації завдяки новаторським моделям WFM. Створюючи фотореалістичні 3D-середовища, Cosmos дозволяє розробникам навчати автономні системи не покладаючись на дорогі набори реальних даних.

Найбільша AI-модель з відкритим кодом для генерації відео

HunyuanVideo – найбільша AI-модель для генерації відео з відкритим кодом, яка має 13 млрд параметрів для створення високоякісних кінематографічних відео з реалістичним рухом та ідеально синхронізованим звуком. Модель забезпечує неперевершену точність, встановлюючи новий стандарт для AI-контенту.

Геніальність стратегії двох траєкторій безпілотника SUPER

Система планування за двома траєкторіями дозволяє БПЛА досліджувати невідомі маршрути, завжди зберігаючи при цьому безпечний запасний шлях. Завдяки LiDAR-зондуванню та алгоритму CIRI дрони формують курс польоту в реальному часі для швидкої навігації в непередбачуваних умовах.

Від тексту до 3D: магія моделі Edify 3D від NVIDIA

Edify 3D від NVIDIA створює високоякісні 3D-моделі менш ніж за 2 хвилини за допомогою AI. Це ідеальне рішення для ігор, анімації та дизайну, яке поєднує дифузійні моделі та трансформери, забезпечуючи швидку, точну та масштабовану генерацію 3D-об'єктів з тексту чи зображень.

Microsoft запускає модель Phi-4 з повністю відкритими вагами

Microsoft випустила модель Phi-4 з відкритими вагами за ліцензією MIT, відкриваючи дослідникам та розробникам нові можливості у галузі ШІ. Завдяки 14 млрд параметрів Phi-4 перевершує аналоги у вирішенні математичних завдань та багатозадачності, забезпечуючи ефективну роботу при обмежених ресурсах.