Стрічка новин про штучний інтелект і машинне навчання

Головні новини та публікації щодня! Будьте на крок попереду: дізнавайтеся першими про нові ідеї, тренди та інновації у сфері технологій

Представляємо NVIDIA Cosmos 3: найдосконалішу базову модель штучного інтелекту

Команда NVIDIA AI випустила Cosmos 3 — уніфіковану модель для фізичної штучного інтелекту. Вона поєднує фізичне міркування, генерацію середовища та генерацію дій для робототехніки та автономних транспортних засобів.

Штучний інтелект навчається розшифровувати графіки

Дослідники з Массачусетського технологічного інституту (MIT) та Лабораторії обчислювальних досліджень MIT-IBM розробили ChartNet — набір даних та серію моделей з відкритим кодом, які перевершують комерційні моделі штучного інтелекту у виконанні таких завдань, як інтерпретація діаграм. Цей прорив може надати можливість...

Масштабування операцій з автономного штучного інтелекту на Amazon Bedrock

Amazon Bedrock надає доступ до генеративної штучної інтелектуальної технології понад 100 000 організацій по всьому світу, пропонуючи широкі можливості для сміливих інновацій. Представляємо Amazon Bedrock Ops Alert — рішення для проактивного моніторингу, призначене для сталого операційного управління робочими навантаженнями штучного інтелекту, яке дає командам можливість досягати реальних бізне...

Gemma 4 12B: революція в мультимодальному ШІ завдяки вбудованій аудіопідтримці на ноутбуці

Компанія Google DeepMind випустила Gemma 4 12B — мультимодальну модель без енкодера для обробки тексту, зображень, аудіо та відео. Модель працює на ноутбуці з 16 ГБ оперативної пам’яті, заповнюючи прогалину між версіями для периферійних пристроїв та більш потужними варіантами; вагові матриці з відкритим кодом доступні для завантаження.

Оптимізація продуктивності контейнерів за допомогою індексу SOCI

AMI для глибокого навчання та контейнери AWS Deep Learning тепер підтримують інструмент створення знімків та індекс SOCI для ефективного управління образами контейнерів. Функція відкладеного завантаження SOCI зменшує використання пропускної здатності мережі та скорочує час запуску контейнерів, що є корисним для організацій, які керують великими образами контейнерів у хмарних середовищах.

Платформа Bailian оновлено з функціями Qwen 3.7-Plus

Команда Qwen компанії Alibaba випустила на платформі Bailian модель Qwen3.7-Plus — мультимодальну велику мовну модель, здатну розуміти зображення та відео. Модель зосереджена на таких агентних функціях, як глибоке міркування та самопрограмування, і націлена на виконання дій, а не лише на надання відповідей.

BigSet: перетворення простої англійської мови на структуровані дані

Компанія TinyFish представляє BigSet — багатоагентну систему з відкритим кодом, призначену для створення структурованих наборів даних на основі даних з Інтернету в режимі реального часу за допомогою введення на природній мові. BigSet автоматизує визначення схеми, збір даних та їх дедуплікацію, а також забезпечує планове оновлення для отримання актуальних наборів даних.

Повний потенціал розпізнавання об’єктів: Amazon Nova 2 Lite

Amazon Nova 2 Lite — це економічно вигідне рішення для виявлення об’єктів, яке не вимагає навчання. Його впровадження за допомогою Amazon Bedrock, AWS Lambda та Amazon API Gateway відбувається швидко та просто, а практичне застосування знаходить у різних галузях.

Максимізація точності регресійного аналізу за допомогою машинного навчання

Демонстраційна модель лінійної регресії демонструє точність 46 % на навчальних даних, перевершуючи базові прогнози. Журнал «Galaxy Science Fiction», відомий своїми вражаючими обкладинками, публікував роботи відомого художника-космолога Чеслі Бонестелла.

Безпечні платежі стали простішими завдяки Amazon Bedrock AgentCore

Система Amazon Bedrock AgentCore Payments, що працює у партнерстві з Coinbase та Stripe, дозволяє агентам отримувати доступ до платних ресурсів від імені кінцевих користувачів. Ризики безпеки, такі як неконтрольовані витрати та відсутність згоди кінцевого користувача, усуваються завдяки встановленню лімітів витрат та обов’язковому отриманню явного дозволу на транзакції.

Розширення можливостей штучного інтелекту за допомогою новітніх технологій NVIDIA

На конференції GTC Taipei компанія NVIDIA представила ПК RTX Spark для персональних агентів, оснащені новими обчислювальними потужностями та можливостями пам'яті для штучного інтелекту. Партнерство з Microsoft дозволяє впровадити безпечні вбудовані агенти в систему Windows, а також оновлення для Hermes Agent та OpenClaw.

Ефективне наближення SVR за допомогою регресії на основі обрізаного ядра

Регресія на ядровому риджі (KRR) та регресія на опорних векторах (SVR) — це методи машинного навчання, які можна поєднати для створення розрідженої моделі KRR, що апроксимує модель SVR. Цей гібридний підхід поєднує в собі переваги KRR щодо обробки великих наборів даних та ефективність SVR у зберіганні моделей, демонструючи високу точність прогнозування в демонстраційному прикладі з використанн...

Покращення локальної лінійної уваги за допомогою корекції коваріації

У новій статті представлено Parallax — параметризовану версію локальної лінійної уваги (LLA) для трансформерів, яка підвищує ефективність без скорочення обчислювальних витрат. Parallax замінює обчислювач лінійних систем у LLA на навчену матрицю проекції, що спрощує алгоритм, підвищує його ефективність та полегшує реалізацію.

Революція штучного інтелекту: OpenAI та Codex тепер доступні на Amazon Bedrock!

Amazon Bedrock тепер пропонує GPT-5.5, GPT-5.4 та Codex для виробничих додатків штучного інтелекту. GPT-5.5 демонструє високу ефективність у програмуванні та роботі з інформацією, а також відрізняється покращеною здатністю виконувати багатоетапні завдання та підвищеною автономністю.

Пришвидшення завантаження моделей LLM за допомогою GPUDirect на Amazon FSx

Розгортання великих мовних моделей на інстансах AWS з графічними процесорами може бути трудомістким процесом, але Amazon FSx for Lustre та NVIDIA GPUDirect Storage дозволяють значно скоротити час завантаження — з хвилин до секунд. Завдяки новій архітектурі NVIDIA Blackwell сервери AWS P6e UltraServer забезпечують величезну обчислювальну потужність для масштабного навчання, оптимізуючи