Компанія Miso Labs представляє MisoTTS — модель перетворення тексту в мову з 8 мільярдами параметрів, яка використовує алгоритм RVQ для розширення звукового діапазону та адаптації до інтонації мовця. Вирішуючи проблеми, пов’язані з розміром словника та обумовленням, MisoTTS забезпечує підтримку 2048³² токенів без додавання додаткових параметрів, перевершуючи конкурентів за показниками затримки.
Штучний інтелект повинен підбирати відповідні інструменти для виконання завдань, щоб уникнути помилок і затримок. Дізнайтеся, як SFT і DPO підвищують точність виклику інструментів у мовних моделях для надійної автоматизації.
Amazon Bedrock надає доступ до генеративної штучної інтелектуальної технології понад 100 000 організацій по всьому світу, пропонуючи широкі можливості для сміливих інновацій. Представляємо Amazon Bedrock Ops Alert — рішення для проактивного моніторингу, призначене для сталого операційного управління робочими навантаженнями штучного інтелекту, яке дає командам можливість досягати реальних бізне...
AMI для глибокого навчання та контейнери AWS Deep Learning тепер підтримують інструмент створення знімків та індекс SOCI для ефективного управління образами контейнерів. Функція відкладеного завантаження SOCI зменшує використання пропускної здатності мережі та скорочує час запуску контейнерів, що є корисним для організацій, які керують великими образами контейнерів у хмарних середовищах.
Під час тестування коду на наборі даних про діабет модель scikit SVR показала низьку точність прогнозування. Модель Kernel SVR перевершила лінійну модель SVR завдяки своїй потужності та масштабованості, що тісно пов’язано з алгоритмом KRR.
Команда NVIDIA AI випустила Cosmos 3 — уніфіковану модель для фізичної штучного інтелекту. Вона поєднує фізичне міркування, генерацію середовища та генерацію дій для робототехніки та автономних транспортних засобів.
Дослідники з Массачусетського технологічного інституту (MIT) та Лабораторії обчислювальних досліджень MIT-IBM розробили ChartNet — набір даних та серію моделей з відкритим кодом, які перевершують комерційні моделі штучного інтелекту у виконанні таких завдань, як інтерпретація діаграм. Цей прорив може надати можливість...
Компанія Google DeepMind випустила Gemma 4 12B — мультимодальну модель без енкодера для обробки тексту, зображень, аудіо та відео. Модель працює на ноутбуці з 16 ГБ оперативної пам’яті, заповнюючи прогалину між версіями для периферійних пристроїв та більш потужними варіантами; вагові матриці з відкритим кодом доступні для завантаження.
У 2026 році штучний інтелект чудово справляється з такими завданнями, як обслуговування клієнтів, але зазнає труднощів із складними запитами. Дослідники з Массачусетського технологічного інституту та Гарвардського університету вдосконалили здатність штучного інтелекту ставити запитання за допомогою гри «Морський бій», що дозволило досягти значного підвищення продуктивності та ефективності.
Amazon SageMaker AI тепер підтримує модель NEXUS від Fundamental, що дозволяє отримувати точні прогнози щодо табличних даних за лічені дні. NEXUS забезпечує детерміновані результати, вбудоване розуміння табличних даних та несеквенційне міркування для аналізу структурованих даних.
Тод Мачовер, піонер у галузі музичних технологій з MIT Media Lab, отримав медаль Джорджа Пібоді за новаторську роботу в галузі штучного інтелекту та інтерактивної опери. Мачовер, якого називають музичним провидцем, розширює межі та можливості музики для всіх.
Amazon Nova 2 Lite — це економічно вигідне рішення для виявлення об’єктів, яке не вимагає навчання. Його впровадження за допомогою Amazon Bedrock, AWS Lambda та Amazon API Gateway відбувається швидко та просто, а практичне застосування знаходить у різних галузях.
Демонстраційна модель лінійної регресії демонструє точність 46 % на навчальних даних, перевершуючи базові прогнози. Журнал «Galaxy Science Fiction», відомий своїми вражаючими обкладинками, публікував роботи відомого художника-космолога Чеслі Бонестелла.
Команда Qwen компанії Alibaba випустила на платформі Bailian модель Qwen3.7-Plus — мультимодальну велику мовну модель, здатну розуміти зображення та відео. Модель зосереджена на таких агентних функціях, як глибоке міркування та самопрограмування, і націлена на виконання дій, а не лише на надання відповідей.
Amazon Nova Forge дозволяє користувачам створювати кастомізовані мовні моделі, які поєднують власні дані з відібраними наборами даних, запобігаючи катастрофічній втраті інформації та покращуючи продуктивність у конкретних областях без шкоди для загальних можливостей. Цей інструмент допомагає вирішувати складні завдання налаштування гіперпараметрів для завдань, специфічних для певної області, за...