Стрічка новин про штучний інтелект і машинне навчання

Головні новини та публікації щодня! Будьте на крок попереду: дізнавайтеся першими про нові ідеї, тренди та інновації у сфері технологій

SIA: Агент із самоудосконалення від Hexo Labs

Компанія Hexo Labs випустила SIA (Self-Improving AI) як фреймворк з відкритим кодом. SIA редагує як каркас агента, так і ваги моделі з метою постійного вдосконалення. Оновлення ваг підвищують ефективність у різних сферах, перевершуючи результати, досягнуті лише за рахунок редагування каркаса.

Максимізація продуктивності великої мови (LLM) на базі штучного інтелекту в Amazon SageMaker

Розгортання великих мовних моделей (LLM) на платформі Amazon SageMaker AI Inference вимагає комплексного контролю для моніторингу як стану інфраструктури, так і якості роботи LLM. Моніторинг таких показників, як затримка, кількість помилок і точність відповідей, має вирішальне значення для оптимізації витрат, продуктивності та якості результатів у довгостроковій перспективі.

007 First Light: вихід на GeForce NOW

GeForce NOW запускає «007 First Light», пропонуючи користувачам історію походження Джеймса Бонда та безкоштовний елітний комплект одягу. Насолоджуйтесь високоякісними хмарними іграми з новими іграми та ексклюзивними нагородами, зокрема демоверсією Resident Evil Requiem.

Управління масштабованими наборами тестів у Amazon Bedrock AgentCore

Оцінка агентів стає ефективнішою завдяки поєднанню онлайн-сигналів зі стабільними офлайн-базовими показниками. Amazon Bedrock AgentCore підтримує використання тестових наборів з версіями, що забезпечує послідовність та перевірюваність вимірювань для вдосконалення агентів. Набори даних з версіями слугують еталоном, завдяки чому результати оцінювання є значущими як для розробників, так і для кон...

Розширте можливості Amazon SageMaker MLflow за допомогою проксі-сервера REST API

Amazon SageMaker MLflow пропонує комплексні можливості відстеження експериментів у галузі машинного навчання та управління моделями. Підприємства можуть безпечно інтегрувати MLflow з існуючими системами за допомогою проксі-сервісу на базі Flask, що забезпечує відповідність вимогам та спрощує процес.

Подолання меж: революція в робототехніці від NVIDIA

Галузь робототехніки розвивається: дослідницький підрозділ NVIDIA Research демонструє технологію перенесення результатів моделювання в реальні умови, що дозволяє роботам адаптуватися та надійно працювати в динамічних середовищах. Серед інновацій — координація роботи декількох маніпуляторів за допомогою ScheduleStream та фреймворку політик COMPASS для різних типів роботів, що забезпечує значне ...

Розшифрування коду: відсутні дані в машинному навчанні

Моделі машинного навчання прогнозують такі показники, як дохід, статева приналежність, вік, штат проживання та політичні погляди. Заповнення пропущених даних для прогнозування може призвести до оманливих результатів у машинному навчанні.

MIT відкриває квантовий центр

Массачусетський технологічний інститут (MIT) та штат Массачусетс створять Лабораторію квантових систем (QSL) з метою розвитку квантових досліджень та інновацій. QSL стане передовим науково-дослідним центром, що сприятиме розвитку революційних квантових технологій у різних сферах практичного застосування.

Навчання моделей азербайджанської мови за допомогою штучного інтелекту SageMaker

Компанія Azercell Telecom співпрацює з AWS над створенням великої мовної моделі (LLM) та чат-бота для Азербайджану, досягаючи значної оптимізації та вдосконалення. Платформа на базі Amazon SageMaker AI забезпечує вищу продуктивність навчання, меншу витрату пам’яті та подвоєну ємність для обробки тексту, надаючи аналітичні дані для роботи зі складними мовами.

Представляємо LFM2.5-8B-A1B: потужну модель MoE для використання на пристрої

Компанія Liquid AI випустила LFM2.5-8B-A1B — розріджену модель MoE для запуску інструментів безпосередньо на пристрої. Вона покращує здатність до міркування та демонструє вражаючі результати тестування порівняно з попередньою версією.

Представляємо Polar: платформу NVIDIA для точного відтворення токенів під час навчання GRPO

Компанія NVIDIA представляє Polar — платформу для впровадження методів підкріплювального навчання в мовних агентах. Polar спрощує інтеграцію агентів з існуючими тестовими середовищами, покращує сумісність API моделей та оптимізує процеси навчання.

Революція в області рекурентних мереж завдяки DiffusionBlocks

Дослідники з компанії Sakana AI та Токійського університету представляють DiffusionBlocks — метод навчання мереж на основі трансформерів, який передбачає навчання по одному блоку за раз, що дозволяє зменшити споживання пам'яті у B разів. Завдяки застосуванню дискретизації Ейлера до зв'язків залишків цей метод дає змогу навчати кожен блок окремо з використанням власної локальної функції цільово...

Представляємо EAGLE 3.1: боротьба з відхиленням уваги під час інференції великих мовних моделей

Серія EAGLE, розроблена командами EAGLE Team, vLLM Team та TorchSpec Team, представляє версію EAGLE 3.1, яка підвищує надійність спекулятивного декодування. EAGLE 3.1 вирішує проблеми з відхиленням уваги, забезпечуючи підвищену стабільність та продуктивність у різноманітних середовищах.

Розкриття потенціалу штучного інтелекту в продажах за допомогою Amazon Bedrock AgentCore

Field Advisor на платформі Amazon Bedrock AgentCore оптимізує координацію роботи агентів у відділі продажів AWS, зменшуючи когнітивне навантаження та покращуючи взаємодію з клієнтами. Цей внутрішній діалоговий помічник підвищує продуктивність, перенаправляючи запити до спеціалізованих агентів, що дозволяє торговим представникам зосередитися на потребах клієнтів.

Оптимізуйте обробку фінансових документів за допомогою Amazon Bedrock

Amazon Bedrock Data Automation оптимізує процес вилучення даних із фінансових документів за допомогою індивідуальних шаблонів, що забезпечують точність та ефективність. Базові моделі, такі як Anthropic Claude, розширюють можливості OCR для вилучення структурованих даних, придатних для подальшого використання.