Стрічка новин про штучний інтелект і машинне навчання

Головні новини та публікації щодня! Будьте на крок попереду: дізнавайтеся першими про нові ідеї, тренди та інновації у сфері технологій

Революція в галузі навчання з підкріпленням: новий підхід

Новий алгоритм RL на основі стратегії «розділяй і володарюй» кидає виклик традиційному навчанню методом TD, забезпечуючи масштабованість для завдань із тривалим горизонтом. Політика «поза політикою» (Off-policy RL) забезпечує гнучкість у роботі зі старими даними, що має вирішальне значення для таких складних галузей, як робототехніка та охорона здоров’я.

Parcae: вдосконалення мовних моделей на основі циклів в Каліфорнійському університеті в Сан-Дієго

Дослідники з Каліфорнійського університету в Сан-Дієго та компанії Together AI представляють Parcae — архітектуру трансформера з циклічною структурою, яка демонструє кращі результати, ніж попередні моделі, при використанні тих самих параметрів і навчальних даних. Конструкція Parcae дозволяє вирішити проблему обмеженості пам’яті та забезпечує більшу обчислювальну потужність за один прохід, усув...

Розкриття таємниць word2vec: секрети семантичного навчання

Дослідники розкрили динаміку навчання алгоритму word2vec, виявивши його лінійну структуру та послідовні етапи. Мінімальна нейронна модель алгоритму дає уявлення про процес навчання ознак у складних мовних задачах.

Розкриття можливостей взаємодії з великими мовними моделями

Розуміння складних систем машинного навчання, таких як великі мовні моделі (LLM), має вирішальне значення для штучного інтелекту. Нові алгоритми, такі як SPEX і ProxySPEX, покликані виявляти критичні взаємодії у великих масштабах шляхом вимірювання впливу за допомогою абляції, виділяючи фактори, що впливають на прийняття рішень, із найменшими можливими відхиленнями.

Революція у сфері роздрібної торгівлі завдяки штучному інтелекту AWS

Роздрібні продавці стикаються з проблемами, пов’язаними з онлайн-покупками, що призводить до зростання кількості повернень та зниження довіри споживачів. Впровадження технології віртуальної примірки за допомогою Amazon Nova Canvas та Rekognition може сприяти підвищенню прибутковості

Опанування процесів навчання та розгортання великих мовних моделей

Навчання сучасної великої мовної моделі передбачає попереднє навчання загальним мовним шаблонам, а потім — контрольоване точне налаштування для виконання конкретних завдань. Такі методи, як LoRA та RLHF, дозволяють вдосконалити модель, що дає змогу впроваджувати її в реальні системи для досягнення оптимальної продуктивності та забезпечення максимальної користі.

Gemini Robotics від DeepMind: розвиток фізичної штучного інтелекту

Google DeepMind представляє Gemini Robotics-ER 1.6 — оновлену версію, що розширює можливості роботів у сфері логічного мислення для виконання завдань у реальних умовах. Ця модель виконує роль стратега високого рівня, керуючи фізичними діями за допомогою вдосконаленого просторового мислення та аналізу показань приладів.

Оптимізація перетворення тексту в SQL за допомогою Amazon Nova Micro та Bedrock

Завдання з перетворення тексту в SQL вирішуються за допомогою моделей Amazon Bedrock та Nova Micro, що забезпечують економічно ефективні індивідуальні рішення. Точне налаштування адаптерів LoRA під конкретні діалекти SQL гарантує високу продуктивність без постійних витрат на хостинг.

Трансформація дотримання вимог у сфері штучного інтелекту за допомогою автоматизованого міркування

Перевірки автоматизованого міркування в Amazon Bedrock Guardrails забезпечують математично обґрунтовані та піддаються аудиту результати роботи ШІ для галузей, що підлягають регулюванню. Використовуючи методи формальної верифікації, команди з питань дотримання нормативних вимог можуть отримувати результати, правильність яких можна довести, усуваючи обмеження ймовірнісної валідації ШІ.

Опанування налаштування підказки в Amazon QuickSight

Amazon Quick Sight запроваджує підказки для аркушів, що дозволяє авторам інформаційних панелей створювати власні макети підказок із використанням різноманітних візуальних компонентів. Ця функція покращує візуалізацію даних, надаючи динамічну інформацію в режимі реального часу при наведенні курсору, що підвищує загальний рівень зручності користування та ефективність передачі аналітичних даних.

Прискорення інференції великих мовних моделей за допомогою спекулятивного декодування на AWS Trainium

Розгортання моделей Qwen3 із використанням vLLM, Kubernetes та чіпів AWS AI дозволяє знизити вартість одного токена та підвищити пропускну здатність. Спекулятивне декодування на AWS Trainium прискорює генерацію токенів у 3 рази, зменшуючи затримку та витрати на інференцію для додатків штучного інтелекту.

Скорочення штату у підрозділі штучного інтелекту Snap Inc: звільнено 1 000 співробітників

Компанія Snap Inc, материнська компанія Snapchat, скоротить 16 % персоналу через розвиток штучного інтелекту та тиск з боку активістських інвесторів. Генеральний директор Спігель прагне досягти прибутковості за допомогою скорочень та впровадження штучного інтелекту.

Від вовни до штучного інтелекту: акції Allbirds стрімко зростають

Компанія Allbirds змінила назву на NewBird AI, переорієнтувавшись з виробництва взуття на штучний інтелект, що спричинило стрімке зростання вартості її акцій на 582%. Таке стрімке відновлення компанії стало несподіванкою після різкого падіння її вартості; також відомо про плани її продажу компанії American Exchange Company.

Оприлюднено вікові обмеження для спін-офів «Пітта» та «Гри престолів»

Інструмент на основі штучного інтелекту допомагає Британському раді з класифікації фільмів та телепрограм (BBFC) класифікувати британські серіали HBO Max, такі як «Пітт» та спін-оф «Гри престолів», виокремлюючи суперечливі сцени для подальшого розгляду фахівцями. Цей інструмент допомагає виявляти порушення норм, зокрема сцени насильства, оголення та нецензурну лексику.