Стрічка новин про штучний інтелект і машинне навчання

Головні новини та публікації щодня! Будьте на крок попереду: дізнавайтеся першими про нові ідеї, тренди та інновації у сфері технологій

Розкриття потенціалу мультимодальних вбудованих моделей Amazon Nova

Семантичний пошук у відео змінює підхід до поширення контенту в різних галузях, забезпечуючи швидкий і точний доступ до конкретних моментів у відео. Amazon Nova Multimodal Embeddings пропонує уніфіковану модель, яка обробляє текст, зображення, відео та аудіо, перетворюючи їх на спільний семантичний векторний простір, що забезпечує найвищу точність пошуку та економічну ефективність.

Представляємо детальний аналіз розподілу витрат для Amazon Bedrock

Amazon Bedrock тепер пропонує детальну атрибуцію витрат, автоматично розподіляючи витрати на обчислення між суб’єктами IAM, такими як користувачі IAM, ролі або федеративні ідентичності від постачальників, наприклад Okta. Теги розподілу витрат дозволяють легко агрегувати дані за командами, проектами або власними параметрами в AWS Cost Explorer та CUR 2.0, що спрощує фінансове планування та опти...

Представлено революційну модель «зоро-мовного» перекладу з рідкісним MoE на базі відкритого коду

Команда Qwen компанії Alibaba представляє Qwen3.6-35B-A3B — розріджену модель MoE з 35 мільярдами параметрів, яка демонструє вражаючу продуктивність у різних тестах, зокрема SWE-bench та Terminal-Bench 2.0, та свідчить про значний прогрес у сфері агентного кодування та генерації коду інтерфейсу.

Опанування процесів навчання та розгортання великих мовних моделей

Навчання сучасної великої мовної моделі передбачає попереднє навчання загальним мовним шаблонам, а потім — контрольоване точне налаштування для виконання конкретних завдань. Такі методи, як LoRA та RLHF, дозволяють вдосконалити модель, що дає змогу впроваджувати її в реальні системи для досягнення оптимальної продуктивності та забезпечення максимальної користі.

Розкриття можливостей взаємодії з великими мовними моделями

Розуміння складних систем машинного навчання, таких як великі мовні моделі (LLM), має вирішальне значення для штучного інтелекту. Нові алгоритми, такі як SPEX і ProxySPEX, покликані виявляти критичні взаємодії у великих масштабах шляхом вимірювання впливу за допомогою абляції, виділяючи фактори, що впливають на прийняття рішень, із найменшими можливими відхиленнями.

Революція у сфері роздрібної торгівлі завдяки штучному інтелекту AWS

Роздрібні продавці стикаються з проблемами, пов’язаними з онлайн-покупками, що призводить до зростання кількості повернень та зниження довіри споживачів. Впровадження технології віртуальної примірки за допомогою Amazon Nova Canvas та Rekognition може сприяти підвищенню прибутковості

Захист запитів: StruQ та SecAlign

Останні досягнення у сфері великих мовних моделей (LLM) відкривають можливості для створення цікавих інтегрованих додатків, однак атаки типу «prompt injection» становлять серйозну загрозу. StruQ та SecAlign — це запропоновані засоби захисту, покликані зменшити ризики, пов’язані з атаками «prompt injection» у системах LLM, таких як Google Docs та ChatGPT.

Революція в галузі навчання з підкріпленням: новий підхід

Новий алгоритм RL на основі стратегії «розділяй і володарюй» кидає виклик традиційному навчанню методом TD, забезпечуючи масштабованість для завдань із тривалим горизонтом. Політика «поза політикою» (Off-policy RL) забезпечує гнучкість у роботі зі старими даними, що має вирішальне значення для таких складних галузей, як робототехніка та охорона здоров’я.

Революція в моделях згортання білків

PLAID — модель, що генерує послідовності та структури білків, — відображає роль штучного інтелекту в біології. Модель вирішує такі завдання, як моделювання всіх атомів та врахування специфіки організмів, маючи на меті ефективне створення корисних білків.

Оптимізація перетворення тексту в SQL за допомогою Amazon Nova Micro та Bedrock

Завдання з перетворення тексту в SQL вирішуються за допомогою моделей Amazon Bedrock та Nova Micro, що забезпечують економічно ефективні індивідуальні рішення. Точне налаштування адаптерів LoRA під конкретні діалекти SQL гарантує високу продуктивність без постійних витрат на хостинг.

Трансформація дотримання вимог у сфері штучного інтелекту за допомогою автоматизованого міркування

Перевірки автоматизованого міркування в Amazon Bedrock Guardrails забезпечують математично обґрунтовані та піддаються аудиту результати роботи ШІ для галузей, що підлягають регулюванню. Використовуючи методи формальної верифікації, команди з питань дотримання нормативних вимог можуть отримувати результати, правильність яких можна довести, усуваючи обмеження ймовірнісної валідації ШІ.

Розкриття таємниць word2vec: секрети семантичного навчання

Дослідники розкрили динаміку навчання алгоритму word2vec, виявивши його лінійну структуру та послідовні етапи. Мінімальна нейронна модель алгоритму дає уявлення про процес навчання ознак у складних мовних задачах.

Gemini Robotics від DeepMind: розвиток фізичної штучного інтелекту

Google DeepMind представляє Gemini Robotics-ER 1.6 — оновлену версію, що розширює можливості роботів у сфері логічного мислення для виконання завдань у реальних умовах. Ця модель виконує роль стратега високого рівня, керуючи фізичними діями за допомогою вдосконаленого просторового мислення та аналізу показань приладів.

Дискримінація за діалектом: виявлення мовних упереджень у ChatGPT

ChatGPT демонструє упереджене ставлення до «нестандартних» різновидів англійської мови, а його відповіді містять стереотипи та зверхність. У рамках дослідження GPT-3.5 Turbo та GPT-4 отримали запити з 10 різновидами англійської мови, що виявило збереження рис стандартної американської англійської.

Робочі процеси на основі штучного інтелекту від Google в Chrome, що запускаються одним кліком

Google впроваджує функцію Skills in Chrome у рамках Gemini, що дозволяє користувачам зберігати запити до штучного інтелекту як робочі процеси, які можна використовувати повторно. Ця функція спрощує виконання завдань у декількох вкладках, даючи уявлення про майбутнє агентів штучного інтелекту на рівні браузера.