Команда Qwen компании Alibaba представляет Qwen3.6-35B-A3B — разреженную модель MoE с 35 миллиардами параметров, демонстрирующую впечатляющую производительность в различных тестах, включая SWE-bench и Terminal-Bench 2.0, что свидетельствует о значительных достижениях в области агентного кодирования и генерации кода на уровне интерфейса.
Amazon Bedrock теперь предлагает детализированную атрибуцию затрат, автоматически распределяя затраты на вычисления между субъектами IAM, такими как пользователи IAM, роли или федеративные идентификаторы от поставщиков, например Okta. Теги распределения затрат позволяют легко агрегировать данные по командам, проектам или пользовательским параметрам в AWS Cost Explorer и CUR 2.0, что упрощает ф...
Доценты Массачусетского технологического института (MIT) Джейкоб Андреас и Бретт Макгуайр удостоены премии имени Гарольда Э. Эджертона за достижения в научной деятельности 2026 года за новаторские работы в области обработки естественного языка и астрохимии. Инновационные исследования Андреаса объединяют фундаментальную теорию с практическим применением в сфере изучения языков и искусственного ...
Команда TAA отдела маркетинга AWS в сотрудничестве с Gradial разработала решение на базе агентного ИИ на платформе Amazon Bedrock, что позволило сократить время сборки веб-страниц более чем на 95 %. Эта инновация оптимизирует рабочие процессы публикации контента, позволяя маркетинговым командам сосредоточиться на создании более эффективного клиентского опыта.
Google DeepMind представляет Gemini Robotics-ER 1.6 — обновление, расширяющее возможности роботов в области логического мышления при решении реальных задач. Модель выступает в роли стратега высокого уровня, управляя физическими действиями на основе усовершенствованного пространственного мышления и анализа показаний приборов.
Исследователи раскрыли динамику обучения модели word2vec, выявив её линейную структуру и последовательные этапы. Минимальная нейронная модель алгоритма позволяет лучше понять процесс обучения признакам при решении сложных языковых задач.
Кодировщик преобразует объекты в изображения без шума, количественно оценивая, насколько точно измерения позволяют различать объекты. Искусственный интеллект способен извлекать полезную информацию даже из кодированных данных, которые человек не может интерпретировать, оптимизируя системы визуализации с учетом их информационного содержания.
Задачи преобразования текста в SQL решаются с помощью моделей Amazon Bedrock и Nova Micro, которые предлагают экономичные индивидуальные решения. Тонкая настройка адаптеров LoRA для пользовательских диалектов SQL обеспечивает высокую производительность без постоянных затрат на хостинг.
Исследователи из Калифорнийского университета в Сан-Диего и компании Together AI представляют Parcae — архитектуру трансформатора с циклической структурой, которая демонстрирует более высокую производительность по сравнению с предыдущими моделями при использовании тех же параметров и обучающих данных. Конструкция Parcae позволяет преодолеть ограничения по объему памяти и обеспечивает более выс...
Понимание сложных систем машинного обучения, таких как крупные языковые модели (LLM), имеет решающее значение для искусственного интеллекта. Новые алгоритмы, такие как SPEX и ProxySPEX, призваны выявлять ключевые взаимодействия в масштабе, измеряя влияние с помощью абляции и выделяя факторы, определяющие принятие решений, с минимально возможными возмущениями.
Ценность ИИ определяют не алгоритмы, а данные. Такие компании, как Amazon, Google и Microsoft, достигают успеха благодаря собственным высококачественным наборам данных. Качество данных имеет решающее значение для успеха ИИ, что делает их стратегическим активом, обеспечивающим конкурентное преимущество в XXI веке.
Обучение современной крупномасштабной языковой модели включает в себя предварительное обучение общим языковым паттернам, за которым следует контролируемая настройка под конкретные задачи. Такие методы, как LoRA и RLHF, позволяют доработать модель, что впоследствии обеспечивает её внедрение в реальные системы для достижения оптимальной производительности и получения максимальной пользы.
Новый алгоритм RL по принципу «разделяй и властвуй» бросает вызов традиционному обучению с целевым функцией, обеспечивая масштабируемость для задач с длительным горизонтом. Обучение RL без использования политики обеспечивает гибкость при работе со старыми данными, что имеет решающее значение для таких сложных областей, как робототехника и здравоохранение.
Google представляет функцию «Skills» в Chrome в рамках проекта Gemini, которая позволяет пользователям сохранять запросы к ИИ в виде повторно используемых рабочих процессов. Эта функция упрощает выполнение задач на нескольких вкладках и дает представление о будущем ИИ-агентов на уровне браузера.
ChatGPT демонстрирует предвзятое отношение к «нестандартным» разновидностям английского языка, при этом его ответы содержат стереотипы и носят снисходительный характер. В ходе исследования GPT-3.5 Turbo и GPT-4 были предоставлены 10 разновидностей английского языка, что позволило выявить сохранение черт стандартного американского английского.