Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Представляем ReasoningBank: фреймворк Google для искусственного интеллекта в области памяти

Исследователи из Google Cloud AI, Университета Иллинойса в Урбана-Шампейне и Йельского университета представляют ReasoningBank — систему памяти, которая выделяет причины успеха или неудачи задач, выполняемых агентами искусственного интеллекта. Существующие системы памяти агентов имеют серьезные «слепые зоны», однако ReasoningBank извлекает релевантные воспоминания для повышения эффективности р...

Революция в области ухода за пациентами благодаря мультимодальным биологическим моделям

Достижения в области искусственного интеллекта в здравоохранении позволяют объединять разрозненные потоки данных, что способствует принятию более обоснованных решений в сфере персонализированной медицины. Мультимодальные системы BioFM, такие как Latent-X1 и Evo 2, кардинально меняют подход к открытию новых лекарственных препаратов и клиническим испытаниям благодаря моделям искусственного интел...

Принятие неопределённости: воспитание скромности в искусственном интеллекте

Исследователи из Массачусетского технологического института (MIT) разработали метод RLCR для повышения точности оценок уверенности моделей искусственного интеллекта, что позволяет сократить количество ошибок на 90 % без ущерба для общей точности. Данная методика обучает модели выдавать откалиброванные оценки уверенности, решая проблему завышенной уверенности в моделях искусственного интеллекта...

Разочаровывающие результаты: регрессионный анализ с использованием нейронной сети на наборе данных по диабету на языке C#

Автор делится опытом применения набора данных по диабету в регрессионной модели на основе нейронной сети на языке C#, которая позволяет точно прогнозировать показатели диабета. Благодаря нормализации данных и настройкам нейронной сети были получены результаты, сопоставимые с результатами других регрессионных моделей.

Раскрытие потенциала корпоративной памяти с помощью Amazon Neptune и Mem0

TrendMicro расширяет возможности своего чат-бота на базе искусственного интеллекта, добавив функцию «корпоративной памяти» в Amazon Bedrock, которая работает на базе Amazon Neptune и Mem0. Такая архитектура позволяет чат-боту анализировать историю взаимодействий, извлекать корпоративные знания и давать персонализированные ответы, что способствует улучшению пользовательского опыта.

Эффективная многоязычная транскрипция аудио с помощью Parakeet-TDT и AWS Batch

Использование модели NVIDIA Parakeet-TDT-0.6B-v3 в AWS Batch на инстансах с ускорением на GPU позволяет быстрее и с меньшими затратами выполнять транскрипцию аудиофайлов на нескольких европейских языках. Архитектура «Token-and-Duration Transducer» этой модели интеллектуально пропускает паузы, что значительно сокращает время обработки и затраты, делая её масштабируемым решением для организаций ...

Представляем ml-intern: ваш ИИ-помощник для рабочего процесса после обучения больших языковых моделей

ml-intern от Hugging Face автоматизирует рабочие процессы после обучения для больших языковых моделей (LLM), превосходя существующие передовые результаты на PostTrainBench. Он использует генерацию синтетических данных и GRPO для эффективного обучения и оценки.

DVC и SageMaker: оптимизация сквозного отслеживания происхождения данных

Команды, занимающиеся машинным обучением (ML), сталкиваются с проблемами отслеживаемости моделей, однако объединение DVC, SageMaker AI и приложений MLflow позволяет решить эту проблему. Такой интегрированный рабочий процесс гарантирует, что каждая модель будет связана с конкретными обучающими данными, что имеет решающее значение для отраслей, подпадающих под регулирование, таких как здравоохра...

Simula от Google: революция в области синтетических наборов данных для ИИ

Обучению мощных моделей искусственного интеллекта мешает нехватка специализированных данных, однако платформа Simula, разработанная Google и EPFL, предлагает прозрачное и масштабируемое решение. Simula решает проблему генерации синтетических данных за счет одновременного контроля качества, разнообразия и сложности с помощью таксономий, мета-подсказок и двойных критериев оценки.

Эффективный расчет псевдообратной матрицы Мура-Пенроуза на C#

Программа объединяет несколько вариантов псевдообратной матрицы Мура-Пенроуза, используя алгоритмы QR-разложения. Варианты Хаусхолдера, Грамма-Шмидта и Гивенса прошли тщательное тестирование на случайных матрицах.

Повышение эффективности работы ИИ-агентов с помощью ToolSimulator

ToolSimulator в Strands Evals позволяет безопасно тестировать агенты искусственного интеллекта с использованием внешних инструментов в больших масштабах, избегая рисков, связанных с реальными вызовами API и статическими имитациями. Это помогает выявлять ошибки на ранних этапах, тщательно тестировать крайние случаи и обеспечивать беспроблемную интеграцию агентов, готовых к производственному исп...

Оптимизация омниканального процесса оформления заказов с помощью AgentCore и Nova 2 Sonic от Amazon

Создайте многоканальную систему голосового заказа с использованием Amazon Bedrock AgentCore и Amazon Nova 2 Sonic для естественного голосового взаимодействия. Разверните инфраструктуру, подключите ИИ-агента к бэкэнд-сервисам и проведите тестирование с использованием реалистичных сценариев для обеспечения эффективности голосовых ИИ-приложений.

Повысьте производительность вычислений ИИ с помощью инстансов G7e в Amazon SageMaker

Инстансы G7e с графическими процессорами NVIDIA RTX PRO 6000 в Amazon SageMaker AI представляют собой высокопроизводительные и экономичные решения для развертывания крупных языковых моделей, обладая вдвое большим объемом памяти графического процессора по сравнению с предыдущими поколениями. Эти инстансы обеспечивают производительность инференции, превышающую предыдущие модели в 2,3 раза,

TabPFN: Обучение работе с табличными наборами данных с помощью контекстного обучения

Табличные данные играют ключевую роль в машинном обучении, а модели на основе деревьев, такие как TabPFN, бросают вызов традиционным подходам, превосходя по эффективности XGBoost и CatBoost. TabPFN-2.5 обеспечивает более высокую производительность, сокращает объем ручной работы и ускоряет процесс вывода, что делает его пригодным для внедрения в реальных условиях.

API Grok: революция в сфере разработки корпоративных голосовых решений

xAI, компания Илона Маска, занимающаяся искусственным интеллектом, запускает API-интерфейсы для преобразования речи в текст и текста в речь, которые составляют конкуренцию ведущим игрокам на рынке речевых API. API-интерфейсы Grok предлагают такие расширенные функции, как идентификация говорящих, временные метки на уровне слов и высокая точность транскрипции.