Сжатие LLM в 10 раз без потери производительности. Такие техники, как квантование, обрезка и дистилляция знаний, делают мощные ML-модели более доступными.
2024: Появление агентов нового поколения, таких как MultiOn, LangGraph и LlamaIndex Workflows. Агенты второго поколения предлагают структурированные пути к более мощным возможностям, отходя от неудачных агентов ReAct.
Художники исследуют потенциал и риски искусственного интеллекта. Кейт Бланшетт шутит о секс-роботах в фальшивом обращении к ЕС в 2023 году.
GPT-4o и LATS объединяются для улучшения процесса принятия решений LLM, революционизируя решение проблем с помощью расширенных возможностей рассуждений. Алгоритмы метагенерации увеличивают вычислительные ресурсы во время умозаключений, имитируя когнитивные процессы более высокого уровня для повышения производительности модели.
Лучшие магистратуры проверяются на структурированность результатов: Google Gemini Pro, Anthropic Claude, OpenAI GPT. OpenAI лидирует с прямой интеграцией для JSON. Anthropic требует трюк «вызов инструмента», Google Gemini громоздкий.
Компания по водоснабжению на юго-востоке Англии считает предложенный план сокращений «невыполнимым». Polestar сменил генерального директора на бывшего босса Opel, сделав акцент на глобальном присутствии и видении электромобилей.
Использование искусственного интеллекта, например Amazon Q Developer, позволяет повысить производительность разработчиков на 30 %. Amazon Q Business улучшает работу предприятий с помощью генеративного ИИ.
Microsoft передала проект Mono компании WineHQ, поощряя переход на фреймворк .NET с открытым исходным кодом. Проект Mono, созданный Мигелем де Икаса, был первопроходцем для .NET на различных операционных системах.
Стармер намекает на «болезненные» сокращения бюджета, проводя сравнения с провальной политикой Осборна. Призывает к «Беверидж Марк 2», чтобы вернуть надежду после 14 лет разрухи.
Исследователи Массачусетского технологического института разработали алгоритм решения нелинейных параболических ФРП в компьютерной графике. Новый подход упрощает сложные задачи до трех шагов для лучшего анализа формы.
NVIDIA RTX AI Toolkit позволяет разработчикам точно настраивать модели для повышения производительности с помощью LoRA, увеличивая скорость до 6x. Настройка LLM с помощью адаптеров LoRA позволяет создавать индивидуальные результаты, например, генерировать диалоги в определенных стилях или голоса одновременно для различных приложений.
RAG объединяет поисковые и генеративные модели для систем контроля качества. Автоматизация сквозного развертывания RAG с помощью AWS CDK и Amazon Bedrock.
AWS DeepRacer: Научитесь преодолевать разрыв между симулятором и реальностью, осваивая физическую трассу. Поймите, как датчик камеры автомобиля использует полутоновые изображения для навигации на основе значений пикселей.
Выручка Nvidia, третьей по стоимости компании, выросла до 30,04 млрд долларов благодаря растущему спросу на искусственный интеллект. Несмотря на превышение ожиданий, акции компании падают на 3 % на послеобеденных торгах.
Google и Тель-Авивский университет представили GameNGen - модель искусственного интеллекта, симулирующую Doom с помощью методов стабильной диффузии. Нейросетевая система может произвести революцию в синтезе видеоигр в реальном времени, предсказывая и генерируя графику на лету.