Искусственный синапс с автономным питанием может имитировать цветовосприятие человеком с разрешением 10 нанометров с помощью солнечных элементов, чувствительных к красителям. Эта технология создает энергоэффективные системы ИИ, способные к распознаванию цветов и их логической обработке.
ATMO – это робот, который меняет форму прямо в воздухе, превращаясь из летающего дрона в наземный вездеход. Преодолев проблему гибридных роботов, застревающих на сложной местности, эта инновация открывает новые возможности для автономной доставки, реагирования на чрезвычайные ситуации и исследования других планет.
Исследователи из MIT разработали CAV-MAE Sync – AI модель, которая учится точно связывать звуки с соответствующими визуальными эффектами в видео без каких-либо пометок. Такая технология может приблизить нас к более умному ИИ, способного видеть, слышать и понимать мир так же, как человек.
Мы собрали самые интересные инновации с конференции Google I/O 2025, которые демонстрируют как ИИ кардинально меняет поиск, видеогенерацию и общение. Новые достижения переосмысливают повседневные технологии, делая их более умными, интуитивными и персонализированными.
Современные модели искусственного интеллекта от технологических лидеров, таких как OpenAI и DeepSeek, стали все чаще генерировать вымышленную информацию. Причины этого до сих пор неизвестны. Стремительный рост “галлюцинаций” ставит под угрозу доверие пользователей к ИИ.
Семейство Phi-4 от Microsoft – это новое поколение малых языковых моделей, созданных для решения сложных задач, таких как программирование, математика и планирование, и часто превосходящие большие модели. Они приводят убедительные рассуждения, оставаясь при этом эффективными для использования в средах с низкой задержкой.
Зачем переживать за каждую строку кода, если ИИ может «уловить вайб» и написать все за вас? Вайб-кодинг – стремительно растущий тренд, в котором разработчики позволяют АІ взять контроль за написание кода, превращая программирование в более интуитивный и спонтанный процесс.
NVIDIA официально сделала движок PhysX и Flow SDK полностью открытыми, включая долгожданный код ядра GPU-симуляции, под лицензией BSD-3. Теперь разработчики могут настраивать, переносить и восстанавливать сложные симуляции на различных платформах – даже на графических процессорах не от NVIDIA.
Midjourney выпустила V7, свою самую мощную модель генерации изображений, которая поражает лучшим пониманием текстовых промптов и персонализацией арта в реальном времени. Обновленная архитектура V7 обеспечивает лучшую согласованность объектов и реалистичность текстур и внедряет новый режим Draft для быстрых итераций изображений.
Новая нейронная система, имитирующая процессы обучения мозга, открывает путь к более быстрому и эффективному ИИ. Используя принципы геббианского обучения и пластичность, зависящую от времени спайков, эта технология может значительно повысить производительность ИИ, одновременно уменьшая экологические и экономические затраты.
ItpCtrl-AI улучшает диагностику рентгеновских снимков, имитируя взгляд радиологов и создавая интерпретированные тепловые карты, которые повышают прозрачность и доверие к ИИ в медицинской визуализации. Фильтруя несущественные данные и фокусируясь на ключевых зонах, модель обеспечивает более точные и понятные результаты.
GPT-4.5 – самый совершенный ИИ от OpenAI с улучшенным пониманием естественного языка, повышенным эмоциональным интеллектом и более естественными диалогами. Модель отлично подходит для креативного письма, мозгового штурма и решения сложных задач, минимизируя галлюцинации ИИ для более надежных результатов.
Исследователи разработали MiFly – маломощную радиочастотную систему, позволяющую БПЛА самостоятельно ориентироваться в условиях недостаточной видимости или в полной темноте. Метка обратного рассеяния и радар с двойной поляризацией позволяют MiFly двигаться, не полагаясь на визуальные подсказки или внешнюю инфраструктуру.
Платформа NVIDIA Cosmos ускоряет развитие робототехники, беспилотного транспорта и промышленной автоматизации благодаря новаторским моделям WFM. Создавая фотореалистичные 3D-среды, Cosmos позволяет разработчикам обучать автономные системы без использования дорогих наборов реальных данных.
HunyuanVideo – крупнейшая ИИ-модель для генерации видео с открытым кодом, которая имеет 13 млрд параметров для создания качественных кинематографических видео с реалистичным движением и идеально синхронизированным звуком. Модель обеспечивает непревзойденную точность, устанавливая новый стандарт для ИИ контента.
Система планирования по двум траекториям позволяет БПЛА исследовать неизвестные маршруты, всегда при этом сохраняя безопасный запасной путь. Благодаря LiDAR-зондированию и алгоритму CIRI дроны формируют курс полета в реальном времени для быстрой навигации в непредсказуемых условиях.