LLMs часто придерживаются своих изначальных ответов, даже если они неправильные, но быстро теряют уверенность, когда их оспаривают. Это удивительное сочетание чрезмерной самоуверенности и неуверенности в себе отражает человеческие когнитивные предубеждения и вызывает беспокойство относительно надежности ИИ.
Ученые Массачусетского технологического института создали алгоритм, помогающий инженерам разрабатывать мягкую робототехнику, которая собирает больше полезной информации об окружающей среде. Алгоритм глубокого обучения предполагает улучшенное позиционирование датчиков внутри тела робота, что позволяет ему успешно взаимодействовать с окружением и выполнять назначенные задачи. Разработка является шагом на пути к автоматизации робототехнического проектирования.
Ученые исследовали серьезный недостаток языковых моделей – так называемое позиционное предубеждение, когда модели уделяют больше внимания информации в начале и конце текста, пренебрегая его серединой. Исследование показало, что причина этого коренится не только в обучающих данных, но и в самой архитектуре моделей.
Искусственный синапс с автономным питанием может имитировать цветовосприятие человеком с разрешением 10 нанометров с помощью солнечных элементов, чувствительных к красителям. Эта технология создает энергоэффективные системы ИИ, способные к распознаванию цветов и их логической обработке.
ATMO – это робот, который меняет форму прямо в воздухе, превращаясь из летающего дрона в наземный вездеход. Преодолев проблему гибридных роботов, застревающих на сложной местности, эта инновация открывает новые возможности для автономной доставки, реагирования на чрезвычайные ситуации и исследования других планет.
Исследователи из MIT разработали CAV-MAE Sync – AI модель, которая учится точно связывать звуки с соответствующими визуальными эффектами в видео без каких-либо пометок. Такая технология может приблизить нас к более умному ИИ, способного видеть, слышать и понимать мир так же, как человек.
Мы собрали самые интересные инновации с конференции Google I/O 2025, которые демонстрируют как ИИ кардинально меняет поиск, видеогенерацию и общение. Новые достижения переосмысливают повседневные технологии, делая их более умными, интуитивными и персонализированными.
Современные модели искусственного интеллекта от технологических лидеров, таких как OpenAI и DeepSeek, стали все чаще генерировать вымышленную информацию. Причины этого до сих пор неизвестны. Стремительный рост “галлюцинаций” ставит под угрозу доверие пользователей к ИИ.
Семейство Phi-4 от Microsoft – это новое поколение малых языковых моделей, созданных для решения сложных задач, таких как программирование, математика и планирование, и часто превосходящие большие модели. Они приводят убедительные рассуждения, оставаясь при этом эффективными для использования в средах с низкой задержкой.
Зачем переживать за каждую строку кода, если ИИ может «уловить вайб» и написать все за вас? Вайб-кодинг – стремительно растущий тренд, в котором разработчики позволяют АІ взять контроль за написание кода, превращая программирование в более интуитивный и спонтанный процесс.
NVIDIA официально сделала движок PhysX и Flow SDK полностью открытыми, включая долгожданный код ядра GPU-симуляции, под лицензией BSD-3. Теперь разработчики могут настраивать, переносить и восстанавливать сложные симуляции на различных платформах – даже на графических процессорах не от NVIDIA.
Midjourney выпустила V7, свою самую мощную модель генерации изображений, которая поражает лучшим пониманием текстовых промптов и персонализацией арта в реальном времени. Обновленная архитектура V7 обеспечивает лучшую согласованность объектов и реалистичность текстур и внедряет новый режим Draft для быстрых итераций изображений.
Новая нейронная система, имитирующая процессы обучения мозга, открывает путь к более быстрому и эффективному ИИ. Используя принципы геббианского обучения и пластичность, зависящую от времени спайков, эта технология может значительно повысить производительность ИИ, одновременно уменьшая экологические и экономические затраты.
ItpCtrl-AI улучшает диагностику рентгеновских снимков, имитируя взгляд радиологов и создавая интерпретированные тепловые карты, которые повышают прозрачность и доверие к ИИ в медицинской визуализации. Фильтруя несущественные данные и фокусируясь на ключевых зонах, модель обеспечивает более точные и понятные результаты.
GPT-4.5 – самый совершенный ИИ от OpenAI с улучшенным пониманием естественного языка, повышенным эмоциональным интеллектом и более естественными диалогами. Модель отлично подходит для креативного письма, мозгового штурма и решения сложных задач, минимизируя галлюцинации ИИ для более надежных результатов.