Новый искусственный интеллект от Anthropic – Claude 3.5 Sonnet теперь может управлять компьютером так же, как человек. Модель использует скриншоты экрана для навигации в приложениях и выполнения таких задач, как нажатие кнопок, ввод текста или сбор информации.
Последний релиз от Stability AI представил новые модели, обеспечившие повышенное качество и скорость генерации изображений, а также доступность для потребительского оборудования. Модели бесплатны для некоммерческого использования и интегрируют современные функции безопасности.
Нобелевские премии 2024 по физике и химии стали прецедентом для признания вклада искусственного интеллекта в науку. Хотя одни ученые подвергают сомнению соответствие ИИ традиционным дисциплинам, другие считают это необходимым шагом для признания междисциплинарного характера современных исследований.
Meta представила Movie Gen – AI инструмент, который создает видео высокой четкости с синхронизированным звуком, используя простые текстовые промпты. Модель предлагает расширенные возможности для генерации и редактирования видео, предоставляя пользователям больше контроля над новым контентом.
Благодаря снижению цен, увеличению лимитов на запросы и ускорению работы, новые модели Gemini от Google делают ИИ более доступным для разработчиков по всему миру. Они снижают затраты и улучшают производительность для таких задач, как обработка текста, кода и мультимодальных приложений.
OpenAI o1 создано для выполнения сложных задач по логическому мышлению в таких областях, как наука, программирование и математика. Имитируя мышление человека, новая модель улучшает точность ответов и учитывает вопросы безопасности, способствуя более надежному и ответственному использованию ИИ.
Разработанная учеными из Бостонского университета, новая нейронная сеть Neural Phase Retrieval использует методы глубокого обучения для улучшения реконструкции изображений с высоким разрешением из данных с низким разрешением. Результаты NeuPh уже превзошли традиционные методы.
Патентное ведомство Индии выдало патент на инновационную систему посадки мини-БПЛА. Эта технология обеспечивает точное приземление в сложных местностях и имеет потенциальное применение как в военной, так и гражданской логистике, включая экстренную помощь и доставку на большой высоте.
Последняя модель генерации изображений от Ideogram AI предлагает значительные улучшения, превосходящие возможности таких ИИ-генераторов, как MidJourney и Leonardo AI. Новые функции уже доступны, включая разнообразные стили, повышенную реалистичность и расширенные инструменты для промптов.
Новая система избегания столкновений для беспилотников использует бортовые датчики и камеры для автономного предотвращения аварий в воздухе. Целью этой технологии является содействие безопасной и эффективной работе БПЛА во все более переполненном воздушном пространстве.
Новая система компьютерного зрения значительно уменьшает энергопотребление и обеспечивает пространственное осознание в режиме реального времени. Она улучшает способность ИИ точно воспринимать 3D-пространство и имеет решающее значение для таких технологий, как беспилотные автомобили и дроны.
Модель Gen-3 Alpha обладает мощными инструментами для создания высококачественного видео, предлагая пользователям беспрецедентный уровень контроля и реалистичности. Благодаря усовершенствованным функциям и исключительному качеству, модель опережает конкурентов и расширяет границы создания контента с помощью ИИ.
Проводя эксперименты и совершенствуя их анализ, MAIA может интерпретировать нейронные сети, что повышает понимание работы ИИ моделей. Этот агент может определять активность нейронов, удалять нерелевантные функции и выявлять предубеждения, делая системы ИИ более безопасными и прозрачными.
Вдохновленные насекомыми, ученые создают автономные навигационные стратегии для маленьких, легких роботов. Протестированная на 56-граммовом беспилотнике, система настраивает его возвращение домой после длительных путешествий, используя минимальные вычисления и память.
Гонки дронов стали использовать для тестирования нейронных сетей для будущих космических миссий. Этот проект направлен на автономное управление сложными маневрами космического корабля, оптимизацию бортовых операций и повышение эффективности и надежности миссии.
Благодаря радарным спутникам, предоставляющим высокоточные данные о поверхности Земли, быстрому и доступному программному обеспечению с открытым кодом, цифровые модели рельефа создаются всего в один клик. Это позволяет эффективно отслеживать все изменения рельефа и природные явления.
Nemotron-4 340B – новое семейство моделей для синтетической генерации данных и настройки ИИ. Обученная на 9 триллионах токенов, модель отличается значительной оптимизацией производительности и обеспечением качества данных, расширяя возможности ИИ в различных отраслях.
С увеличением использования БПЛА в последние годы растет и беспокойство по поводу безопасности их применения. В связи с этим была разработана новая система, использующая компьютерное зрение и алгоритмы глубокого обучения для точного и быстрого обнаружения и отслеживания беспилотников.
ИИ научился расшифровывать собачий лай, отличая игривый лай от агрессивного, а также определять возраст, пол и породу собаки. Изначально обученные на человеческой речи, модели ИИ достигли впечатляющей точности и обещают значительные улучшения в коммуникации и уходе за животными.
Подобно приближению сильного холодного фронта, в сообществе синоптиков происходят серьезные изменения. Конечный результат? Совершенно новый способ прогнозирования погоды на основе ИИ, работающий на персональном компьютере.
Исследователи из Лаборатории компьютерных наук и искусственного интеллекта МИТ и Google Research свершили настоящую магию со своей последней разработкой – диффузионная модель, которая может изменять свойства материала объектов на изображениях.
Компания OpenAI представила GPT-4о – уникальную омнимодель, объединяющую обработку текста, звука и изображений, что позволяет ей работать быстрее и эффективнее, чем когда-либо прежде.
SenseNova – последняя модель искусственного интеллекта от SenseTime Group вызвала всплеск интереса на рынке благодаря своим впечатляющим достижениям, включая усовершенствованную обработку информации, математическое мышление и лингвистические способности.
Последняя разработка от компании Meta AI – Llama 3 может похвастаться непревзойденной обработкой речи, что улучшает ее способность выполнять сложные задачи. Благодаря увеличенному словарному запасу и расширенным функциям безопасности повышена производительность и универсальность модели.
Исследуйте удивительный процесс синтеза музыки с сервисами Udio и Suno. Модели ИИ с легкостью генерируют полноценные песни разных жанров, а дополнительные настройки платформ позволяют пользователям экспериментировать со стилями и создавать оригинальные мелодии за считанные секунды.
Машинное "разобучение" позволяет генеративному ИИ избирательно забывать проблемные данные без длительного переучивания. Этот метод может обеспечить соблюдение правовых и нравственных норм, сохраняя при этом творческие способности моделей для генерации изображений.
DeepMind от Google разработал SAFE – новый метод фактологии для больших языковых моделей, таких как ChatGPT. Проверка фактов искусственным интеллектом уже продемонстрировала поразительные результаты, превосходя показатели точности специалистов, выполняющих фактчекинг.
Исследователи из МІТ разработали новый метод, который упрощает генерацию изображений до одного шага. Команда усовершенствовала существующие модели, такие как Stable Diffusion, продемонстрировав способность нового фреймворка быстро создавать высококачественный визуальный контент.
Stability AI представила новый прорыв в моделях ИИ для генерации изображений – Stable Diffusion 3. Ее расширенный диапазон параметров и архитектура диффузионного трансформатора гарантируют создание сложных, высококачественных изображений и точный перевод текста в визуальный контент.
Последнее творение от OpenAI – Sora – создает увлекательные видео, демонстрируя непревзойденную реалистичность визуальных композиций. Благодаря сочетанию обработки речи и генерации видео, модель может интерпретировать текстовые подсказки, приспосабливаться к разным способам ввода данных и имитировать динамическое движение камеры.
Черпая вдохновение от Gemini, Gemma сфокусирована на открытости и доступности, предлагая универсальные модели, подходящие для различных устройств и фреймворков. Модель знаменует собой значительный шаг к демократизации ИИ, отмечая прозрачность и ответственное развитие технологий.
Amazon представил модель TTS с инновационной архитектурой, которая устанавливает новый стандарт для синтеза речи. BASE TTS не только обеспечивает непревзойденную естественность речи, но и демонстрирует чрезвычайную адаптивность в обработке различных языковых нюансов.
MPT-7B предлагает оптимизацию архитектуры и улучшение производительности, включая совместимость с экосистемой HuggingFace. Обученная на 1 триллионе токенов текста и кода, модель устанавливает новый стандарт LLM для коммерческого использования.
Глубокое активное обучение сочетает традиционное обучение нейронной сети со стратегическим отбором образцов данных. Такой инновационный подход позволяет повысить производительность, эффективность и точность модели в широком спектре применений.
Интеграция высокопроизводительного вычислительного скрининга и алгоритмов МО позволила ученым преодолеть традиционные ограничения, способствуя динамическому исследованию материалов. Эта комбинация привела к открытию новых материалов с уникальными свойствами.
Coscientist – умный лабораторный партнер, способный самостоятельно планировать и проводить химические эксперименты. Продемонстрировав умение быстро учиться, система ИИ искусна в использовании технической документации и самоисправлении.
Модель StableRep улучшает процесс обучения ИИ за счет синтетического воспроизведения. Генерируя разнообразные изображения с помощью текстовых промтов, она не только решает проблемы сбора данных, но и способствует внедрению более эффективных и выгодных альтернатив обучения.
Исследователи объединили усилия для создания программируемого квантового процессора, оперирующего с высокой отказоустойчивостью на базе логических кубитов. Это открывает новые перспективы для масштабных и надежных квантовых вычислений, способных решать ранее неразрешимые задачи.
Тест Тьюринга, ставший когда-то новаторским для выявления машинного мышления, теперь ограничен способностью ИИ имитировать человеческие реакции. В новом исследовании представлена трехступенчатая система, позволяющая определить, может ли ИИ рассуждать как человек.
QuData представляет компьютеризированную систему диагностики рака молочной железы на основе ИИ. Эта инновационная технология обеспечивает раннее выявление онкопатологий и оперативное вмешательство, знаменуя значительный шаг вперед к доступному, точному и своевременному лечению с лучшими результатами.
Новая модель Gemini AI намерена превзойти все существующие достижения в сфере искусственного интеллекта. Благодаря своей мультимодальности, масштабируемости в различных сферах и потенциалу интегрироваться в экосистему Google, Gemini AI делает значительный скачок в развитии технологий ИИ.
ALERTA-Net — новая глубокая нейронная сеть, объединяющая социальные сети, макроэкономические показатели и информацию поисковых систем. Уникальная модель предсказывает движение цен на акции и волатильность фондового рынка, выходя за пределы традиционных методов анализа.
В 1950 году британский ученый Алан Тьюринг предложил тест, определяющий, способны ли машины мыслить. На сегодняшний день, еще ни одному искусственному интеллекту не удалось успешно его пройти. Сможет ли ChatGPT стать первым?
Лаборатория Линкольна активно работает над уменьшением энергопотребления моделей ИИ. Их цели включают внедрение прозрачности использования энергии и повышение эффективности обучения ИИ-моделей.
OpenAI провела впечатляющий DevDay и представила новый функционал. Погрузись в мир инноваций и расширь свои горизонты в работе с искусственным интеллектом. Узнай о горячих новинках в нашей статье!
В продолжение исследований о древовидных архитектурах изучается вопрос о необходимости глубокого обучения для ИИ и предлагаются альтернативные методы машинного обучения, которые могут быть более эффективными для сложных задач классификации.
Ученые из Института гарантированной автономии исследуют новые методы обеспечения безопасности в растущем мире беспилотных авиационных систем, применяя современные методы искусственного интеллекта и симуляционных сред.
Новейший метод оценки движения позволяет извлекать долгосрочные траектории движения для каждого пикселя в кадре, даже в случае быстрых движений и сложных сцен. Узнайте больше о захватывающей технологии и будущем анализа движения в статье об OmniMotion.
Вдохновленные способностями муравьев, исследователи из Эдинбургского и Шеффилдского университетов разрабатывают искусственную нейронную сеть, чтобы помочь роботам распознавать и запоминать маршруты в сложных природных условиях.
Последние исследования в сфере ИИ, основанные на древовидной архитектуре, открывают новые перспективы для обучения искусственных нейронных сетей.
Последние исследования показывают, что, несмотря на широкое использование CAPTCHA в качестве защиты от автоматизации, современные боты лучше и быстрее решают задачи CAPTCHA, чем люди.
SeamlessM4T разрушает языковые барьеры благодаря своим комплексным возможностям перевода и транскрипции. Эта модель ИИ может легко преобразовать язык или текст, обеспечивая перевод в режиме реального времени и способствуя межкультурному взаимопониманию.
Модель OncoNPC точно идентифицирует местонахождение опухолей, которые трудно отследить, что способствует целенаправленному и персонализированному лечению. Для определения новообразований вычислительная модель способна проанализировать последовательность 400 генов.
IBM и NASA запускают геопространственную модель ИИ с открытым кодом на платформе Hugging Face. Ее цель расширить доступ к спутниковым данным NASA и способствовать новым открытиям в климатологии.
Новое исследование по совершенствованию технологий компьютерного зрения сочетает науку о больших данных и физику. Такое гибридное компьютерное зрение позволяет ИИ осознанно воспринимать, взаимодействовать и реагировать на внешнюю среду в реальном времени.
Благодаря инновационному методу "curious replay" агенты ИИ теперь способны самостоятельно анализировать свой опыт и исследовать новую среду, что значительно улучшает их способность адаптироваться и повышает эффективность работы.
Новаторская система ИИ использует неинвазивные методы и данные сканера фМРТ для превращения мыслей в текст. Достигнутые показатели семантического декодера в переводе мыслей человека открывают новые возможности для улучшения общения.
Европейское космическое агентство использует нейронные сети при разработке системы сбора и доставки образцов с Марса. Сложная миссия по возвращению образцов, собранных марсоходом Perseverance, считается решающей для раскрытия тайн красной планеты.
Генеративный искусственный интеллект трансформирует мир компьютерных игр, преобразуя виртуальных персонажей и улучшая их навыки общения. NVIDIA Avatar Cloud Engine (ACE) позволяет разработчикам наделять неигровых персонажей интеллектом, тем самым изменяя игровой процесс и расширяя границы возможного.
Исследователи работают над более эффективным методом машинного обучения для неопределенных ситуаций в реальном мире. Новый алгоритм будет определять, когда "машина-ученик" должна слушаться своего учителя, а когда учиться самостоятельно.
Новая архитектура направлена на преодоление существующих ограничений нейронных сетей и символического ИИ. Предложенная модель уже демонстрирует высокую эффективность в решении логических задач, открывая перспективу для интеграции различных парадигм ИИ.
Меминдуктор, как и открытые ранее мемристор и мемконденсатор, является одним из элементов электронной схемы, способных сохранять и восстанавливать предыдущие значения тока или напряжения.
Солнечные батареи на основе гибридных органо-неорганических перовскитов в настоящее время одно из наиболее прогрессирующих направлений альтернативной энергетики. Эти молекулы положили начало развитию нового класса фотовольтаических устройств – перовскитных солнечных элементов.
Исследователи использовали набор простых программ для генерации изображений, чтобы создать набор данных для обучения моделей компьютерного зрения. Такой подход способствует улучшению производительности моделей классификации изображений, обученных на синтетических данных.
Ученые разработали новый подход к моделированию движения, используя относительное изменение положения. Они оценили способность архитектур глубоких нейронных сетей моделировать движение посредством задач распознавания и прогнозирования движения.
Исследователи разработали новый алгоритм ИИ, призванный визуализировать кластеры данных и другие макроскопические признаки так, чтобы они были максимально отчетливы, легко наблюдаемые и понятные для людей.
Ученые разработали модель DetectGPT, которая в 95% случаев может отличить текст, написанный человеком, от текста, сгенерированного с помощью популярных языковых моделей с открытым исходным кодом.
Исследователи создали новую нейроморфную вычислительную систему, поддерживающую генеративный и графический класс моделей глубокого обучения и возможность работы с нейронными моделями глубокого обучения.
Группа ученых разработала новый способ прогнозирования выбросов аминов на заводах по улавливанию углерода, используя машинное обучение и экспериментальные данные стресс-теста, проведенного на заводе в Германии.
Ученые разработали первый искусственный биореалистичный нейрон, который может эффективно взаимодействовать с настоящими биологическими нейронами.
Ученые разработали бионический палец, который может создавать 3D-карты внутренней структуры материалов, касаясь их внешней поверхности.
Беспроводная мягкая электронная кожа может как распознавать, так и передавать ощущение прикосновения, а также формировать сенсорную сеть, что открывает большие возможности для улучшения интерактивного сенсорного общения.
Meta AI запустила LLaMA, серию базовых языковых моделей, которые могут конкурировать или даже превосходить лучшие модели среди существующих, такие как GPT-3, Chinchilla и PaLM.
MusicLM – это искусственный интеллект нового поколения, создающий высококачественную музыку на основе текстовых описаний, подобно тому, как DALL-E создает изображения из текстов.
Ученые из Мичиганского университета исследовали стратегии поведения роботов для восстановления доверия между ботом и человеком. Смогут ли такие стратегии полностью восстановить доверие и насколько они эффективны после повторных ошибок ботов?
Группа исследователей создала Байесовскую машину с использованием мемристоров. Она более энергоэффективна, чем существующие аппаратные решения, и может использоваться для критических с точки зрения безопасности приложений.
Благодаря достижениям в сфере искусственного интеллекта инженеры из Колорадского Университета в Боулдере работают над новым типом трости для слепых или слабовидящих.
Исследователи Тель-Авивского университета достигли технологического прорыва: новый биологический датчик фиксирует наличие запаха и посылает информацию о нем роботу для интерпретации результатов.
Модели синтеза речи обычно требуют длительных образцов аудиофайлов для обработки, тогда как VALL-E имитирует голос всего за несколько секунд звукозаписи.
Исследователи из Стэнфордского университета разработали новый тип эластичного биосовместимого материала, который распыляется на внешнюю сторону рук и может распознавать их движения.
Point·E — это новая система текстового синтеза 3D-изображений, которая сначала формирует искусственное представление про объект, а затем на его основе создает цветные облака точек.
Беспилотные авто уже давно считаются видом транспорта нового поколения. Для обеспечения автономной навигации таких транспортных средств необходимо внедрить множество различных технологий.
Новое исследование Тихоокеанской северо-западной национальной лаборатории предполагает использование машинного обучения, анализа данных и искусственного интеллекта для обнаружения потенциальных ядерных угроз.
Исследователи разработали новые способы использования ИИ вместе с видеонаблюдением для розничной торговли, чтобы лучше понимать поведение потребителей и адаптировать планирование магазинов для увеличения продаж.
Декодирование речи на основе активности головного мозга являлось давней целью неврологов и клиницистов. Компания Meta поделилась исследованиями по разработке модели ИИ, которая способна декодировать речь с помощью неинвазивных методов исследования.
Приложение Look to Speak от Google способно помочь людям с нарушениями моторики и проблемами речи легче общаться. Используя только глаза, программа позволяет выбирать заранее подготовленные фразы и озвучивать их.
Исследователи Массачусетского технологического института разработали метод машинного обучения, который точно улавливает и моделирует основную акустику местности, используя лишь небольшое количество звукозаписей.
К 2050 году человечеству придется почти вдвое увеличить глобальные запасы продовольствия, чтобы обеспечить каждого жителя планеты достаточным количеством еды. Поскольку изменение климата происходит все быстрее, водные ресурсы сокращаются, а пахотные земли разрушаются, гарантировать устойчивое развитие станет серьезным вызовом.
За последнее десятилетие резкий рост стоимости производства видеоигр класса ААА стал одной из самых серьезных проблем в игровой индустрии. Cтудии постоянно ищут технологии, которые могли бы помочь снизить стоимость разработки игр. Последние достижения в нейронных моделях генерации изображений вселяют надежду, что реализация этой мечты может быть не так уж и далека.
Могут ли компьютеры думать? Могут ли модели искусственного интеллекта (ИИ) быть сознательными? Эти и подобные вопросы часто возникают при обсуждении недавнего прогресса ИИ, достигнутого с помощью моделей естественного языка GPT-3, LAMDA и других преобразователей. Тем не менее они все еще противоречивы и находятся на грани парадокса, потому что обычно существует множество скрытых предположений и ошибочных представлений о том, как работает мозг и что означает мышление. Нет другого пути, кроме как точно сформулировать эти предположения, а затем исследовать, как именно обработка информации человеком может быть воспроизведена машинами.
Сейчас никого не удивишь фильтрами, которые улучшают качество фотографий. Но восстановление старых портретов пока оставляет желать лучшего. Старые фотографии бывают слишком размытыми, поэтому обычные методы повышения четкости изображений на них не работают.
Компания Facebook выложила в открытый доступ проект NLLB (No Language Left Behind). Основной особенностью данной разработки является охват более двухсот языков, включая редкие языки африканских и австралийских народов. Кроме того Facebook применил новый подход к модели машинного обучения, в котором перевод осуществляется напрямую из одного языка на другой, без промежуточного перевода на английский.
Группа учёных используя машинное обучение «переоткрыла» закон Всемирного тяготения.
Анимированные аватары давно уже вошли в нашу жизнь. Но вот реалистичное моделирование анимации одежды, пока оставалось открытой задачей.
С одной стороны современные методы физического моделирования могут генерировать реалистичную геометрию одежды с интерактивной скоростью. С другой, моделирование фотореалистичного внешнего вида обычно требует физического рендеринга, который слишком дорог для интерактивных приложений.
Группа учёных используя машинное обучение «переоткрыла» закон Всемирного тяготения.
Для этого они обучили «графическую нейронную сеть» для моделирования динамики Солнца, планет и больших планет Солнечной системы из 30-летних наблюдений. Затем они использовали символическую регрессию, чтобы обнаружить аналитическое выражение закона силы, неявно изученного нейронной сетью.