Новости

Свежие новости и полезные статьи про искусственный интеллект и машинное обучение

Китайская модель ИИ SenseNova 5.0 превзошла ChatGPT

Ведущая китайская компания по разработке искусственного интеллекта SenseTime Group подняла волну интереса в мире технологий, объявив о новой модели ИИ – SenseNova 5.0. После этой новости акции компании выросли более чем на 30%, свидетельствуя о больших ожиданиях вокруг этой разработки.

Давайте подробнее рассмотрим ключевые достижения SenseNova 5.0:

  1. Углубление знаний: модель SenseNova прошла интенсивное обучение, охватившее более 10 ТВ токенов данных. Такое всестороннее обучение значительно улучшило базу знаний, что позволило модели ИИ лучше понимать и обрабатывать сложную информацию. Система использует архитектуру Mixture of Experts, позволяющую эффективно охватывать около 200 000 контекстных окон при выводе результатов.
  2. Математика и размышления: математические возможности модели и ее процесс рассуждений были значительно расширены. Теперь она может более эффективно обрабатывать числовые выводы, генерировать код и понимать длинные тексты.
  3. Лингвистические и творческие способности: креативные способности SenseNova к написанию текстов, рассуждению и обобщению значительно улучшились. При одинаковом объеме входных знаний она обеспечивает лучшее понимание, суммаризацию и ответы на вопросы.
  4. Мультимодальные взаимодействия: SenseNova поддерживает разбор и понимание изображений с высоким разрешением, а также преобразование текста в изображение. Она может извлекать сложные данные из документов и обобщать ответы на вопросы, демонстрируя мощный потенциал мультимодального взаимодействия. Ее лучшее в мире графическое и текстовое восприятие занимает первое место по совокупности баллов в популярных тестах на мультимодальность.

Глава компании Xu Li смело заявил, что искусственный интеллект SenseNova 5.0 превосходит модель GPT-4 от OpenAI в большинстве общих сценариях использования. Особенно эффективно проявила свои возможности SenseNova в общении на китайском языке. Ее способность понимать, обобщать и отвечать на вопросы на китайском значительно превосходит GPT-4. Это делает модель привлекательным выбором для корпоративных приложений, сферы образования и генерации контента.

В дополнение к SenseNova 5.0, компания SenseTime выпустила улучшенную продуктовую матрицу для больших моделей с полным стеком "Cloud-to-Edge". Эта матрица включает большую модель Edge-side от SenseTime для терминальных устройств и интегрированную большую модель от SenseTime (Enterprise) для периферийных устройств. Эти модели могут применяться в таких областях, как финансы, кодирование, здравоохранение и государственные услуги, что еще больше расширяет горизонты применения больших языковых моделей.