
Китайская модель ИИ SenseNova 5.0 превзошла ChatGPT
Ведущая китайская компания по разработке искусственного интеллекта SenseTime Group подняла волну интереса в мире технологий, объявив о новой модели ИИ – SenseNova 5.0. После этой новости акции компании выросли более чем на 30%, свидетельствуя о больших ожиданиях вокруг этой разработки.
Давайте подробнее рассмотрим ключевые достижения SenseNova 5.0:
- Углубление знаний: модель SenseNova прошла интенсивное обучение, охватившее более 10 ТВ токенов данных. Такое всестороннее обучение значительно улучшило базу знаний, что позволило модели ИИ лучше понимать и обрабатывать сложную информацию. Система использует архитектуру Mixture of Experts, позволяющую эффективно охватывать около 200 000 контекстных окон при выводе результатов.
- Математика и размышления: математические возможности модели и ее процесс рассуждений были значительно расширены. Теперь она может более эффективно обрабатывать числовые выводы, генерировать код и понимать длинные тексты.
- Лингвистические и творческие способности: креативные способности SenseNova к написанию текстов, рассуждению и обобщению значительно улучшились. При одинаковом объеме входных знаний она обеспечивает лучшее понимание, суммаризацию и ответы на вопросы.
- Мультимодальные взаимодействия: SenseNova поддерживает разбор и понимание изображений с высоким разрешением, а также преобразование текста в изображение. Она может извлекать сложные данные из документов и обобщать ответы на вопросы, демонстрируя мощный потенциал мультимодального взаимодействия. Ее лучшее в мире графическое и текстовое восприятие занимает первое место по совокупности баллов в популярных тестах на мультимодальность.
Глава компании Xu Li смело заявил, что искусственный интеллект SenseNova 5.0 превосходит модель GPT-4 от OpenAI в большинстве общих сценариях использования. Особенно эффективно проявила свои возможности SenseNova в общении на китайском языке. Ее способность понимать, обобщать и отвечать на вопросы на китайском значительно превосходит GPT-4. Это делает модель привлекательным выбором для корпоративных приложений, сферы образования и генерации контента.
В дополнение к SenseNova 5.0, компания SenseTime выпустила улучшенную продуктовую матрицу для больших моделей с полным стеком "Cloud-to-Edge". Эта матрица включает большую модель Edge-side от SenseTime для терминальных устройств и интегрированную большую модель от SenseTime (Enterprise) для периферийных устройств. Эти модели могут применяться в таких областях, как финансы, кодирование, здравоохранение и государственные услуги, что еще больше расширяет горизонты применения больших языковых моделей.