Новини

Свіжі новини та корисні статті про штучний інтелект і машинне навчання

Китайська модель ШІ SenseNova 5.0 перевершила ChatGPT

Провідна китайська компанія з розробки штучного інтелекту SenseTime Group здійняла хвилю інтересу у світі технологій, оголосивши про нову модель ШІ – SenseNova 5.0. Після цієї новини акції компанії зросли більш ніж на 30%, що свідчить про великі очікування навколо цієї розробки.

Давайте детальніше розглянемо ключові досягнення SenseNova 5.0:

  1. Поглиблення знань: модель SenseNova пройшла інтенсивне навчання, яке охопило понад 10 ТБ токенів даних. Таке всебічне навчання значно покращило базу знань, що дозволило моделі ШІ краще розуміти і обробляти складну інформацію. Система використовує архітектуру Mixture of Experts, що дозволяє ефективно охоплювати приблизно 200 000 контекстних вікон під час виведення результатів.
  2. Математика та міркування: математичні можливості моделі та її процес міркування були значно розширені. Тепер вона може ефективніше обробляти числові результати, генерувати код та розуміти довгі тексти.
  3. Лінгвістичні та творчі здібності: креативні здібності SenseNova до написання текстів, здійснення міркувань та узагальнень значно покращилися. При однаковому обсязі вхідних знань вона забезпечує краще розуміння, узагальнення та відповіді на запитання.
  4. Мультимодальні взаємодії: SenseNova підтримує розбір і розуміння зображень з високою роздільною здатністю, а також перетворення тексту в зображення. Вона може витягувати складні дані з документів і узагальнювати відповіді на питання, демонструючи потужний потенціал мультимодальної взаємодії. Її найкраще у світі графічне та текстове сприйняття посідає перше місце за сукупністю балів в популярних тестах на мультимодальність.

Голова компанії Xu Li сміливо заявив, що штучний інтелект SenseNova 5.0 перевершує модель GPT-4 від OpenAI в більшості загальних сценаріях використання. Особливо ефективно проявила свої можливості SenseNova у спілкуванні китайською мовою. Її здатність розуміти, узагальнювати та відповідати на запитання китайською значно перевершує GPT-4. Це робить модель привабливим вибором для корпоративних застосунків, сфери освіти та генерації контенту.

На додаток до SenseNova 5.0, компанія SenseTime випустила покращену продуктову матрицю для великих моделей із повним стеком "Cloud-to-Edge". Ця матриця включає в себе велику модель Edge-side від SenseTime для термінальних пристроїв та інтегровану велику модель від SenseTime (Enterprise) для периферійних пристроїв. Ці моделі можна застосовувати в таких галузях, як фінанси, кодування, охорона здоров'я та державні послуги, що ще більше розширює горизонти застосування великих мовних моделей.