14 Листопада, 2024

Штучний інтелект може керувати комп’ютерами

Компанія Anthropic представила значне оновлення своєї лінійки штучних інтелектів – модель Claude 3.5 Sonnet, яка має безпрецедентну здатність керувати комп’ютером, подібно до людини. Нова функція під назвою “використання комп’ютера” наразі доступна у публічній бета-версії, що дозволяє розробникам спрямовувати Claude на взаємодію з десктопом, натискання кнопок і навіть введення тексту, аналізуючи скріншоти та відтворюючи дії користувача.

На відміну від інших технологічних гігантів, таких як Microsoft і OpenAI, які демонстрували подібні функціональні можливості, але обмежували свої інструменти лише переглядом екранів без повного операційного контролю, Anthropic зробили сміливий крок. Claude 3.5 тепер може повноцінно взаємодіяти з додатками та автоматизувати робочі процеси, що дозволяє відійти лише від проведення досліджень до виконання рутинних завдань.

Ідея, що штучний інтелект може безпосередньо працювати на комп’ютері, не є абсолютно новою. Компанії, що спеціалізуються на роботизованій автоматизації процесів (RPA), пропонують подібні інструменти вже багато років. Проте підхід Anthropic інтегрує ШІ з рівнем універсальності та гнучкості у використанні, якого RPA зазвичай бракує. Натомість застосування заздалегідь налаштованих скриптів автоматизації, функція “використання комп’ютера” в Claude 3.5 надає розробникам можливість керувати ШІ за допомогою природної мови, наказуючи йому повторювати рутинні завдання, проводити дослідження та навіть виконувати складніші операції.

Anthropic інтегрували цю функцію через API, що дозволяє користувачам, наприклад, попросити Claude зібрати дані з різних джерел та заповнити форму або об’єднати інформацію з кількох додатків. Модель “бачить” екран через серію скріншотів, які вона з’єднує, щоб сформувати цілісне уявлення про робочий стіл. Далі, на основі наданих інструкцій, вона симулює такі дії, як переміщення курсора, натискання кнопок чи введення тексту.

Незважаючи на обнадійливі результати, функція залишається експериментальною. Залежність Claude від серії нерухомих зображень замість потокового відео у реальному часі може ускладнювати швидкі дії, такі як реагування на сповіщення. В Anthropic застерігають, що реалізація деяких завдання, таких як перетягування та масштабування, все ще зустрічає перешкоди, але планується постійно вдосконалювати функції на основі відгуків від перших користувачів.

Claude 3.5 Sonnet продемонстрував вражаючі результати під час тестів продуктивності (бенчмарк), зокрема у завданнях, що вимагають кодування та використання спеціалізованих інструментів. Модель набрала значно вищі бали на тесті SWE-bench Verified, підвищивши свою ефективність до 49%, що перевищує показники провідних загальнодоступних ШІ-моделей. На TAU-bench, що оцінює здатність ШІ справлятися з реальними завданнями у таких секторах, як роздрібна торгівля та авіаподорожі, точність Claude також значно зросла.

Безпека та етичні міркування є пріоритетом для Anthropic при випуску цієї технології. У відповідь на занепокоєння щодо можливих зловживань, таких як поширення дезінформації чи втручання у вибори, Anthropic розробили Claude з обмеженням взаємодії з соціальними мережами, урядовими сайтами та доменами, пов’язаними з конфіденційними даними. Виявляються спеціальні запити, що можуть призвести до ризикових дій, а сам Claude запрограмований уникати високоризикових операцій, якщо це не передбачено інструкціями користувача.

Крім того, модель оснащена класифікаторами, що відстежують її дії, зокрема пости у соціальних мережах або реєстрацію доменів. Для подальшої звітності Anthropic зберігає скріншоти з сесій Claude протягом щонайменше 30 днів, забезпечуючи запис дій, який може бути переглянутий за потреби.

Компанія Anthropic визнає, що це лише початок. Поточна версія Claude 3.5 Sonnet слугує випробувальним майданчиком, а відгуки користувачів допоможуть компанії покращити продуктивність і протоколи безпеки моделі. Хоча здатність Claude відтворювати людську взаємодію з десктопом відкриває нові можливості, це також приносить нові виклики. Anthropic ретельно контролює застосування моделі, щоб зберегти баланс між інноваціями та відповідальним використанням ШІ.

Для клієнтів з обмеженим бюджетом Anthropic також готується випустити Claude 3.5 Haiku – більш економну версію моделі, яка забезпечуватиме аналогічну продуктивність, але з меншою затримкою. Claude 3.5 Haiku спочатку буде доступна як модель, що працює лише з текстом, але згодом її функціонал розшириться на підтримку мультимодальних додатків для роботи з текстом і зображеннями.

Новини

Штучний інтелект може керувати комп’ютерами