Новини

Свіжі новини та корисні статті про штучний інтелект і машинне навчання

Тест Тюрінга більше не працює?

Тест Тюрінга був розроблений вченим Аланом Тюрінгом і передбачає проведення експеримента, у якому учасник взаємодіє одночасно з комп’ютером і живою людиною. На основі отриманих відповідей на свої запитання учасник повинен визначити, з ким він спілкується: з людиною чи машиною. Якщо людина не змогла їх розрізнити, це означає, що машина успішно "пройшла" випробування.

Однак цей тест, який колись став інноваційним, тепер має свої обмеження. Він насамперед зосереджений на імітації людських реакцій, а не на справжніх людських міркуваннях. Багато моделей штучного інтелекту відмінно імітують стиль розмови, але їм часто бракує глибоких розумових здібностей. Це не вимагає від ШІ самосвідомості чи розуміння власних міркувань. Навіть сам Тюрінг визнав, що цей тест не може точно визначити, чи можуть машини мислити; це більше стосується наслідування, ніж пізнання.

Раніше ми досліджували питання проходження GPT-4 тесту Тюрінга та результати, отримані під час експерименту. Ви можете докладніше прочитати статтю за посиланням.

Щоб усунути вищезгадані обмеження тесту Тюрінга, Філіп Н. Джонсон-Лейрд (Philip N. Johnson-Laird) з Прінстонського університету та Марко Рагні (Marco Ragni) з Технічного університету Хемніца розробили альтернативу відомому тесту. Вони пропонують змістити фокус уваги з того, чи може машина імітувати людські реакції, на більш фундаментальне питання: "Чи міркує ШІ так само, як людина?"

В опублікованій статті вони описують нову систему оцінки, мета якої – визначити, чи справді ШІ міркує, як людина. Ця система складається з трьох важливих етапів.

1. Випробування програми в серії психологічних експериментів з міркування.

Перший крок передбачає проведення серії психологічних експериментів серед моделей ШІ, покликаних відрізнити людське мислення від стандартних логічних процесів. Ці експерименти заглиблюються в різні аспекти міркувань, досліджуючи нюанси, які відхиляються від стандартних логічних рамок.

Якщо судження машини відрізняються від суджень людини, ми відповіли на попереднє запитання. Комп’ютер міркує інакше, ніж люди. Однак, якщо його судження значною мірою збігаються з людськими міркуваннями, ми переходимо до другого кроку.

2. Перевірка розуміння програмою власного процесу міркувань.

Цей крок має на меті оцінити розуміння ШІ власних процесів міркування, що є критично важливим аспектом людського пізнання. В ідеалі машина повинна бути здатна аналізувати своє мислення та надавати пояснення своїм рішенням, нагадуючи самоаналіз, який властивий людям.

Якщо програма проходить цей тест, третій крок є аналітичним.

3. Вивчення вихідного коду програми.

Останній крок передбачає вивчення вихідного коду програми. Якщо він містить ті ж самі фундаментальні компоненти, які моделюють людську діяльність, зокрема інтуїтивну систему для швидких висновків, деліберативну систему для більш вдумливих міркувань і систему для інтерпретації термінів на основі контексту і загальних знань, то це є вирішальним доказом. Якщо вихідний код програми відображає ці принципи, вважається, що модель ШІ мислить як людина.

Розглядаючи ШІ як учасника когнітивних експериментів, цей інноваційний підхід означає зміну парадигми в оцінці штучного інтелекту. Піддаючи аналізу комп'ютерний код, вчені пропонують переглянути стандарти оцінки ШІ. Оскільки світ прагне створити більш досконалу модель штучного інтелекту, ця нова концепція може стати значним кроком вперед у нашому розумінні того, як думають машини.