Искусственный интеллект в 2024 году активно развивается. Он становится для некоторых людей буквально частью работы/жизни. Некоторые полагают, что совсем скоро ИИ заменит обычного человека в некоторой деятельности. Специалисты все чаще задаются вопросом, могут ли такие «технологии» действительно мыслить. Способности к обучению у них есть. Вопрос о мышлении пока что остался открытым.
Задолго до появления известного ChatGPT и его аналогов появился так называемый тест Тьюринга. Далее предстоит изучить его более детально. Нужно выяснить, что это за тест такой, для каких целей он необходим, какими особенностями обладает. Также предстоит разобраться, причем тут ИИ.
Опубликованные данные рассчитаны на широкий круг читателей. Они будут полезны как обычным ПК-пользователям, которым интересно развитие современных технологий и вопрос наличия у них реального мышления, так и IT-специалистам. Особенно тем, кто использует искусственный интеллект в тех или иных целях.
Что это такое
Тест Тьюринга – это эмпирический тест. Он заключается в том, чтобы проверить, может ли машина (устройство) действительно мыслить. Тест Тьюринга помогает проверить устройство на отличие ответов, которое оно даст, по сравнению с человеком. Это своеобразная проверка на искусственный интеллект.
В основе данного теста лежит идея популярного развлечения под названием «игра в имитацию». Она заключается в том, что в разных комнатах сидели мужчина и женщина. Гости писали им вопросы и получали ответы, которые были написаны на машинке. По представленным ответам присутствующие пытались определить, где мужчина, а где – женщина. А те, в свою очередь, старались запутать гостей. Тьюринг предложил заменить одного из игроков на какой-нибудь прототип ЭВМ.
Вторая версия теста Тьюринга предполагала уже участие двух людей и компьютерного устройства. Каждый «участник» находился в отдельном помещении и не мог видеть остальных. Один человек общается с устройством при помощи письменных сообщений, а другой – пытается понять, кто есть кто. Если добиться успеха у него не получится, выигрыш «засчитывается» машине
Есть и третья версия теста Тьюринга. Она была озвучена по радио во время эфира BBC. Тьюринг сказал, что в новой интерпретации жюри задают вопросы компьютеры. Последний старается убедить опрашиваемых в том, что он является человеком. Тест рассматривается как пройденный, если удалось обмануть человека в 30 % случаев.
Историческая справка
Тест Тьюринга появился в 1950 году, когда компьютеры и другие машины еще не обладали достаточно высоким уровнем интеллекта. Алан Тьюринг предложил проводить тестирование с помощью специально созданной программы, которая имитировала поведение реального человека.
Но вопросы о том, могут ли машины мыслить, возник очень давно. В качестве примера можно привести французского философа и математика – Рене Декарта. Он считал, что механизм способен взаимодействовать с человеком, но не может реагировать на все, что происходит в его присутствии.
Эта идея стала толчком к появлению теста Тьюринга. Декарт заявил, что одной языковой реакции мало, чтобы отличить живого человека от созданной им имитации разума. Другой философ, Дени Дидро, в 1746 году тоже сформулировал критерии теста, но тогда он говорил о живых существах – попугаях. Он говорил о том, что, если бы нашелся попугай, который ответит на все его вопросы, то он бы заявил, что птица – мыслящее существо.
В 1936 году Альфред Айер еще ближе подобрался к рассматриваемой «проверке». Он задался вопросом о том, откуда мы знаем, что люди имеют тот же сознательный опыт, что и мы. Чтобы ответить на соответствующий вопрос, он предложил тестирование.
Критерии оценки
При прохождении теста Тьюринга используются самые разные критерии оценки ответов:
- способность к нормальному диалогу;
- умение компьютерной программы отвечать на неожиданные вопросы;
- приспособленность тестируемого устройства к изменяющейся среде и некоторые другие особенности
Необходимо, чтобы компьютерная программа не просто давала правильные ответы, но и предусматривала неповторимую индивидуальность, способную к творческому мышлению и подходу.
Так, если ответы будут очень подробными и идеальными, выдержанными в едином стиле, это укажет на то, что «диалог» строится с компьютером. Люди имеют одно интересное свойство – ошибаться. Они также иногда отвечают «не знаю», задают встречные вопросы, шутят и используют разговорную речь. Все это помогает выяснить, где живой человек, а где – компьютер.
Преимущества и недостатки
Тест Тьюринга имеет преимущества и недостатки. Их нужно знать еще до того, как специалист решит воспользоваться соответствующей проверкой.
К преимуществам теста Тьюринга можно отнести:
- Простую реализацию и высокую степень доступности. Рассматриваемая проверка Тьюринга – относительно легкий способ оценки уровня искусственного интеллекта. Его можно организовать без специального оборудования и специфических навыков.
- Развитие искусственного интеллекта. Разработчики программного обеспечения и исследователи могут использовать результаты тестирования для того, чтобы улучшить алгоритмы и создать более развитые системы/программы.
- Всеобъемность. Тест Тьюринга помогает оценить не только способность программного обеспечения решать определенные задачи, но и способность вести диалог, взаимодействовать с реальным человеком.
Недостатки у рассматриваемой проверки тоже есть. К ним относят:
- Ограниченность. Тест Тьюринга ограничен в своих возможностях. Он не способен оценить некоторые интеллектуальные способности вроде решения проблем, креативности, а также аналитического мышления.
- Отсутствие однозначности. Рассматриваемая проверка не является надежным инструментом оценки уровня интеллекта устройства. Ложноположительные результаты имеют место, как и ложноотрицательные.
- Субъективность. Оценка получаемых результатов может оказаться необъективной. Это связано с тем, что каждый человек имеет свое мнение и критерии, которые будут использоваться для проведения проверки.
- Недооценка физических возможностей. При помощи теста Тьюринга нельзя оценить возможность устройства/машины в физическом взаимодействии с окружающей средой. На человека соответствующий фактор оказывает огромное влияние.
Еще одним минусом можно рассматривать моральный аспект. Организация Turing test может привести к мысли о том, что человеческая интеллектуальность не имеет никакой неповторимости и уникальности. Это становится настоящим негативным опытом для многих людей.
Проблемы проверки нейросетей
В прошлом ни один компьютер не прошел тест Тьюринга. По мере развития нейросетей проводить рассматриваемую проверку становится все сложнее. Это связано с тем, что требования к экспертным навыкам судей возросли. Теперь такой человек должен хорошо разбираться в принципах функционирования нейросетей и искусственного интеллекта. Критерии оценки нужно все время менять и улучшать.
Так, языковая модель LaMDA от компании Google успешно прошла тест Тьюринга в 2022 году. Она смогла убедить судью в том, что он ведет диалог с реальным разумным человеком. С тем, кто может осознавать и чувствовать.
Соответствующая ситуация привела к тому, что теперь специалисты поняли – тест Тьюринга в своем классическом представлении уже не имеет никакой актуальности для искусственного интеллекта. Это повлекло за собой появление нового теста – AI Classification Framework.
В данной «проверке» искусственный интеллект оценивается по критериям 8 отдельных видов интеллекта:
- логико-математического;
- визуально-пространственного;
- межличностного;
- лингво-вербального;
- внутриличностного;
- музыкально-ритмического;
- телесно-кинестетического;
- экзистенциального.
При проверке известного ChatGPT удалось увидеть средний человеческий интеллект в соответствующей технологии в категориях логико-математического и лингво-вербального интеллекта в рамках AI Classification Framework. А вот по всем остальным «параметрам» ИИ получил 0 баллов.
Хотите освоить современную IT-специальность? Огромный выбор курсов по востребованным IT-направлениям есть в Otus!