Обычно различают два основных вида Искуственного Интеллекта (ИИ) в процессе их обучения и используемых технологий: Традиционный ИИ и Генеративный ИИ.
Искусственный интеллект. Обзор
Традиционный ИИ
Традиционный ИИ, часто называют узким или слабым ИИ, ориентирован на интеллектуальное выполнение конкретной задачи. Он относится к системам, которые предназначены для реагирования на определенный набор входных данных. Такие системы способны обучаться на основе данных и принимать решения или прогнозы на их основе.
Представьте, что вы играете в компьютерные шахматы. Компьютер знает все правила, он может предсказывать ваши ходы и делать свои собственные, основываясь на заранее определенной стратегии. Он не изобретает новые способы игры в шахматы, а выбирает стратегию из уже запрограммированных. Это и есть традиционный ИИ.
Традиционный искусственный интеллект подобен мастеру-стратегу, способному принимать разумные решения в рамках определенного набора правил. Другие примеры традиционных ИИ — это голосовые помощники, такие как Siri или Alexa, рекомендательные системы Netflix или Amazon, поисковый алгоритм Google. Их обучили следовать определенным правилам, выполнять определенную работу, но они не создают ничего нового.
Генеративный ИИ
Генеративный ИИ можно рассматривать как следующее поколение искусственного интеллекта. Это форма ИИ, которая способна создавать что-то новое. Предположим, у вас есть друг, который любит рассказывать истории. Но вместо друга-человека у вас есть искусственный интеллект. Вы даете ИИ начальную строку, скажем, «Давным-давно в далекой-далекой галактике…», после ИИ берет ее и создает целую историю о космических приключениях, с персонажами, сюжетными поворотами и захватывающей развязкой.
В отличие от традиционного ИИ, генеративный создает нечто новое на основе той информации, которую ему предоставили. Он может создавать оригинальный, творческий контент, будь то текст, изображение, музыка или компьютерный код. Модели генеративного ИИ обучаются на наборе данных и, изучая основные закономерности, генерируют новые данные, повторяющие обучающий набор.
Яркий пример генеративного ИИ — GPT-4 [Wiki], модель языкового прогнозирования OpenAI [Wiki]. Обученная на огромных массивах данных Интернета, она способна создавать человекоподобные тексты, практически неотличимые от текстов, которые написал бы человек.
Сводная сравнительная таблица ИИ
Основное различие между традиционным и генеративным ИИ заключается в их возможностях и применении. Традиционные системы ИИ используют в основном для анализа данных и составления прогнозов, в то время как генеративный ИИ идет дальше и создает совершенно новый контент.
# |
Традиционный ИИ |
Генеративный ИИ |
Основные характеристики |
Специфические задачи |
Возможность создания новых данных |
Изучает данные и принимает решения или делает прогнозы |
Использование исходных данных для создания нового, оригинального контента |
|
Работает в рамках заранее определенного набора правил |
Может генерировать текст, изображения, музыку и код |
|
Метод обучения |
Контролируемое обучение |
Неконтролируемое обучение |
Требуется помечать данные для обучения |
Не требует маркированных данных для обучения |
|
Ограничения |
Ограниченность конкретными задачами |
Требуются большие объемы данных для обучения |
Невозможность создания нового, оригинального контента |
Сгенерированный контент может быть недостаточно последовательным и точным |
|
Для обучения может потребоваться большой объем помеченных данных |
Сложно контролировать специфику генерируемого контента |
|
Примеры |
ИИ, играющий в шахматы |
|
Фильтры спама в электронной почте |
ИИ для передачи стиля DeepArt |
|
Создание контента (рассказы, искусство, музыка) |
||
Создание фейков |
||
Поисковые алгоритмы (Google) |
Индивидуальные ответы ИИ |
Процесс обучения искусственного интеллекта
Традиционный ИИ
- Сбор данных. Набор данных должен соответствовать задаче, для которой предназначен ИИ. Например, если вы обучаете ИИ распознавать электронные письма со спамом, понадобится набор данных электронных писем, помеченных как «спам» или «не спам».
- Предварительная обработка данных. Данные часто необходимо очищать и форматировать, прежде чем их можно будет использовать для обучения. Это может включать удаление ненужной информации, обработку отсутствующих данных или преобразование текстовых данных в числовой формат.
- Разделение данных. Набор данных обычно делят на обучающий набор и тестовый набор. Обучающий набор используют для обучения модели, а тестовый набор используют для оценки производительности модели на невидимых данных.
- Обучение модели. Модель обучается на основе обучающих данных. При обучении с учителем модели показывают входные данные и правильные выходные данные. Модель делает прогноз на основе ввода, и вычисляется разница между прогнозом и правильным выводом (ошибка). Затем параметры модели корректируются, чтобы свести к минимуму эту ошибку.
- Оценка модели. После обучения модели она оценивается с использованием тестовых данных. Это дает представление о том, насколько хорошо модель может работать с невидимыми данными в будущем.
- Настройка и оптимизация. В зависимости от производительности модели на тестовых данных можно решить вернуться и настроить параметры модели, использовать другую модель или собрать больше данных.
Генеративный ИИ
- Сбор данных. Как и в случае с традиционным ИИ, первый шаг — это сбор набора данных. Для моделей GPT этот набор данных состоит из большого массива текстов. Например, GPT-4 был обучен на сотнях гигабайт текста из Интернета.
- Предварительная обработка данных. Затем данные предварительно обрабатываются. Это включает в себя очистку данных и преобразование их в формат, который модель может понять. Для GPT это включает в себя токенизацию, когда текст разбивается на меньшие части или токены.
- Обучение модели. Модель обучается с использованием моделирования языка на основе трансформера. Модели показывают последовательность токенов и от нее требуют предсказать следующий токен в последовательности. Например, при вводе «Кот сидел на …» от модели может потребоваться предсказать пропущенное слово. Модель делает прогноз, и рассчитывается разница между прогнозом и фактическим словом. Эта разница (потеря) используется для обновления весов модели и улучшения ее прогнозов.
- Обратное распространение и оптимизация. Потерю используют для выполнения обратного распространения — процесса, который рассчитывает градиент функции потерь относительно параметров модели. После используют алгоритм оптимизации, такой как Adam или стохастический градиентный спуск для корректировки параметров таким образом, чтобы минимизировать потерю.
- Повторение. Шаги 3 и 4 повторяются много раз, пока производительность модели не перестанет улучшаться. Каждый проход через обучающие данные называется эпохой.
- Тонкая настройка. После первоначального обучения модель может быть дополнительно настроена на конкретную задачу. Это включает в себя дальнейшее обучение модели на меньшем, специфическом для задачи наборе данных. Например, если вы хотели бы использовать GPT для генерации медицинского текста, вы могли бы дополнительно настроить его на наборе данных медицинских статей.