Что такое машинное обучение простыми словами

В общем и целом об искусственном интеллекте
Machine learning ― что нужно, чтобы ИИ начал работать
Классическое
С подкреплением
Глубинное обучение

Думаете, искусственный интеллект ― это что-то из фантастики и прогнозов учёных о будущем? Нет, это реальность. В статье мы поговорим о том, как учится искусственный интеллект и зачем нужно машинное обучение в современном мире.

В общем и целом об искусственном интеллекте

Мозг слишком сложен и во многом неизведан, но человек стремится создать что-то настолько же невероятное своими руками. Искусственный интеллект (ИИ) ― это попытка человечества создать себе помощника в рутинных или слишком сложных задачах.

На данный момент ИИ уже интегрирован в приложения, которые строят маршруты. Компьютер анализирует такие показатели, как расстояние, интенсивность трафика и проведение дорожных работ, чтобы найти самый быстрый маршрут до пункта назначения. Искусственный интеллект способен распознавать речь человека, чтобы запускать устройства. Вы в прямом смысле можете говорить со своим пылесосом или автомобилем, и он будет вас понимать. Кроме того, ИИ может распознавать не только сами слова, но и тон речи. Например, Яндекс.Станция способна различать детский и взрослый голоса и предлагать соответсвующий возрасту контент.

Чтобы ИИ работал корректно, он, как и человек, должен получать знания и нарабатывать навыки. Чтобы оптимизировать этот процесс, были разработаны методики машинного обучения, или machine learning.

Как работает машинное обучение

Задача машинного обучения ― дать достаточно информации, чтобы компьютер смог самостоятельно находить решения различных задач. Компьютер должен научиться анализировать информацию и определять закономерности быстрее людей с помощью алгоритмов.

Алгоритмы зависят от типа задачи, которую выполняет ИИ, и от количества данных. Как правило, чтобы научиться создавать правильные прогнозы, нужен большой объём данных и статистики.

Machine learning ― что нужно, чтобы ИИ начал работать

Как в педагогике есть множество программ для обучения детей, так и при обучении компьютеров используют несколько видов машинного обучения. Теория машинного обучения включает целый комплекс методов, однако мы рассмотрим основные и самые распространённые.

Классическое

Самый распространённый, простой и дешёвый метод обучения искусственного интеллекта. Таким способом, например, обучают алгоритмы для блока «Рекомендованные статьи» на сайте.

Классическое обучение бывает:

с учителем,
без учителя,
с частичным привлечением учителя.

С учителем (supervised learning)

У машины есть учитель — реальный человек, который объясняет, что правильно, а что нет. Например, может рассказать, где на картинке птица, а где бабочка. Учитель заранее готовит для машины наглядное пособие для изучения мира. ИИ остаётся только усвоить материал и отработать его на примерах. Это самый быстрый и точный способ обучения машины.

Без учителя (unsupervised learning)

В этом случае на машину “обрушиваются” данные и она сама должна в них разобраться. Условно, ей показывают сотни тысяч фотографий птиц и бабочек. ИИ должен сам найти закономерности и классифицировать данные. Этот способ обучения долгий и не всегда точный. Однако он подходит в тех случаях, когда человек не может заранее предугадать закономерности.

Такой способ используют банковские системы, чтобы выявить мошенников. Искусственный интеллект замечает отклонение от привычной покупательской деятельности и сигнализирует об этом. Например, он заметит странность, если одну кредитную карту будут использовать в Англии, а уже через пару минут в Швеции.

Обучение с частичным привлечением учителя (semi-supervised learning)

В этом случае машина получает как уже структурированные человеком данные, так и набор неразмеченных данных. Задача ИИ ― опираясь на уже размеченные данные, исследовать остальную неструктурированную информацию. Это применяется в тех случаях, когда данных слишком много и человеку потребуется слишком много времени на работу. Такой метод распространён в медицине. Например, рентгенолог готовит для машины несколько снимков и отмечает на них опухоли. На основе этих данных машина разбирает другие снимки.

С подкреплением

Поместите робота в лабиринт и ждите, когда он из него выберется — так кратко можно описать метод обучения с подкреплением. Он используется там, где задача не анализировать данные, а выжить в реальной среде. Робота помещают в реальные ситуации, штрафуют за ошибки и награждают за правильные поступки. Задача ИИ в этом случае ― обобщить ситуацию и понять, как действовать максимально эффективно в похожих ситуациях или получить выгоду.

Обучение с подкреплением используют для самоуправляемых автомобилей, роботов-пылесосов, программ для управления ресурсами предприятий, а также для обучения персонажей в играх.

Для роботов-пылесосов и самоуправляемых автомобилей создают виртуальный город, населяют виртуальными пешеходами и отправляют учиться соблюдать правила. Как только у машины получается проехать маршрут без аварий, его отправляют в реальную среду.

Глубинное обучение

В основе глубинного обучения (deep Learning) лежат всем известные нейросети. При других методах обучения машина получает определенный набор данных, который нужно изучить и выявить закономерность. При глубинном обучении используется в разы больше данных и они сильно различаются по содержанию.

В заголовке мы обещали, что всё будет простыми словами, поэтому покажем работу нейросети на примере. Для начала вам нужно знать, что для работы с нейросетями используют 3 понятия:

1. Входной слой — данные, которые поступают в систему и которые она затем анализирует;
2. Скрытый слой или слои — здесь происходят математические вычисления. Когда данных очень много, появляется несколько слоёв;
3. Выходной слой — результат анализа и обработки.

Представим, что ИИ предсказывает цену на авиабилет. Для этого он использует 4 типа данных (входной слой):

аэропорт вылета,
аэропорт назначения,
дата вылета,
авиакомпания.

Они попадают в скрытый слой. Математическое преобразование основано на весе каждой единицы данных. Чем больше вес, тем важнее считается параметр, поэтому каждый из показателей сначала измеряется. В нашем случае самый важный параметр — дата вылета. Этот показатель будет иметь наибольший вес относительно других показателей. Как только все расчёты закончатся, пользователь получит прогноз цены перелёта.

Пример простой. В реальности у машины будет не 4 параметра, а сотни и тысячи. Например, данные о ценах на билеты из всех аэропортов за все предыдущие даты. Причём будут важны комбинации этих показателей.

Нейросети используют во многих системах. Например, при подборе музыки в приложениях. Любите включать плейлист, который предлагает композиции специально для вас, и считаете, что это просто маркетинговый ход? Это не так. Система действительно изучила ваши интересы, музыку, которую вы слушали в приложении до этого и, возможно, музыку ваших друзей. На основе этой информации программа собрала плейлист специально для вас.

Рассказать про машинное обучение за пару минут невозможно. Работа с данными и алгоритмами требует много знаний и практики. Однако, чтобы понять базовые принципы того, как работает машинное обучение, просто нужно начать изучать этот инструмент. Надеемся, что наша статья помогла вам в этом.