Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как «богатый клоун» Моргенштерн окончательно порвал шоу-биз шутовской свадьбой Как «богатый клоун» Моргенштерн окончательно порвал шоу-биз шутовской свадьбой

За эпатажем и скандальностью Моргенштерна скрывается что-то большее

Cosmopolitan
Почему мы так плохо помним наше детство? Почему мы так плохо помним наше детство?

Почему у большинства людей нет никаких воспоминаний о первых 3-4 годах жизни

Популярная механика
Собраться с силами: 10 лучших мотивационных книг для саморазвития Собраться с силами: 10 лучших мотивационных книг для саморазвития

Лучшие мотивирующие книги, которые стоит прочитать всем

Forbes
Последнее плавание «Лузитании»: история загадочной морской трагедии Последнее плавание «Лузитании»: история загадочной морской трагедии

7 мая 1915 года затонул один из самых знаменитых пароходов своего времени

Вокруг света
5 книг для тех, кто хочет начать разбираться в финансах 5 книг для тех, кто хочет начать разбираться в финансах

Книги, которые помогут начать инвестировать с умом и больше зарабатывать

Maxim
Режим многозадачности: как выполнять несколько задач одновременно и не сойти с ума Режим многозадачности: как выполнять несколько задач одновременно и не сойти с ума

Может ли человек быть многозадачным?

Популярная механика
Управлять можно каждым: как правильно манипулировать знаками зодиака Управлять можно каждым: как правильно манипулировать знаками зодиака

Наш Магический шар решил раскрыть самый главный секрет каждого знака зодиака

VOICE
Эффективное утяжеление тренировки с гантелями для женщин в домашних условиях Эффективное утяжеление тренировки с гантелями для женщин в домашних условиях

Топ-10 упражнений для идеальной фигуры

Лиза
Дикие пионы Дикие пионы

Дикорастущие пионы в саду

Наука и жизнь
Конаковская ГРЭС: титан советской энергетики Конаковская ГРЭС: титан советской энергетики

Конаковская ГРЭС издали выглядит как большой трехмачтовый корабль

Популярная механика
Завтрак на балконе Завтрак на балконе

Волнующая история любви Александра Бенуа и Анны Кинд

Караван историй
Ожоги: какие бывают, как лечить и что точно нельзя с ними делать Ожоги: какие бывают, как лечить и что точно нельзя с ними делать

Основные правила первой помощи при ожогах

Популярная механика
5 вещей, которые нужно знать о летней подработке подростков 5 вещей, которые нужно знать о летней подработке подростков

Кем могут подработать летом и потом в течение учебного года подростки?

Psychologies
Сюрреалистичный роман Роке Ларраки «Комемадре» о смертельных экспериментах Сюрреалистичный роман Роке Ларраки «Комемадре» о смертельных экспериментах

Отрывок из романа «Комемадре» — о невозможных научных экспериментах

СНОБ
Подсмотрено в отелях. 10 приемов, которые преобразят пространство Подсмотрено в отелях. 10 приемов, которые преобразят пространство

С помощью некоторых трюков атмосферу номера в отеле можно создать и дома

Лиза
Друг империи и враг декабристов: главный жандарм России Александр Бенкендорф Друг империи и враг декабристов: главный жандарм России Александр Бенкендорф

Граф Бенкендорф широко известен как «гонитель и душитель».

Вокруг света
«Парень тиранит и говорит, что его самые близкие люди — это подруги. Как мне поступить?» «Парень тиранит и говорит, что его самые близкие люди — это подруги. Как мне поступить?»

Что со мной не так? Или с ним?

Psychologies
50 – это новые 30? 50 – это новые 30?

За последние десятилетия возрастные рамки «раздвинулись» – старение отодвинулось

Лиза
Уилл Смит Уилл Смит

Уилл Смит вышел на сцену и дал пощечину ведущему

ЖАРА Magazine
5 самых крутых «Москвичей», которые хочет иметь каждый автомобилист 5 самых крутых «Москвичей», которые хочет иметь каждый автомобилист

Dспомним прошлое легендарного отечественного бренда «Москвич»

ТехИнсайдер
Отвращение к глюкозе заставило мутантных тараканих отвергнуть брачные подарки диких самцов Отвращение к глюкозе заставило мутантных тараканих отвергнуть брачные подарки диких самцов

Как мутации тараканов влияют на их брачные ритуалы

N+1
Верим в слово «спасибо» Верим в слово «спасибо»

Как научиться быть благодарным себе, окружающим и миру?

Psychologies
Что читать в выходные: 10 легких романов Что читать в выходные: 10 легких романов

Захватывающие книги о любви, путешествиях и попытках начать жизнь с нуля

СНОБ
Еще 10 мест на Земле, которые выглядят словно пейзажи других планет Еще 10 мест на Земле, которые выглядят словно пейзажи других планет

В существование некоторых мест на нашей родной планете сложно поверить

ТехИнсайдер
«Мужчина не хочет жениться, я от него съехала, а он не зовет обратно» «Мужчина не хочет жениться, я от него съехала, а он не зовет обратно»

Хотите ли быть в отношениях, где вы все время какая-то «недостаточно хорошая»?

Psychologies
Как купить подержанный смартфон — отвечают эксперты Как купить подержанный смартфон — отвечают эксперты

На что нужно обратить внимание в первую очередь, если приобретаешь телефон с рук

Maxim
«Я помогу ему написать одну книгу»: как жена писателя пожертвовала своей карьерой «Я помогу ему написать одну книгу»: как жена писателя пожертвовала своей карьерой

Что делать, если всю жизнь тебя воспринимают как тень твоего гениального мужа?

Forbes
Доброжелательный сексизм: убеждения, которые мешают женщине испытать оргазм Доброжелательный сексизм: убеждения, которые мешают женщине испытать оргазм

Иногда получить удовольствие женщине мешают ее убеждения

Psychologies
Вирус бедности: 10 признаков, что ты его подцепила Вирус бедности: 10 признаков, что ты его подцепила

Задумываешься о том, отчего же тебе не удается разбогатеть?

VOICE
Как контролировать свои эмоции Как контролировать свои эмоции

6 действенных способов контролировать чувства

Maxim
Открыть в приложении