Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Лиризм, гротеск, музыкальный вкус: 7 причин, почему Паоло Соррентино — один из лучших режиссеров современности Лиризм, гротеск, музыкальный вкус: 7 причин, почему Паоло Соррентино — один из лучших режиссеров современности

Почему Паоло Соррентино — один из лучших авторов авторов европейского арт-кино

Правила жизни
Ткани со сверхвозможностями: материалы настоящего и будущего Ткани со сверхвозможностями: материалы настоящего и будущего

Культ тканей из природных волокон сменился восторгом от синтетических тканей

Популярная механика
Полная гармония Полная гармония

Знать гормональный профиль так же важно, как и следить за весом и давлением

Лиза
Сила воли: что мешает нам добиваться цели Сила воли: что мешает нам добиваться цели

Проблема отсутствия силы воли – в образе жизни, который ее ослабляет

Psychologies
Подпоручик, маршал, палач, жертва Подпоручик, маршал, палач, жертва

Как самонадеянность привела Тухачевского к гибели

Дилетант
Как выбрать хорошую мультиварку: подробная инструкция Как выбрать хорошую мультиварку: подробная инструкция

Кто не работает, тот не ест, но кто приготовит поесть, пока ты на работе?

CHIP
Беременные и кормящие самки мышей отпугнули самцов мочой с банановым запахом Беременные и кормящие самки мышей отпугнули самцов мочой с банановым запахом

Как самки домовых мышей защищают свое потомство?

N+1
Таблетки от кометы и радий от импотенции: 6 абсурдных «лекарств», в которые все верили Таблетки от кометы и радий от импотенции: 6 абсурдных «лекарств», в которые все верили

В истории человечества было немало сомнительных и опасных способов лечения

Вокруг света
Эту девочку леди Ди звала своей доченькой: кто она и что с ней сейчас Эту девочку леди Ди звала своей доченькой: кто она и что с ней сейчас

Мало кто знает, что у принцессы Дианы была в Индии названая дочь

Cosmopolitan
Что читать в выходные: 10 легких романов Что читать в выходные: 10 легких романов

Захватывающие книги о любви, путешествиях и попытках начать жизнь с нуля

СНОБ
Ресурс или мускул: как работает сила воли Ресурс или мускул: как работает сила воли

Мы сами ослабляем свою волю, потому что верим в ограниченность этого «ресурса»?

Psychologies
Семейная сага, стокгольмский синдром и драма взросления. 8 бестселлеров, завоевавших любовь критиков Семейная сага, стокгольмский синдром и драма взросления. 8 бестселлеров, завоевавших любовь критиков

Если еще не знакомы с этими романами — самое время это исправить

СНОБ
Что делать, если ты была нежеланным ребенком в семье: объяснил психолог Что делать, если ты была нежеланным ребенком в семье: объяснил психолог

Нежеланные дети всю жизнь пытаются доказать родителям, что достойны любви

Cosmopolitan
Убираем жир, но не теряем мышцы Убираем жир, но не теряем мышцы

Рассказываем, как худеть так, чтобы не довести себя до истощения

Лиза
10 леденящих душу случайных фактов 10 леденящих душу случайных фактов

Тайная сторона совершенно невинных на первый взгляд вещей!

Maxim
Самый точный метод или ненужная привычка? Самый точный метод или ненужная привычка?

Какие простые правила помогут комфортно сбросить вес без жестких ограничений

Лиза
«Как общаться с другом, если он признался мне в симпатии?» «Как общаться с другом, если он признался мне в симпатии?»

Как укрепить отношения с друзьями?

Psychologies
«Доктор, спасите»: как психотерапия помогла мне похудеть «Доктор, спасите»: как психотерапия помогла мне похудеть

Фитнес-тренер — о своём опыте лечения расстройства пищевого поведения

VOICE
«Нелегал»: фильм о хождении по мукам мигранта в современной России «Нелегал»: фильм о хождении по мукам мигранта в современной России

В прокат выходит «Нелегал», фильм о путешествии мигранта из Бишкека в Якутию

Forbes
Как попросить о прибавке на фоне растущей инфляции Как попросить о прибавке на фоне растущей инфляции

Как добиться повышения зарплаты и что делать, если вам отказали?

Forbes
Ирина Шейк 25 лет спустя: как выглядит мама русской модели, покорившей мир Ирина Шейк 25 лет спустя: как выглядит мама русской модели, покорившей мир

Ольга Шайхлисламова со знаменитой дочерью Ириной Шейк невероятно похожи

VOICE
Опра Уинфри: трагическая и невероятная история главной женщины Америки Опра Уинфри: трагическая и невероятная история главной женщины Америки

Если вы заглянете в прошлое Опры, у вас перехватит дыхание

VOICE
На это может попасться каждый. Самые обидные случаи лишения прав На это может попасться каждый. Самые обидные случаи лишения прав

Неочевидные случаи, когда водитель надолго может превратиться в пешехода

РБК
7 книг, вдохновляющих на путешествия и познание мира 7 книг, вдохновляющих на путешествия и познание мира

Восполняем тоску по путешествиям с помощью книг

Правила жизни
Сдавайся или беги: Как быть, если мужчина слишком навязчив Сдавайся или беги: Как быть, если мужчина слишком навязчив

Забота или тирания — как отличить?

Лиза
«Видел все, кроме смертной казни»: путешествие Антона Чехова на «край географии» «Видел все, кроме смертной казни»: путешествие Антона Чехова на «край географии»

21 апреля 1890 Антон Чехов отправился на Сахалин и далее вокруг Азии

Вокруг света
Последнее плавание «Лузитании»: история загадочной морской трагедии Последнее плавание «Лузитании»: история загадочной морской трагедии

7 мая 1915 года затонул один из самых знаменитых пароходов своего времени

Вокруг света
«Не понимаю, нужны ли мне друзья» «Не понимаю, нужны ли мне друзья»

Как понять, какие дружеские отношения нам нужны? История читательницы

Psychologies
Внутреннее неспокойствие: 10 вооруженных конфликтов на территории США Внутреннее неспокойствие: 10 вооруженных конфликтов на территории США

Некоторые военные и гражданские конфликты, происходившие на территории США

Вокруг света
Открыть в приложении