Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Мы думали, их не существует: 5 вымышленных животных, которые оказались настоящими Мы думали, их не существует: 5 вымышленных животных, которые оказались настоящими

Xасто животные, ведущие скрытный образ жизни, считаются вымышленными

ТехИнсайдер
Открыто соединение, способное «включаться» под действием лазера Открыто соединение, способное «включаться» под действием лазера

Созданный фосфонат позволит точнее и безопаснее воздействовать на организм

Популярная механика
Как писать письма инвесторам, чтобы они отвечали: советы гуру венчура Как писать письма инвесторам, чтобы они отвечали: советы гуру венчура

Отрывок из книги «Повелители корпоративного венчурного капитала»

Forbes
О чем не стоит забывать? О чем не стоит забывать?

Одна маска хорошо, а две — теплее

GQ
Профессор Эйнштейн. Распространённые ошибки его биографов Профессор Эйнштейн. Распространённые ошибки его биографов

Рассказывать о жизни Эйнштейна часто берутся люди, слабо знакомые с предметом

Наука и жизнь
Эталонные блондинки, которые прославились благодаря своему интеллекту Эталонные блондинки, которые прославились благодаря своему интеллекту

Опровергаем популярное заблуждение насчет блондинок!

Maxim
Отвращение к глюкозе заставило мутантных тараканих отвергнуть брачные подарки диких самцов Отвращение к глюкозе заставило мутантных тараканих отвергнуть брачные подарки диких самцов

Как мутации тараканов влияют на их брачные ритуалы

N+1
Не впадать в зеленую тоску: как Дрю Бэрримор продвигает экоинициативы Не впадать в зеленую тоску: как Дрю Бэрримор продвигает экоинициативы

Тональность высказываний — шанс достучаться до самой широкой аудитории

Forbes
Этот год в истории: что происходило в России и в мире в 1994 году? Этот год в истории: что происходило в России и в мире в 1994 году?

Что происходило в 1994 году и каким был мир за пределами студии «Час пик»?

Правила жизни
4 способа поддержать скорбящего человека 4 способа поддержать скорбящего человека

Четыре способа поддержать близкого человека в период его скорби

Psychologies
Валя Карнавал и Саша Стоун: история любви - первая встреча, измена, предложение Валя Карнавал и Саша Стоун: история любви - первая встреча, измена, предложение

Роман Вали Карнавал и Саши Стоуна развивался с космической скоростью

VOICE
5 вопросов о сердце и стрессе 5 вопросов о сердце и стрессе

Можно ли предотвратить влияние стресса на организм? Отвечает эксперт

Здоровье
Правила жизни Кэтрин Хепберн Правила жизни Кэтрин Хепберн

Кэтрин Хепберн, американская актриса, умерла 29 июня 2003 года в возрасте 96 лет

Правила жизни
«Трудно даются праздничные речи»: как избавиться от страха выступлений «Трудно даются праздничные речи»: как избавиться от страха выступлений

Некоторые, когда приходит черед произносить речи, испытывают неловкость. Почему?

Psychologies
Материаловеды разобрались в механических свойствах птичьего гнезда Материаловеды разобрались в механических свойствах птичьего гнезда

Как птицы строят свои гнезда?

N+1
Импортозамещение: сравниваем российские сервисы, которые могут заменить Netflix и Spotify Импортозамещение: сравниваем российские сервисы, которые могут заменить Netflix и Spotify

Мы решили разобраться, сильно ли отечественные приложения уступают западным

Maxim
«Требуется сборка»: Как происходили важнейшие превращения в истории жизни. Расшифровываем четыре миллиарда лет истории жизни — от древних окаменелостей до ДНК «Требуется сборка»: Как происходили важнейшие превращения в истории жизни. Расшифровываем четыре миллиарда лет истории жизни — от древних окаменелостей до ДНК

Отрывок из книги «Требуется сборка» — о гене Arc, участвующем в создании памяти

N+1
Лебединая верность: как живут кумандинцы Лебединая верность: как живут кумандинцы

Свободолюбивые и верные, как лебеди, коренные жители Алтая

Вокруг света
Почему леса в Сибири и Калифорнии горят каждый год и будут продолжать гореть Почему леса в Сибири и Калифорнии горят каждый год и будут продолжать гореть

Почему лесные пожары происходят с печальной регулярностью?

Forbes
Элоди Харпер: «Дом волчиц». Исторический роман о судьбе женщины на фоне готовых к гибели Помпей Элоди Харпер: «Дом волчиц». Исторический роман о судьбе женщины на фоне готовых к гибели Помпей

До извержения Везувия Помпеи живут беззаботной жизнью. Отрывок из книги

СНОБ
Исследовательница жирафов: как Энн Иннис Дагг боролась за право быть зоологом Исследовательница жирафов: как Энн Иннис Дагг боролась за право быть зоологом

Энн Иннис Дагг пришлось столкнуться с дискриминацией, сексизмом и непониманием

Forbes
Химики вырезали углерод из шестичленного гетероцикла Химики вырезали углерод из шестичленного гетероцикла

Фотохимическая реакция позволила получать индолы из хинолинов

N+1
Любопытные факты о женской груди: красота с точки зрения науки Любопытные факты о женской груди: красота с точки зрения науки

А вы знали, что дополнительная молочная железа может вырасти хоть на пятке?

ТехИнсайдер
60 лет жизни в капсуле: удивительная история Марты Мейсон 60 лет жизни в капсуле: удивительная история Марты Мейсон

Стойкости Марты Мейсон можно только аппладировать

VOICE
Чужой снег Чужой снег

«Нелегал»: якутское кино о мигрантах из Киргизии

Weekend
Вся в танце Вся в танце

Ангелина Давеян — новое имя в бальных танцах, хотя ей всего 12

OK!
Стиль стервы! Как одеваются девушки с характером: 6 признаков дерзкого образа Стиль стервы! Как одеваются девушки с характером: 6 признаков дерзкого образа

Если ты хочешь добавить перчинки в свой повседневный образ, держи советы!

VOICE
Полезная сладость: как клубника помогает худеть и другие малоизвестные факты о любимом десерте россиян Полезная сладость: как клубника помогает худеть и другие малоизвестные факты о любимом десерте россиян

Чем полезна клубника для организма?

Вокруг света
Трехдневный трансплантат печени подарил реципиенту минимум год жизни Трехдневный трансплантат печени подарил реципиенту минимум год жизни

Технология «теплой» перфузии увеличила срок хранения трансплантатов

N+1
Открыть в приложении