Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
«Мужчина избегает близости, так как считает меня предательницей» «Мужчина избегает близости, так как считает меня предательницей»

Партнер решает свои проблемы через вас — что делать?

Psychologies
Мона Visa: зачем международная платежная система купила NFT-токен за $150 000 Мона Visa: зачем международная платежная система купила NFT-токен за $150 000

Зачем Visa вышла в метавселенную?

Forbes
Что нужно знать об антидепрессантах. Часть 2 Что нужно знать об антидепрессантах. Часть 2

Какими бывают побочные эффекты от антидепрессантов

СНОБ
Переменная величина Переменная величина

Насколько важен для нас секс

Psychologies
10 красивых имен со всего света, которые приносят успех 10 красивых имен со всего света, которые приносят успех

Не самые редкие имена, о значениях которых вы, скорее всего, не подозревали

Вокруг света
Ничего лишнего Ничего лишнего

Маруся Фомина — о характере и профессии актрисы

OK!
Физики постримили игру с помощью ридберговских атомов Физики постримили игру с помощью ридберговских атомов

Американские физики использовали газ атомов в качестве приемной антенны

N+1
Сказка для взрослых, тайный книжный клуб и новая жизнь пчел: 5 воодушевляющих романов Сказка для взрослых, тайный книжный клуб и новая жизнь пчел: 5 воодушевляющих романов

Книги о том, как люди преодолевают любые невзгоды

СНОБ
К лету точно похудею: какие гаджеты помогут стать настоящим boss of the gym К лету точно похудею: какие гаджеты помогут стать настоящим boss of the gym

Зачем нужна умная бутылка для воды и как подобрать подходящие наушники

Maxim
«Умом не блещешь»: 5 фраз, которые выдадут в вашем партнере или друге газлайтера «Умом не блещешь»: 5 фраз, которые выдадут в вашем партнере или друге газлайтера

Красные флажки: как опознать и обезвредить газлайтера?

Psychologies
И умер на руках у короля Франции: 10 мифов о Леонардо Да Винчи И умер на руках у короля Франции: 10 мифов о Леонардо Да Винчи

О картинах гения рассказывают почти столько же легенд, сколько о нем самом

Вокруг света
Электробайк и велосипед в городской среде: что нужно знать начинающему велосипедисту Электробайк и велосипед в городской среде: что нужно знать начинающему велосипедисту

Стоит ли покупать велосипед или электробайк в городских условиях?

ТехИнсайдер
Неизведанная Калмыкия Неизведанная Калмыкия

Не обязательно ехать на край света, чтобы увидеть буддистские реликвии

Лиза
Всемирный фарватер Всемирный фарватер

Как люди путешествовали, когда не было авиасообщения

Вокруг света
Игорь Манн Игорь Манн

Как Игорь Манн ищет (и находит!) точки роста в кризисные времена?

Собака.ru
Сгладить ситуацию Сгладить ситуацию

Причины появления растяжек на теле и как с ними бороться

Лиза
Отрывок из книги «Моя небесная красавица» Сара Биазини, дочери актрисы Роми Шнайдер Отрывок из книги «Моя небесная красавица» Сара Биазини, дочери актрисы Роми Шнайдер

Фрагмент из ее мемуаров Роми Шнайдер, а также эссе Сергея Николаевича

СНОБ
Лечат ли нас кошки: зоопсихолог объясняет поведение питомцев Лечат ли нас кошки: зоопсихолог объясняет поведение питомцев

Как кошки показывают нам свою привязанность?

Psychologies
Топ-10 видеорегистраторов 2022 года: рейтинг лучших моделей Топ-10 видеорегистраторов 2022 года: рейтинг лучших моделей

Если вы еще не купили видеорегистратор для автомобиля, самое время это сделать

CHIP
Небожители и чудовища: как представляли чужаков в корейских мифах Небожители и чудовища: как представляли чужаков в корейских мифах

«Фантазии о чужаках» — одна из характерных черт мифологических историй

Вокруг света
«У меня депрессия и ОКР: терапия и лекарства так и не помогли» «У меня депрессия и ОКР: терапия и лекарства так и не помогли»

Если ничего не помогает и депрессивное состояние все хуже и хуже

Psychologies
Деменция: как ухаживать за пожилыми родителями и выжить самому Деменция: как ухаживать за пожилыми родителями и выжить самому

Принять ответственность за жизнь стареющих родителей… иногда у нас нет выхода

Psychologies
«Никогда не рассказывайте ему об этом»: мужчины комментируют мнение женщины об отношениях «Никогда не рассказывайте ему об этом»: мужчины комментируют мнение женщины об отношениях

Как отличается взгляд женщин и мужчин на отношения?

Psychologies
Мегапоезд с ядерным реактором: авантюрный проект советских инженеров Мегапоезд с ядерным реактором: авантюрный проект советских инженеров

Инженеры середины ХХ столетия мечтали о гигантских поездах с атомным сердцем

ТехИнсайдер
География чтения: 5 книг о Северной Африке География чтения: 5 книг о Северной Африке

Книги о загадочном континенте, который манит авантюристов и путешественников

Вокруг света
«Меня не проведешь»: почему мы не верим, что нами можно манипулировать «Меня не проведешь»: почему мы не верим, что нами можно манипулировать

Отрывок книги Тали Шарот «Иллюзии человеческого мозга»

Forbes
Не особенные люди. Директор московской «Ночлежки» Дарья Байбакова — о системной помощи бездомным, новых проектах и современной благотворительности Не особенные люди. Директор московской «Ночлежки» Дарья Байбакова — о системной помощи бездомным, новых проектах и современной благотворительности

Как сейчас устроена работа «Ночлежки»

СНОБ
Вы приняты! Вы приняты!

5 мошеннических схем при поиске работы в соцсетях: не дай себя обмануть

Лиза
Стирка прокладок и еще 5 привычек из СССР, которые снова в моде (и это бесит!) Стирка прокладок и еще 5 привычек из СССР, которые снова в моде (и это бесит!)

Не успели оглянуться, а рожденные в конце девяностых начали задавать тренды

VOICE
Открыть в приложении