Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Новые имена в медицине Петербурга 2022 Новые имена в медицине Петербурга 2022

К этим петербургским врачам приезжают из разных городов и стран мира

Собака.ru
Что такое «Ядро Демона» и почему оно так называется? Что такое «Ядро Демона» и почему оно так называется?

Как маленький металлический шар может быть опасным?

Популярная механика
Внутри вас — множество субличностей. Кто они и чего хотят? Внутри вас — множество субличностей. Кто они и чего хотят?

Отрывок из книги Ричарда Шварца «Мои разные "я"» — о разных частях личности

Популярная механика
Сменить колею: что не так с транспортной политикой в России Сменить колею: что не так с транспортной политикой в России

Почему транспортная политика в России не работает

Forbes
Роскошные формы: 6 деталей картины Рубенса «Венера перед зеркалом» Роскошные формы: 6 деталей картины Рубенса «Венера перед зеркалом»

Если в России говорят «кустодиевская женщина», в Европе скажут «рубенсовская»

Вокруг света
Самые странные авиакомпании мира Самые странные авиакомпании мира

Странные авиакомпании: их самолеты не взлетали, а стюардессы носили бикини

Maxim
10 малоизвестных «Запорожцев»: родственники 10 малоизвестных «Запорожцев»: родственники

У ЗАЗ был целый ряд интересных и неизвестных непрофессионалам машин

ТехИнсайдер
Пикси, шег, гаврош и еще 7 стрижек, которые не нужно укладывать Пикси, шег, гаврош и еще 7 стрижек, которые не нужно укладывать

Выбирая новую прическу, определитесь, готовы ли вы тратить время на укладку

РБК
«Мы не уважаем богатых, но все хотим богатства»: главное из интервью Рубена Варданяна «Мы не уважаем богатых, но все хотим богатства»: главное из интервью Рубена Варданяна

Рубен Варданян — имеет ли еще бизнес влияние на принятие решений в стране

Forbes
Химики получили графин с помощью обратимой реакции метатезиса Химики получили графин с помощью обратимой реакции метатезиса

Химики получили кристаллический графин по реакции метатезиса алкинов

N+1
Сыпь, пятна, зуд: лишай у человека и способы его лечения Сыпь, пятна, зуд: лишай у человека и способы его лечения

Какие виды лишая бывают, чем они отличаются, как передаются и лечатся

VOICE
Смотрим «Доисторическую планету». Среда: это жаба Вельзевула, чуваки!. Смотрим «Доисторическую планету». Среда: это жаба Вельзевула, чуваки!.

Серия начинается с велоцирапторов (Velociraptor), которых мы видели еще вчера

N+1
Как сейчас живет Бекхэм: ремонтирует дом за 37 млн и за день зарабатывает месячную зарплату футболиста Как сейчас живет Бекхэм: ремонтирует дом за 37 млн и за день зарабатывает месячную зарплату футболиста

Вначале мая Дэвиду Бекхэму исполнилось 47 лет. Но он в абсолютном порядке

Maxim
Почему царя Бориса Годунова похоронили сидящим: а ты знала? Почему царя Бориса Годунова похоронили сидящим: а ты знала?

Даже после смерти Борису Годунову не удалось обрести покой

VOICE
Актеры-фронтовики СССР: через что прошли любимцы публики, прежде чем стали кумирами народа Актеры-фронтовики СССР: через что прошли любимцы публики, прежде чем стали кумирами народа

Они сражались не ради славы и оваций, а за то, что любили — за Родину!

ТехИнсайдер
Прощай, Зазу! Ученые предсказали вымирание желтоклювой птицы-носорога Прощай, Зазу! Ученые предсказали вымирание желтоклювой птицы-носорога

Пернатый обитатель пустыни Калахари может исчезнуть к 2027 году

Вокруг света
«О пользе зонтиков». Как математика делает жизнь проще «О пользе зонтиков». Как математика делает жизнь проще

Зачем нужна математика в повседневной жизни — отрывок из книги Микаэля Лонэ

СНОБ
Кто создает в России магазины приложений на замену App Store и Google Play Кто создает в России магазины приложений на замену App Store и Google Play

Кто создает NashStore и RuStore и с какими проблемами они уже столкнулись?

Forbes
«Ячейки» без кухни: какие дома в СССР собирались строить вместо хрущевок «Ячейки» без кухни: какие дома в СССР собирались строить вместо хрущевок

Проект этого дома рассматривался в СССР как основной для строительства жилья

VOICE
10 интересных фактов об Анне Павловой 10 интересных фактов об Анне Павловой

Мы собрали 10 фактов из жизни одной из самых известных балерин XX века

Культура.РФ
Как учить ребенка с особенностями развития Как учить ребенка с особенностями развития

Как жить, когда в семье есть ребенок с особенностями

СНОБ
Как сэкономить на бензине и заправляться реже: простые, но неочевидные хитрости Как сэкономить на бензине и заправляться реже: простые, но неочевидные хитрости

Простые и проверенные способы, которые помогут "растянуть" бак бензина

VOICE
Найденный в Приазовье 61 год назад зуб назвали неандертальским Найденный в Приазовье 61 год назад зуб назвали неандертальским

Палеоантропологи изучили моляр, найденный во время раскопок памятника Рожок-1

N+1
Как правильно парковаться: 5 простых лайфхаков для водителей. Вы всегда делали это не так! Как правильно парковаться: 5 простых лайфхаков для водителей. Вы всегда делали это не так!

Парковка — как перестать бояться этого страшного слова

ТехИнсайдер
Ткани со сверхвозможностями: материалы настоящего и будущего Ткани со сверхвозможностями: материалы настоящего и будущего

Культ тканей из природных волокон сменился восторгом от синтетических тканей

Популярная механика
Бросила его по почте: кем был первый муж Меган Маркл и что с ним стало теперь Бросила его по почте: кем был первый муж Меган Маркл и что с ним стало теперь

Меган Маркл сказала да и обещала быть с ним. Нет, речь не о принце Гарри

VOICE
DomUm Decoration — платформа, объединяющая художников с покупателями DomUm Decoration — платформа, объединяющая художников с покупателями

DomUm Decoration поможет вам угадать, что купят для интерьера

VC.RU
Быстрее, выше, сильнее, престижнее Быстрее, выше, сильнее, престижнее

Как спорт из развлечения аристократов превратился в социальный лифт

Forbes Life
Моя крепость Моя крепость

Интересный и масштабный проект — усадьба в стиле современного шале

SALON-Interior
Открыть в приложении