Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
10 самых перспективных альтернативных источников энергии для экологичного будущего 10 самых перспективных альтернативных источников энергии для экологичного будущего

Перспективы использования альтернативных источников энергии

ТехИнсайдер
Изменил жене, оскорбил дочь, ударил сына: скандальные выходки рэпера Джигана Изменил жене, оскорбил дочь, ударил сына: скандальные выходки рэпера Джигана

Джиган известен не только своими треками, но и взрывным характером

Cosmopolitan
Найденный в Приазовье 61 год назад зуб назвали неандертальским Найденный в Приазовье 61 год назад зуб назвали неандертальским

Палеоантропологи изучили моляр, найденный во время раскопок памятника Рожок-1

N+1
9 советов, как лучше запоминать новую информацию (это полезно в любом возрасте) 9 советов, как лучше запоминать новую информацию (это полезно в любом возрасте)

Учиться никогда не поздно, но как делать это эффективно

Playboy
Наследие дома Романовых Наследие дома Романовых

Почему «Императорский маршрут» стал востребован и как он развивается?

Отдых в России
«Новый Шалом» в Москве и внутренний исход. Интервью с режиссерами Олегом Липовецким и Петром Шерешевским «Новый Шалом» в Москве и внутренний исход. Интервью с режиссерами Олегом Липовецким и Петром Шерешевским

Режиссер Олег Липовецкий и Петр Шерешевский — о театрах и спектаклях

СНОБ
Что делать, если твои персональные данные утекли в сеть Что делать, если твои персональные данные утекли в сеть

Рассказываем, как не стать жертвой злоумышленников и не выплачивать чужой кредит

Maxim
Рассыпаются на глазах: как спасают православные церкви в селах Татарстана Рассыпаются на глазах: как спасают православные церкви в селах Татарстана

Как волонтеры занимаются восстановлением православных храмов в селах Татарстана

Вокруг света
Как забыть женатого любовника и закончить отношения: 5 приемов Как забыть женатого любовника и закончить отношения: 5 приемов

Как забыть женатого мужчину и пережить боль от разрыва

Psychologies
Дочки советских актрис, которые не унаследовали красоту и талант матерей Дочки советских актрис, которые не унаследовали красоту и талант матерей

Иногда яблоко от яблони падает дальше обычного

VOICE
Сложнее, чем кажется: ученые раскрыли ранее неизвестный язык шимпанзе Сложнее, чем кажется: ученые раскрыли ранее неизвестный язык шимпанзе

Крики приматов помогут понять, как формировался человеческий язык

Вокруг света
Не стресс и не старение: врач-трихолог рассказал, почему седеют волосы Не стресс и не старение: врач-трихолог рассказал, почему седеют волосы

Почему волосы седеют в раннем возрасте и какие основные мифы есть на этот счет

VOICE
«Весь мир против меня!»: чем опасен синдром жертвы и как от него избавиться «Весь мир против меня!»: чем опасен синдром жертвы и как от него избавиться

Что такое синдром жертвы и почему он возникает?

Psychologies
Сифилис оказался в Китае задолго до экспедиций Васко да Гамы Сифилис оказался в Китае задолго до экспедиций Васко да Гамы

Палеопатологи диагностировали сифилис у людей, умерших около 656–1174 годов

N+1
«Обвинительное клеймо»: почему не нужно осуждать себя и других за лень «Обвинительное клеймо»: почему не нужно осуждать себя и других за лень

Навязанное обществом чувство вины не просто деструктивно, но и безосновательно

Psychologies
Какие эксперименты Зигмунд Фрейд ставил над своей младшей дочерью Какие эксперименты Зигмунд Фрейд ставил над своей младшей дочерью

Были ли счастливы дети основателя психоанализа Зигмунда Фрейда?

VOICE
Маску на себя: почему не стоит забывать о собственных чувствах Маску на себя: почему не стоит забывать о собственных чувствах

Почему обращаться к помощи — не стыдно, а правильно

РБК
6 советов предпринимателей самим себе 6 советов предпринимателей самим себе

Какой совет предприниматели дали бы самим себе в начале своего пути

Inc.
Небезопасный шопинг Небезопасный шопинг

3 проблемы, с которыми ты можешь столкнуться при онлайн-покупках

Лиза
«Ум тронулся, господа! Аномалии мозга глазами нейробиолога»: Ментальные недуги и природа человека «Ум тронулся, господа! Аномалии мозга глазами нейробиолога»: Ментальные недуги и природа человека

Отрывок из книги «Ум тронулся, господа!» — об аномалиях в работе мозга

N+1
Демографический рост в Монголии бронзового века связали с молочным животноводством Демографический рост в Монголии бронзового века связали с молочным животноводством

Ученые исследовали зубной камень людей, живших в Алтае в 2900–240 годах до н.э.

N+1
Мы думали, их не существует: 5 вымышленных животных, которые оказались настоящими Мы думали, их не существует: 5 вымышленных животных, которые оказались настоящими

Xасто животные, ведущие скрытный образ жизни, считаются вымышленными

ТехИнсайдер
«Мы пытались спасти свой брак, но поняли, что это невозможно...» «Мы пытались спасти свой брак, но поняли, что это невозможно...»

Петр Кислов о Полине Гагариной

Коллекция. Караван историй
Налепили Налепили

Легенды и традиции разных стран, связанные с пельменями

Лиза
Цветок дьявола: как живет король богомолов Цветок дьявола: как живет король богомолов

Удивительное насекомое, которое притворяется растением, чтобы поймать добычу

Вокруг света
«Модерация в метавселенной — самая отвратительная работа в мире. Она вызывает стресс и подрывает психическое здоровье» «Модерация в метавселенной — самая отвратительная работа в мире. Она вызывает стресс и подрывает психическое здоровье»

Почему определить нарушителя в настоящем клубе проще, чем в виртуальном

VC.RU
47 лет вместе и вдруг развод? История любви Алишера Усманова и Ирины Винер 47 лет вместе и вдруг развод? История любви Алишера Усманова и Ирины Винер

Вспоминаем их удивительную историю любви Алишера Усманова и Ирины Винер

VOICE
От них ждали «чудо-кнопку», с которой всё быстро учится, но так не бывает: как растёт приложение-школа китайского Laoshi От них ждали «чудо-кнопку», с которой всё быстро учится, но так не бывает: как растёт приложение-школа китайского Laoshi

Предприниматель Сергей Кондрашов учит россиян китайскому больше 10 лет

VC.RU
Завтрак на балконе Завтрак на балконе

Волнующая история любви Александра Бенуа и Анны Кинд

Караван историй
Открыть в приложении