Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Кому светят звезды Michelin. Что важно знать о главном ресторанном гиде Кому светят звезды Michelin. Что важно знать о главном ресторанном гиде

Все, что нужно знать о Красном гиде Michelin

РБК
Как правильно парковаться: 5 простых лайфхаков для водителей. Вы всегда делали это не так! Как правильно парковаться: 5 простых лайфхаков для водителей. Вы всегда делали это не так!

Парковка — как перестать бояться этого страшного слова

ТехИнсайдер
Виртуальный секс Виртуальный секс

«Популярная механика» протестировала первую в мире виртуальную любовницу

Популярная механика
Как распознавать чушь: проверенные техники не дать ввести себя в заблуждение Как распознавать чушь: проверенные техники не дать ввести себя в заблуждение

Что побуждает человека вводить других людей в заблуждение

Вокруг света
Подпоручик, маршал, палач, жертва Подпоручик, маршал, палач, жертва

Как самонадеянность привела Тухачевского к гибели

Дилетант
Бешеная сушка: как потерять вес без вреда для здоровья Бешеная сушка: как потерять вес без вреда для здоровья

Что такое сушка тела и в чем ее плюсы и минусы

VOICE
4 способа поддержать скорбящего человека 4 способа поддержать скорбящего человека

Четыре способа поддержать близкого человека в период его скорби

Psychologies
Люди переоценили количество негатива в прошлых романтических отношениях Люди переоценили количество негатива в прошлых романтических отношениях

Люди часто оценивают себя в прошлом хуже, чем в настоящем, даже если это не так

N+1
Модестова ушла, умер в 40: трагическая судьба Модестова ушла, умер в 40: трагическая судьба

Как сложилась судьба звезды "Последнего героя" Сергея Сакина?

VOICE
Психологи о войне: 5 терапевтических книг Психологи о войне: 5 терапевтических книг

Пять книг, которые помогут понять психологическую природу войны

Psychologies
Проточный или накопительный: какой нагреватель выбрать для дома и дачи Проточный или накопительный: какой нагреватель выбрать для дома и дачи

Нагреватель — что нужно учесть при его выборе?

CHIP
За «Крестного отца»: 4 странные причины, по которым в СССР сажали в тюрьму За «Крестного отца»: 4 странные причины, по которым в СССР сажали в тюрьму

Законодательство в СССР временами оставляло желать лучшего

VOICE
6 главных качеств Владимира Этуша 6 главных качеств Владимира Этуша

Как Владимир Этуш получил народную славу и признание коллег

СНОБ
История яйца: как праздничное блюдо стало любимым завтраком История яйца: как праздничное блюдо стало любимым завтраком

Когда в Россию стали готовить блюда из куриных яиц?

Вокруг света
Мы думали, их не существует: 5 вымышленных животных, которые оказались настоящими Мы думали, их не существует: 5 вымышленных животных, которые оказались настоящими

Xасто животные, ведущие скрытный образ жизни, считаются вымышленными

ТехИнсайдер
«Мне мучительно стыдно, что я вернулся живым»: история солдата, для которого война растянулась на 30 лет «Мне мучительно стыдно, что я вернулся живым»: история солдата, для которого война растянулась на 30 лет

Сёити Ёкои — один из последних, кто вернулся к мирной жизни после Второй мировой

Вокруг света
Этот удивительный советский поезд на магнитной подушке четверть века провел Этот удивительный советский поезд на магнитной подушке четверть века провел

ТП-01 — первый советский маглев, поезд на магнитной подушке

ТехИнсайдер
Из космоса на вертолете: что означает новый успех компании Rocket Lab Из космоса на вертолете: что означает новый успех компании Rocket Lab

Впервые перехватили отработанную ступень ракеты-носителя с помощью вертолета

Forbes
Быстрее, выше, сильнее, престижнее Быстрее, выше, сильнее, престижнее

Как спорт из развлечения аристократов превратился в социальный лифт

Forbes Life
Что делать, если у вас с девушкой или даже женой противоположные взгляды на политику? Что делать, если у вас с девушкой или даже женой противоположные взгляды на политику?

Как уживаться вместе, если ваши политические взгляды не совпадают?

Maxim

Четвертый сезон "Очень странных дел": братья Даффер не разочаровали.

Правила жизни
Страх в ожидании медового месяца: что такое абьюз и как его распознать Страх в ожидании медового месяца: что такое абьюз и как его распознать

Что такое абьюз, как защититься от него и распознать абьюзера в других и себе

Forbes
5 самых глубоких озер мира: невиданные красоты природы 5 самых глубоких озер мира: невиданные красоты природы

Глубочайшие озера, которые будоражат воображение

ТехИнсайдер
10 мощных российских тракторов: отечественная техника, за которую не стыдно 10 мощных российских тракторов: отечественная техника, за которую не стыдно

В России делаются свои трактора, причём на мировом уровне

ТехИнсайдер
Пылевые вихри и восходящие ветра оказались ответственны за пылевую дымку на Марсе Пылевые вихри и восходящие ветра оказались ответственны за пылевую дымку на Марсе

Ветра поднимают пыль на Марсе

N+1
Мышам продлили жизнь с помощью назальной генной терапии Мышам продлили жизнь с помощью назальной генной терапии

Жизнь мыши можно увеличить на треть или даже больше

N+1
Ставим на паузу: как перерыв в ссоре помогает сохранить любовь Ставим на паузу: как перерыв в ссоре помогает сохранить любовь

момент возникновения конфликта многие склонны усугублять его, а не решать

Psychologies
Трон под долларом зашатался Трон под долларом зашатался

Руководство США собственноручно разрушает гегемонию доллара

Эксперт
«Мужчина избегает близости, так как считает меня предательницей» «Мужчина избегает близости, так как считает меня предательницей»

Партнер решает свои проблемы через вас — что делать?

Psychologies
«Боюсь за свою жизнь: кажется, меня могли изнасиловать или убить» «Боюсь за свою жизнь: кажется, меня могли изнасиловать или убить»

Что делать, если вас преследуют параноидальные мысли?

Psychologies
Открыть в приложении