Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Личинки одиночных ос съели собственных братьев и сестер Личинки одиночных ос съели собственных братьев и сестер

Как личинки одиночных ос решили проблему нехватки пищи в гнезде

N+1
Мужской кризис: про ипотеку, улыбку и развод Мужской кризис: про ипотеку, улыбку и развод

Как вернуть веру в себя во время кризиса?

Psychologies
Легенды кухонь народов мира: 5 классических греческих блюд Легенды кухонь народов мира: 5 классических греческих блюд

Пусть Греция материализуется на вашей кухне!

Вокруг света
Сила воли: что мешает нам добиваться цели Сила воли: что мешает нам добиваться цели

Проблема отсутствия силы воли – в образе жизни, который ее ослабляет

Psychologies
Как не просыпаться по утрам разбитым Как не просыпаться по утрам разбитым

Как перестать откладывать будильник и начать жить

Maxim
Генная терапия поставила на ноги мышей с миодистрофией Генная терапия поставила на ноги мышей с миодистрофией

Можно ли восстановить работу мышц у мышей на поздних стадиях миодистрофии

N+1
Это надо увидеть: 10 великих фильмов о любви, которые растопят ваше сердце Это надо увидеть: 10 великих фильмов о любви, которые растопят ваше сердце

Трогательные, иногда трагические, порой смешны фильмы о любви

VOICE
Как СССР отменял Запад после войны Как СССР отменял Запад после войны

Борьба с низкопоклонством перед Западом в советской культуре

Weekend
Судьба палача: как сложилась жизнь Тоньки-пулеметчицы после Второй Мировой, и кто ее сдал Судьба палача: как сложилась жизнь Тоньки-пулеметчицы после Второй Мировой, и кто ее сдал

Антонина Макарова получила славу женщины-палача

ТехИнсайдер
5 лучших пород кошек: если вы не знаете, кого выбрать 5 лучших пород кошек: если вы не знаете, кого выбрать

Все кошки хороши, но какая порода подойдет тебе?

ТехИнсайдер
Физики увидели гигантскость ионизированных ридберговских молекул Физики увидели гигантскость ионизированных ридберговских молекул

Размер ионизированных ридберговских молекул составил примерно четыре микрометра

N+1
Как продлить жизнь покрышкам: 5 простых советов, которые реально работают Как продлить жизнь покрышкам: 5 простых советов, которые реально работают

Как действовать, чтобы покрышки прослужили дольше

Вокруг света
Что упало — не пропало: правда ли быстро поднятое не считается упавшим? Отвечает наука Что упало — не пропало: правда ли быстро поднятое не считается упавшим? Отвечает наука

“Правило пяти секунд” работает не всегда и не с любой едой

ТехИнсайдер
Высота сиденья, регулировка спинки и колёсики: как выбрать офисный стул домой Высота сиденья, регулировка спинки и колёсики: как выбрать офисный стул домой

Выбираем эргономичный офисный стул

VC.RU
Государева дорога Государева дорога

«Государева дорога» — маршрут, связанный с историей царской России

Отдых в России
«Я вовсе не хотела быть премьер-министром»: как боролась за Израиль Голда Меир «Я вовсе не хотела быть премьер-министром»: как боролась за Израиль Голда Меир

Как мечта привела госпожу Меир к вершине власти в новом Государстве Израиль

Вокруг света
10 незабываемых фильмов, которые нужно посмотреть вместе с любимым 10 незабываемых фильмов, которые нужно посмотреть вместе с любимым

Какие фильмы можно посмотреть вместе с парнем? Мы подскажем

VOICE

Что успел сделать за стремительную жизнь режиссер Евгений Вахтангов

Правила жизни
Какие находки XXI век оставит археологам будущего: новая геологическая эпоха Какие находки XXI век оставит археологам будущего: новая геологическая эпоха

Колоссальные залежи останков — ярчайший маркер целой геологической эпохи

ТехИнсайдер
Что такое классы автомобилей: в чем их разница Что такое классы автомобилей: в чем их разница

Разбираемся, что такое классы авто, какие они бывают и нужно ли знать их все

РБК
DomUm Decoration — платформа, объединяющая художников с покупателями DomUm Decoration — платформа, объединяющая художников с покупателями

DomUm Decoration поможет вам угадать, что купят для интерьера

VC.RU
Сложнее, чем кажется: ученые раскрыли ранее неизвестный язык шимпанзе Сложнее, чем кажется: ученые раскрыли ранее неизвестный язык шимпанзе

Крики приматов помогут понять, как формировался человеческий язык

Вокруг света
Как сохранить здоровый мозг и избежать деменции в пожилом возрасте Как сохранить здоровый мозг и избежать деменции в пожилом возрасте

Рекомендации по укреплению когнитивных функций

Psychologies
Здесь были денисовцы: зуб древней девочки пролил свет на перемещения предков людей Здесь были денисовцы: зуб древней девочки пролил свет на перемещения предков людей

Антропологи сделали неожиданную находку в Юго-Восточной Азии

Вокруг света
Как работают роботы, устраняющие последствия аварии в Чернобыле Как работают роботы, устраняющие последствия аварии в Чернобыле

Использование роботов при ликвидации последствий катастрофы на Чернобыльской АЭС

ТехИнсайдер
Куда пропали воробьи? Куда пропали воробьи?

Что и кто угрожает воробьям?

Наука и жизнь
Все умрут, а я останусь: найдены следы планктона, выжившего в глобальном вымирании Все умрут, а я останусь: найдены следы планктона, выжившего в глобальном вымирании

Планктон оказался более устойчивым к потеплению и закислению океана

Вокруг света
Кто создает в России магазины приложений на замену App Store и Google Play Кто создает в России магазины приложений на замену App Store и Google Play

Кто создает NashStore и RuStore и с какими проблемами они уже столкнулись?

Forbes
Манкала: африканская игра, которая покорила мир Манкала: африканская игра, которая покорила мир

Есть игра, которая вся, от начала до конца, является прикладной математикой

ТехИнсайдер
Открыть в приложении