Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Черепашка-ниндзя против Ferrari: суперкар который не смог Черепашка-ниндзя против Ferrari: суперкар который не смог

История «Гордон-Кибл» — автомобиля с лучшей в мире эмблемой

Maxim
Как вывести деньги с биржи Binance: полное руководство Как вывести деньги с биржи Binance: полное руководство

Биржа Binance – один из сервисов, где можно торговать криптовалютой

CHIP
Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Бей, беги, забудь: нейробиолог о том, как как стресс влияет на память Бей, беги, забудь: нейробиолог о том, как как стресс влияет на память

Отрывок из книги Лайзы Дженовы «Как работает память»

Forbes
Задержка месячных на 5 дней при отрицательном тесте: стоит ли волноваться Задержка месячных на 5 дней при отрицательном тесте: стоит ли волноваться

Почему может возникнуть задержка месячных?

VOICE
10 стран, в которых воздух настолько грязный, что им очень трудно дышать 10 стран, в которых воздух настолько грязный, что им очень трудно дышать

Топ-10 стран, лидирующих по выбросу углекислого газа

ТехИнсайдер
Материаловеды разобрались в механических свойствах птичьего гнезда Материаловеды разобрались в механических свойствах птичьего гнезда

Как птицы строят свои гнезда?

N+1
Демографический рост в Монголии бронзового века связали с молочным животноводством Демографический рост в Монголии бронзового века связали с молочным животноводством

Ученые исследовали зубной камень людей, живших в Алтае в 2900–240 годах до н.э.

N+1
Для охоты, общения и навигации: как рыбы научились использовать электричество Для охоты, общения и навигации: как рыбы научились использовать электричество

Некоторые рыбы освоили электричество гораздо раньше человека

Вокруг света
Самые странные авиакомпании мира Самые странные авиакомпании мира

Странные авиакомпании: их самолеты не взлетали, а стюардессы носили бикини

Maxim
«Обойдетесь без свободной жизни»: почему мужчины хотят запретить аборты «Обойдетесь без свободной жизни»: почему мужчины хотят запретить аборты

Почему мужчины хотят принимать решение о материнстве вместо женщин

VOICE
Импортозамещение: сравниваем российские сервисы, которые могут заменить Netflix и Spotify Импортозамещение: сравниваем российские сервисы, которые могут заменить Netflix и Spotify

Мы решили разобраться, сильно ли отечественные приложения уступают западным

Maxim
Просто королева! Просто королева!

Чем опасна чрезмерная уверенность в себе

Лиза
«Децентрализованное общество»: Виталик Бутерин и его товарищи нашли душу следующего интернета «Децентрализованное общество»: Виталик Бутерин и его товарищи нашли душу следующего интернета

«Децентрализованное общество: в поиске души Web3» — о чем этот манифест?

VC.RU
Люди переоценили количество негатива в прошлых романтических отношениях Люди переоценили количество негатива в прошлых романтических отношениях

Люди часто оценивают себя в прошлом хуже, чем в настоящем, даже если это не так

N+1
Один дом, две собаки, трое детей, четыре года брака: союз Тарасовых в цифрах Один дом, две собаки, трое детей, четыре года брака: союз Тарасовых в цифрах

Анастасия и Дмитрий Тарасовы уже четыре года в браке. Как развивался этот союз?

VOICE
Отходы горят «зеленым» пламенем Отходы горят «зеленым» пламенем

Установка, в которой органические отходы без вредных выбросов сжигают сами себя

Эксперт
«Не люблю принимать гостей. Как с этим бороться?» «Не люблю принимать гостей. Как с этим бороться?»

Что делать, если вы не любите принимать гостей?

Psychologies
Останки из Суздальского Ополья указали на плохое здоровье средневековых жителей поселения Останки из Суздальского Ополья указали на плохое здоровье средневековых жителей поселения

Ученые исследовали останки 26 человек с памятника Михали-3

N+1
Нужно ли пить протеин, чтобы похудеть Нужно ли пить протеин, чтобы похудеть

Может ли протеиновый порошок помочь похудеть?

Популярная механика
Симулятор воришки и уничтожение человечества: лучшие бесплатные мобильные игры Симулятор воришки и уничтожение человечества: лучшие бесплатные мобильные игры

Чем можно развлечь себя в переполненном вагоне метро за 0 рублей

Maxim
Бьюти-эксперт Елена Крыгина: о бестактных вопросах, личных границах и критериях «идеального партнера» Бьюти-эксперт Елена Крыгина: о бестактных вопросах, личных границах и критериях «идеального партнера»

Елена Крыгина — что помогает ей поддерживать внутренний баланс

Psychologies
Роман Хилари Мантел «Сердце бури» о Французской революции Роман Хилари Мантел «Сердце бури» о Французской революции

«Сердце бури» — это масштабный эпос об истории Великой французской революции

СНОБ
Среди благовоний времен династии Тан оказались ладан и алойное дерево Среди благовоний времен династии Тан оказались ладан и алойное дерево

Китайские ученые исследовали образцы, обнаруженные в храме Фамэнь

N+1
«Я — последняя буква в алфавите»: 3 психологические установки, ведущие к инфаркту «Я — последняя буква в алфавите»: 3 психологические установки, ведущие к инфаркту

Мы не осознаем, что вредные установки серьезно сказываются и на нашем здоровье

Psychologies
Дышите глубже Дышите глубже

Как понять, что легкие в порядке и какие методы для этого эффективнее

Лиза
Понты дороже денег Понты дороже денег

«Самый дорогой коньяк», или Как решались вопросы долгов в начале нулевых

СНОБ
Питание и женское здоровье: основные правила хорошего самочувствия Питание и женское здоровье: основные правила хорошего самочувствия

Как питание поможет скорректировать общее самочувствие женщинам

Psychologies
Жених не узнает: невесты до и после свадебного макияжа (новые фото) Жених не узнает: невесты до и после свадебного макияжа (новые фото)

Удивительные фото невест до и после свадебного макияжа

VOICE
Что такое стрижка пикси и кому она подойдет Что такое стрижка пикси и кому она подойдет

Какими бывают виды стрижки пикси и как их укладывать

РБК
Открыть в приложении