Поисковик, который умеет анализировать разбросанную по интернету информацию

ForbesБизнес

Всевидящее око: как стартап Diffbot собрал в Сети триллион фактов и обошел Google

Джиллиан Д'Онфро

michael_tung_diffbot.jpg__1557854984__13473.jpg
Фото The Demo Conference

Создатель Diffbot Майк Тен в юности прочитывал все попавшиеся ему книги одну за другой. Повзрослев, он придумал поисковик, который умеет собирать и анализировать разбросанную по интернету информацию. Его технология уже обошла Google по числу собранных данных. Но в отличие от интернет-гиганта работать он предпочитает с бизнесом, а не с обычными пользователями.

Компания Сisco хотела, чтобы пользователи ее сервиса видеоконференций могли получить информацию обо всех участниках видеозвонка, например, о том, где они раньше работали и упоминались ли они ранее в новостях. Для этого она решила воспользоваться услугами стартапа Diffbot из калифорнийского города Маунтин-Вью.

Diffbot занимается структурированием информации из интернета в соответствии с индивидуальными запросами клиентов. Созданная разработчиками Diffbot поисковая система «прочесывает» миллионы страниц и выдает результаты по заданным параметрам. Для Сisco система, к примеру, подбирает статьи, в которых упоминаются участники видеоконференции. Для производителя кроссовок Diffbot делает обзоры отзывов покупателей и обсуждений на форумах. А для разработчика программного обеспечения для бизнеса подыскивает потенциальных клиентов. Обычно чтобы собрать такого рода данные в полном объеме требуется много времени. Однако создатели стартапа утверждают, что Diffbot изучает практически все доступные веб-страницы и может предоставить результаты поиска менее чем за секунду.

«Люди не могут узнать все обо всем. Поэтому нам нужно создать систему, которая будет способна это сделать», — говорит основатель Diffbot Майк Тан.

Как Diffbot играет на поле Google

Компании из всех отраслей экономики нанимают все больше специалистов по обработке данных и используют технологии искусственного интеллекта для моделирования спроса на свои продукты, анализа угроз со стороны конкурентов и поиска новых клиентов. Однако при проведении любого анализа даже искусственному интеллекту нужно опираться на конкретные данные. Здесь вступает в игру Diffbot. Основатели стартапа уверяют, что их поисковая система предоставляет более полные данные, а также делает это быстрее, чем разработки конкурентов.

Тан, которому сейчас 36 лет, говорит, что после почти десяти лет фальстартов и технических прорывов команде Diffbot удалось создать поисковый индекс, который уже проанализировал 90% открытых интернет-ресурсов. По неполным подсчетам, база данных Diffbot состоит из более чем триллиона фактов.

Это огромный объем, даже если сравнивать с базой данных Google. У интернет-гиганта есть своя технология структурирования информации, которая получила название Knowledge Graph. Именно ее можно назвать источником всех ответов, которые появляются в топе поиска, когда пользователи задают определенные вопросы. Последний раз Google обнародовала информацию о Knowledge Graph в конце 2016 года, и тогда в базе данных системы было лишь 70 млрд фактов.

Как и Knowledge Graph, поисковая система Diffbot постоянно просматривает миллиарды веб-страниц. Однако стартап использует поисковый индекс не для того, чтобы дать людям наиболее релевантные ссылки на информацию: Diffbot предоставляет компаниям данные, которые они могут затем интегрировать в свои собственные аналитические инструменты.

Diffbot привлек финансирование на сумму $12 млн и смог обзавестись несколькими именитыми клиентами, вроде Salesforce, eBay, Snapchat и Intel. В прошлом году доходы компании составили почти $5 млн. По мнению Тана, продажи вскоре могут удвоиться, поскольку все больше компаний находится в поиске крупномасштабных баз данных.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Дамы догоняют кавалеров: рынок франчайзинга близок к гендерному паритету Дамы догоняют кавалеров: рынок франчайзинга близок к гендерному паритету

Женщины фактически сравнялись с мужчинами на рынке франчайзинга

Forbes
10 невообразимых видов оружия 10 невообразимых видов оружия

В любви и на войне – особенно на войне – хороши любые средства

Популярная механика
Как попасть в топы: какие форматы видеоконтента популярны в России и мире Как попасть в топы: какие форматы видеоконтента популярны в России и мире

Как использовать знания об аудитории, чтобы набирать подписчиков?

Inc.
«Нам надо поговорить»: 11 ловушек, которых стоит избегать в диалоге «Нам надо поговорить»: 11 ловушек, которых стоит избегать в диалоге

Общаясь с другими на важные и острые темы, мы попадаем в самые разные ловушки

Psychologies
«Звери рейха». Как немецкая пропаганда использовала образы животных «Звери рейха». Как немецкая пропаганда использовала образы животных

Роль животных в повседневной жизни гитлеровской Германии

СНОБ
Какие друзья хороши для нас? Какие друзья хороши для нас?

Стоит выбирать тех людей, которые хотят сделать мир лучше, а не хуже

Psychologies
Путешественники во времени Путешественники во времени

Искусство управлять временем совершенствуется и специализируется

Psychologies
Первая Мировая война: оружие Русской армии Первая Мировая война: оружие Русской армии

Входя в союз победителей, Россия потеряла все и погрузилась в хаос

Популярная механика
Объединяющая стена Объединяющая стена

Начинается реставрация знаменитого «крепостного ожерелья» России

Огонёк
«Греф всегда неудовлетворен статусом-кво»: Лев Хасис о Сбербанке и принципах успешных инвестиций «Греф всегда неудовлетворен статусом-кво»: Лев Хасис о Сбербанке и принципах успешных инвестиций

О работе с Грефом, инвестициях в стартапы и перспективах ухода на госслужбу

Forbes
Оранжевое настроение Оранжевое настроение

Муся Тотибадзе выпускает дебютный альбом и обещает: «Закачаетесь!»

Vogue
Andaz дебютирует в Вене Andaz дебютирует в Вене

Корпорация Hyatt объявила об открытии первого отеля бренда Andaz в Австрии

Cosmopolitan
Карьера не должна быть пыткой: 7 признаков скорого выгорания на работе Карьера не должна быть пыткой: 7 признаков скорого выгорания на работе

Ознакомься с этим списком, пока еще не слишком поздно

Playboy
Одри Хепбёрн: Есть вещи поважнее, чем кино Одри Хепбёрн: Есть вещи поважнее, чем кино

4 мая – 90 лет со дня рождения Одри Хепбёрн

Лиза
Алкогений: Олег Даль Алкогений: Олег Даль

Олег Даль — талантливый неврастеник с внешностью злого эльфа

Maxim
Анна Курникова: «Жить без стимула невозможно!» Анна Курникова: «Жить без стимула невозможно!»

Русская спортсменка дала Cosmo первое интервью после рождения детей

Cosmopolitan
9 железных аргументов, почему тебе нужен дрон (или лучшие дроны для тебя) 9 железных аргументов, почему тебе нужен дрон (или лучшие дроны для тебя)

Самое время задуматься над приобретением квадрокоптера

Playboy
Почему мы разочаровываемся в партнерах Почему мы разочаровываемся в партнерах

Почему мы так часто выбираем «не тех» и испытываем острое разочарование и боль

Psychologies
Сериал «Слишком стар, чтобы умереть молодым» — набор медленных видеоэссе, которые можно смотреть в любом порядке (и нужно посмотреть точно) Сериал «Слишком стар, чтобы умереть молодым» — набор медленных видеоэссе, которые можно смотреть в любом порядке (и нужно посмотреть точно)

Esquire рассказывает про новый гипнотизирующий сериал

Esquire
Красимир Врански Красимир Врански

Красимир Врански заявил о намерении баллотироваться в губернаторы

Собака.ru
Когда пора подавать на развод: быть первым всегда трудно Когда пора подавать на развод: быть первым всегда трудно

Редко выбор уйти из семьи дается легко

Psychologies
У Харри Холе проблемы: фрагмент романа «Нож» Ю Несбе У Харри Холе проблемы: фрагмент романа «Нож» Ю Несбе

Фрагмент нового романа норвежца Ю Несбе о детективе Харри Холе

Esquire
В сквере ждут перемен. Какая связь между протестами в Екатеринбурге и конкурсом «Голос. Дети» В сквере ждут перемен. Какая связь между протестами в Екатеринбурге и конкурсом «Голос. Дети»

Новое поколение будет преподносить власти сюрпризы в самых неожиданных сферах

СНОБ
«Банки перестраивают модели работы с крупными клиентами» «Банки перестраивают модели работы с крупными клиентами»

Зампредседателя правления Сбербанка об уровне инвестиционной активности в России

РБК
Признаки стиля. Lexus ES против Volvo S90 и Audi A6 Признаки стиля. Lexus ES против Volvo S90 и Audi A6

Выбрать большой седан за 4–5 млн рублей не самая простая задача

РБК
Блокчейн больше не будущее. Как крупнейшие компании мира уже используют технологию Блокчейн больше не будущее. Как крупнейшие компании мира уже используют технологию

Блокчейн уже не просто слово из будущего

Forbes
Эффект Delivery club: зачем бизнесу повышать статус курьеров в обществе Эффект Delivery club: зачем бизнесу повышать статус курьеров в обществе

Как компании пытаются привить уважение к «синим воротничкам»

Forbes
«Молодой Мик Джаггер»: что носит Гарри Стайлз, которого сравнивают со всеми великими модниками рок-сцены сразу «Молодой Мик Джаггер»: что носит Гарри Стайлз, которого сравнивают со всеми великими модниками рок-сцены сразу

Как Гарри Стайлз стал одним из самых модных парней в медиапространстве

Esquire
Как использовать ноутбук в качестве монитора? Как использовать ноутбук в качестве монитора?

Если вам нужен второй монитор для ПК, в качестве него можно использовать ноутбук

CHIP
11 самых ожидаемых сериалов июня: зомби, вампиры и дед Супермена 11 самых ожидаемых сериалов июня: зомби, вампиры и дед Супермена

От деда Супермена и зомби-хоррора до феминистской антиутопии

Playboy
Открыть в приложении