Поисковик, который умеет анализировать разбросанную по интернету информацию

ForbesБизнес

Всевидящее око: как стартап Diffbot собрал в Сети триллион фактов и обошел Google

Джиллиан Д'Онфро

michael_tung_diffbot.jpg__1557854984__13473.jpg
Фото The Demo Conference

Создатель Diffbot Майк Тен в юности прочитывал все попавшиеся ему книги одну за другой. Повзрослев, он придумал поисковик, который умеет собирать и анализировать разбросанную по интернету информацию. Его технология уже обошла Google по числу собранных данных. Но в отличие от интернет-гиганта работать он предпочитает с бизнесом, а не с обычными пользователями.

Компания Сisco хотела, чтобы пользователи ее сервиса видеоконференций могли получить информацию обо всех участниках видеозвонка, например, о том, где они раньше работали и упоминались ли они ранее в новостях. Для этого она решила воспользоваться услугами стартапа Diffbot из калифорнийского города Маунтин-Вью.

Diffbot занимается структурированием информации из интернета в соответствии с индивидуальными запросами клиентов. Созданная разработчиками Diffbot поисковая система «прочесывает» миллионы страниц и выдает результаты по заданным параметрам. Для Сisco система, к примеру, подбирает статьи, в которых упоминаются участники видеоконференции. Для производителя кроссовок Diffbot делает обзоры отзывов покупателей и обсуждений на форумах. А для разработчика программного обеспечения для бизнеса подыскивает потенциальных клиентов. Обычно чтобы собрать такого рода данные в полном объеме требуется много времени. Однако создатели стартапа утверждают, что Diffbot изучает практически все доступные веб-страницы и может предоставить результаты поиска менее чем за секунду.

«Люди не могут узнать все обо всем. Поэтому нам нужно создать систему, которая будет способна это сделать», — говорит основатель Diffbot Майк Тан.

Как Diffbot играет на поле Google

Компании из всех отраслей экономики нанимают все больше специалистов по обработке данных и используют технологии искусственного интеллекта для моделирования спроса на свои продукты, анализа угроз со стороны конкурентов и поиска новых клиентов. Однако при проведении любого анализа даже искусственному интеллекту нужно опираться на конкретные данные. Здесь вступает в игру Diffbot. Основатели стартапа уверяют, что их поисковая система предоставляет более полные данные, а также делает это быстрее, чем разработки конкурентов.

Тан, которому сейчас 36 лет, говорит, что после почти десяти лет фальстартов и технических прорывов команде Diffbot удалось создать поисковый индекс, который уже проанализировал 90% открытых интернет-ресурсов. По неполным подсчетам, база данных Diffbot состоит из более чем триллиона фактов.

Это огромный объем, даже если сравнивать с базой данных Google. У интернет-гиганта есть своя технология структурирования информации, которая получила название Knowledge Graph. Именно ее можно назвать источником всех ответов, которые появляются в топе поиска, когда пользователи задают определенные вопросы. Последний раз Google обнародовала информацию о Knowledge Graph в конце 2016 года, и тогда в базе данных системы было лишь 70 млрд фактов.

Как и Knowledge Graph, поисковая система Diffbot постоянно просматривает миллиарды веб-страниц. Однако стартап использует поисковый индекс не для того, чтобы дать людям наиболее релевантные ссылки на информацию: Diffbot предоставляет компаниям данные, которые они могут затем интегрировать в свои собственные аналитические инструменты.

Diffbot привлек финансирование на сумму $12 млн и смог обзавестись несколькими именитыми клиентами, вроде Salesforce, eBay, Snapchat и Intel. В прошлом году доходы компании составили почти $5 млн. По мнению Тана, продажи вскоре могут удвоиться, поскольку все больше компаний находится в поиске крупномасштабных баз данных.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Парадокс усилия: почему наш мозг сопротивляется сложным и долгосрочным задачам Парадокс усилия: почему наш мозг сопротивляется сложным и долгосрочным задачам

Почему мы так часто недооцениваем предстоящую работу?

Forbes
Самая дорогая игра в истории. Как создатель Star Citizen собрал $300 млн на проект, который не может завершить Самая дорогая игра в истории. Как создатель Star Citizen собрал $300 млн на проект, который не может завершить

Компьютерная игра Star Citizen стала крупнейшим проектом в истории краудфандинга

Forbes
Дружелюбный инсайдер: как ИИ становится новым каналом утечек Дружелюбный инсайдер: как ИИ становится новым каналом утечек

ИИ против безопасности: почему компании теряют данные через ChatGPT

Forbes
Как была впервые измерена скорость света Как была впервые измерена скорость света

Как открытие новых островов помогло вычислить скорость света

Популярная механика
10 ошибок в аэропорту, которые дорого вам обойдутся 10 ошибок в аэропорту, которые дорого вам обойдутся

Рассказываем о мелочах, которые могут существенно подорвать бюджет поездки

Maxim
7 частей тела, куда любая девушка хочет, чтобы ее поцеловали (кроме губ) 7 частей тела, куда любая девушка хочет, чтобы ее поцеловали (кроме губ)

Не забывай, что у девушки очень много классных областей.

Playboy
Победы — его конек Победы — его конек

GQ встретился с героем льда, а теперь и кино Игорем Ларионовым

GQ
Слишком правильный Слишком правильный

Певец Сергей Лазарев – о мамином воспитании и собственном отцовстве

Домашний Очаг
Муза Муза

Петербургская фитнес-богиня Анастасия Миронова делится своими мыслями

Собака.ru
Почему многозадачность — главный враг успеха на работе Почему многозадачность — главный враг успеха на работе

Как оставаться продуктивным на работе, продолжая использовать высокие технологии

Forbes
Михаил Шац Михаил Шац

Михаил Шац — о том, как снова начать говорить, если тебе не дают слова

Maxim
Папа купил автомобиль Папа купил автомобиль

Стоит узнать, можешь ли ты приобрести машину с помощью государства

Лиза
Третий не лишний Третий не лишний

На российский рынок выходит третий автомобиль из семейства Kia Ceed

АвтоМир
Мне за тебя стыдно! Мне за тебя стыдно!

Что делать, если муж ведет себя так, что тебе приходится за него краснеть

Лиза
Признаки стиля. Lexus ES против Volvo S90 и Audi A6 Признаки стиля. Lexus ES против Volvo S90 и Audi A6

Выбрать большой седан за 4–5 млн рублей не самая простая задача

РБК
Великий комбинатор Великий комбинатор

Доктор психологии Филиппа Коэн победила в борьбе за руку и сердце Джуда Лоу

StarHit
Амнистия не для всех. Почему российские бизнесмены не спешат возвращать свои капиталы Амнистия не для всех. Почему российские бизнесмены не спешат возвращать свои капиталы

За вторую амнистию капиталов в Россию было репатриировано более €10 млрд

Forbes
Кто такие пролайферы и почему они запрещают женщинам делать аборты Кто такие пролайферы и почему они запрещают женщинам делать аборты

Американский штат Алабама официально принял закон, запрещающий аборты

Vogue
Линза по имени Солнце Линза по имени Солнце

Используя Солнце как огромную линзу, можно сделать четкий снимок экзопланеты

Популярная механика
На краю земли На краю земли

Архитектор Марсио Коган переделал колониальный дом в Бразилии

AD
Родион Газманов: «Она представилась: «Люси», – и смотрит враждебно...» Родион Газманов: «Она представилась: «Люси», – и смотрит враждебно...»

Наследник популярного музыканта о работе на Первом канале и творчестве

StarHit
Найти правильный баланс Найти правильный баланс

Актер Гоголь-центра Никита Кукушкин протестировал автомобиль Genesis G80

OK!
Майское варенье Майское варенье

На варенье годится почти все, что растет и цветет в мае в саду

Лиза
Железная Леди — 2. Какой след Тереза Мэй оставила в истории британской политики Железная Леди — 2. Какой след Тереза Мэй оставила в истории британской политики

Удалось ли Терезе Мэй стать «второй Маргарет Тэтчер»

Forbes
10 актеров «Игры престолов», которых заменили, но никто этого не заметил 10 актеров «Игры престолов», которых заменили, но никто этого не заметил

Если ты актер в «Игре престолов», тебя могут не только убить по сюжету!

Maxim
Спасайся кто может Спасайся кто может

План питания, который обещает стройность, здоровье и спасение планеты от гибели

Добрые советы
«Безопасность – рецессивный или спящий ген WhatsApp». Дуров раскритиковал мессенджер за проблемы с защитой данных «Безопасность – рецессивный или спящий ген WhatsApp». Дуров раскритиковал мессенджер за проблемы с защитой данных

«WhatsApp никогда не будет защищенным», утверждает Павел Дуров

Forbes
Прощай легенда: каким запомнится Ту-134 Прощай легенда: каким запомнится Ту-134

20 мая закончилась гражданская эксплуатация пассажирского лайнера Ту-134

Популярная механика
Сергей Полунин: «Мне нужен адреналин, чтобы сконцентрироваться» Сергей Полунин: «Мне нужен адреналин, чтобы сконцентрироваться»

Танцовщик рассуждает о том, почему нужно учить детей самостоятельности

Русский репортер
Минтай премиум-класса: куда уплывает народная рыба Минтай премиум-класса: куда уплывает народная рыба

2019 год может стать началом конца для экономического сегмента рыбных продуктов

Forbes
Открыть в приложении