Поисковик, который умеет анализировать разбросанную по интернету информацию

ForbesБизнес

Всевидящее око: как стартап Diffbot собрал в Сети триллион фактов и обошел Google

Джиллиан Д'Онфро

michael_tung_diffbot.jpg__1557854984__13473.jpg
Фото The Demo Conference

Создатель Diffbot Майк Тен в юности прочитывал все попавшиеся ему книги одну за другой. Повзрослев, он придумал поисковик, который умеет собирать и анализировать разбросанную по интернету информацию. Его технология уже обошла Google по числу собранных данных. Но в отличие от интернет-гиганта работать он предпочитает с бизнесом, а не с обычными пользователями.

Компания Сisco хотела, чтобы пользователи ее сервиса видеоконференций могли получить информацию обо всех участниках видеозвонка, например, о том, где они раньше работали и упоминались ли они ранее в новостях. Для этого она решила воспользоваться услугами стартапа Diffbot из калифорнийского города Маунтин-Вью.

Diffbot занимается структурированием информации из интернета в соответствии с индивидуальными запросами клиентов. Созданная разработчиками Diffbot поисковая система «прочесывает» миллионы страниц и выдает результаты по заданным параметрам. Для Сisco система, к примеру, подбирает статьи, в которых упоминаются участники видеоконференции. Для производителя кроссовок Diffbot делает обзоры отзывов покупателей и обсуждений на форумах. А для разработчика программного обеспечения для бизнеса подыскивает потенциальных клиентов. Обычно чтобы собрать такого рода данные в полном объеме требуется много времени. Однако создатели стартапа утверждают, что Diffbot изучает практически все доступные веб-страницы и может предоставить результаты поиска менее чем за секунду.

«Люди не могут узнать все обо всем. Поэтому нам нужно создать систему, которая будет способна это сделать», — говорит основатель Diffbot Майк Тан.

Как Diffbot играет на поле Google

Компании из всех отраслей экономики нанимают все больше специалистов по обработке данных и используют технологии искусственного интеллекта для моделирования спроса на свои продукты, анализа угроз со стороны конкурентов и поиска новых клиентов. Однако при проведении любого анализа даже искусственному интеллекту нужно опираться на конкретные данные. Здесь вступает в игру Diffbot. Основатели стартапа уверяют, что их поисковая система предоставляет более полные данные, а также делает это быстрее, чем разработки конкурентов.

Тан, которому сейчас 36 лет, говорит, что после почти десяти лет фальстартов и технических прорывов команде Diffbot удалось создать поисковый индекс, который уже проанализировал 90% открытых интернет-ресурсов. По неполным подсчетам, база данных Diffbot состоит из более чем триллиона фактов.

Это огромный объем, даже если сравнивать с базой данных Google. У интернет-гиганта есть своя технология структурирования информации, которая получила название Knowledge Graph. Именно ее можно назвать источником всех ответов, которые появляются в топе поиска, когда пользователи задают определенные вопросы. Последний раз Google обнародовала информацию о Knowledge Graph в конце 2016 года, и тогда в базе данных системы было лишь 70 млрд фактов.

Как и Knowledge Graph, поисковая система Diffbot постоянно просматривает миллиарды веб-страниц. Однако стартап использует поисковый индекс не для того, чтобы дать людям наиболее релевантные ссылки на информацию: Diffbot предоставляет компаниям данные, которые они могут затем интегрировать в свои собственные аналитические инструменты.

Diffbot привлек финансирование на сумму $12 млн и смог обзавестись несколькими именитыми клиентами, вроде Salesforce, eBay, Snapchat и Intel. В прошлом году доходы компании составили почти $5 млн. По мнению Тана, продажи вскоре могут удвоиться, поскольку все больше компаний находится в поиске крупномасштабных баз данных.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Кузница достойных жен: как жили воспитанницы Смольного института благородных девиц Кузница достойных жен: как жили воспитанницы Смольного института благородных девиц

Чему учились «смолянки» и как жили в стенах института

Forbes
Он потерял к вам сексуальный интерес: возможные причины Он потерял к вам сексуальный интерес: возможные причины

Если мужчина теряет к вам интерес, это не всегда означает, что чувства утихли

Psychologies
«Не от хорошей жизни»: как поливоркинг стал трендом и чем он опасен «Не от хорошей жизни»: как поливоркинг стал трендом и чем он опасен

Как поливоркерам сохранить здоровье и продуктивность

Forbes
Алла Вербер Алла Вербер

Примадонна отечественного люкса сумела покорить сердца даже модных миллениалов

Glamour
Страдания от избытка красоты: что такое синдром Стендаля Страдания от избытка красоты: что такое синдром Стендаля

Что такое синдром Стендаля и в чем он выражается

ТехИнсайдер
Зигмунд Фрейд: три картины к его дню рождения Зигмунд Фрейд: три картины к его дню рождения

6 мая 1856 года в чешском Фрайберге на свет появился будущий отец психоанализа

Psychologies
Долгая дорога к дюнам Долгая дорога к дюнам

Банкир Петр Авен организовал на исторической родине фестиваль Riga Jurmala

Tatler
Железная Леди — 2. Какой след Тереза Мэй оставила в истории британской политики Железная Леди — 2. Какой след Тереза Мэй оставила в истории британской политики

Удалось ли Терезе Мэй стать «второй Маргарет Тэтчер»

Forbes
Что будет, если ходить на работу, которую ненавидишь? 7 изменений в организме Что будет, если ходить на работу, которую ненавидишь? 7 изменений в организме

Ты даже и не подозреваешь, сколько всего может произойти из-за нелюбимой работы

Playboy
Неделя потребления: ретроспектива «Кинотавра», электролонгборд и экономичная яхта Неделя потребления: ретроспектива «Кинотавра», электролонгборд и экономичная яхта

Лето — повод променять автомобиль на яхту или даже лонгборд

Forbes
Хватит быть рабами своего опыта. Ирина Хакамада об интуиции в бизнесе Хватит быть рабами своего опыта. Ирина Хакамада об интуиции в бизнесе

Нужно качать свой мозг и деловую интуицию, как вы качаете мышцы в спортзале

Forbes
Качели для инвестора: как заработать на нестабильном рынке Качели для инвестора: как заработать на нестабильном рынке

Инструменты, которые позволяют получать доход и во время падения индексов

Forbes
Смерть на перевале Смерть на перевале

Можно ли раскрыть преступление, совершенное 4000 лет назад

Вокруг света
Безумная королева: жуткая история сумасшедшей Хуаны Кастильской Безумная королева: жуткая история сумасшедшей Хуаны Кастильской

Вспомнили историю королевы, которую прозвали Безумной

Cosmopolitan
Павел Дуров написал колонку, в которой раскритиковал конкурента Telegram — WhatsApp. Публикуем перевод Павел Дуров написал колонку, в которой раскритиковал конкурента Telegram — WhatsApp. Публикуем перевод

Основатель VKontakte и Telegram жестко раскритиковал WhatsApp и Facebook

Esquire
Как JPMorgan, Johnson & Johnson и другие хотят достичь капитализации в $3,1 трлн с помощью блокчейна Как JPMorgan, Johnson & Johnson и другие хотят достичь капитализации в $3,1 трлн с помощью блокчейна

Блокчейн может помочь решить фундаментальную проблему бизнеса

Forbes
Mitsubishi L200. На пороге барбершопа Mitsubishi L200. На пороге барбершопа

Пикап L200 постригли, побрили и превратился он в писаного красавца

АвтоМир
6 главных вопросов к финалу «Игры престолов» 6 главных вопросов к финалу «Игры престолов»

«Игра престолов» закончилась, а вопросы остались

Esquire
8 «здоровых привычек», от которых больше вреда, чем пользы 8 «здоровых привычек», от которых больше вреда, чем пользы

Хочешь как лучше, а получается наоборот

Playboy
Когда страна принадлежит потомкам. Чем важен День Победы через 74 года Когда страна принадлежит потомкам. Чем важен День Победы через 74 года

Власть постаралась сделать День Победы единственным днем, объединяющим нацию

СНОБ
35 пылающих вопросов к финалу «Игры престолов» и его создателям 35 пылающих вопросов к финалу «Игры престолов» и его создателям

Если у тебя есть вопросы помимо тех, что возникли у нас, пиши в комментариях!

Maxim
Каннский фестиваль открылся фильмом Джима Джармуша “Мертвые не умирают” — пронзительной историей о том, что и мы, и наши кумиры  разлагаемся на протяжении всей жизни — но это не повод стрелять нам в мозг. Корреспондент Esquire на фестивале Егор Москвитин Каннский фестиваль открылся фильмом Джима Джармуша “Мертвые не умирают” — пронзительной историей о том, что и мы, и наши кумиры  разлагаемся на протяжении всей жизни — но это не повод стрелять нам в мозг. Корреспондент Esquire на фестивале Егор Москвитин

«Мертвые не умирают» — фильм о том, что мы разлагаемся на протяжении всей жизни

Esquire
6 фактов о здоровых отношениях, которые полезно знать 6 фактов о здоровых отношениях, которые полезно знать

Как отличить здоровые отношения от представлений о них

Psychologies
Пастушья воля Пастушья воля

Настоящий венгерский гуляш: это не суп, а вольный пастух

Вокруг света
«Игра престолов»: финал в пересказе Cosmo. Последняя серия «Игра престолов»: финал в пересказе Cosmo. Последняя серия

Сейчас ты узнаешь, кому же все-таки достался Железный трон

Cosmopolitan
Как устроен Как устроен

Как устроены бортовые устройства регистрации?

Популярная механика
Джентльмены предпочитают блондинок. 9 мифов о Мэрилин Монро Джентльмены предпочитают блондинок. 9 мифов о Мэрилин Монро

Биография секс-символа Голливуда обросла легендами

Вокруг света
Михаил Шац Михаил Шац

Михаил Шац — о том, как снова начать говорить, если тебе не дают слова

Maxim
Алкогений: Георгий Бурков Алкогений: Георгий Бурков

Георгий Бурков мечтал сыграть Дон Кихота и Гамлета, но ему поручали роли пьяниц

Maxim
Гроздья репы Гроздья репы

О том, как жили наши предки сто пятьдесят лет назад

Maxim
Открыть в приложении