Поисковик, который умеет анализировать разбросанную по интернету информацию

ForbesБизнес

Всевидящее око: как стартап Diffbot собрал в Сети триллион фактов и обошел Google

Джиллиан Д'Онфро

michael_tung_diffbot.jpg__1557854984__13473.jpg
Фото The Demo Conference

Создатель Diffbot Майк Тен в юности прочитывал все попавшиеся ему книги одну за другой. Повзрослев, он придумал поисковик, который умеет собирать и анализировать разбросанную по интернету информацию. Его технология уже обошла Google по числу собранных данных. Но в отличие от интернет-гиганта работать он предпочитает с бизнесом, а не с обычными пользователями.

Компания Сisco хотела, чтобы пользователи ее сервиса видеоконференций могли получить информацию обо всех участниках видеозвонка, например, о том, где они раньше работали и упоминались ли они ранее в новостях. Для этого она решила воспользоваться услугами стартапа Diffbot из калифорнийского города Маунтин-Вью.

Diffbot занимается структурированием информации из интернета в соответствии с индивидуальными запросами клиентов. Созданная разработчиками Diffbot поисковая система «прочесывает» миллионы страниц и выдает результаты по заданным параметрам. Для Сisco система, к примеру, подбирает статьи, в которых упоминаются участники видеоконференции. Для производителя кроссовок Diffbot делает обзоры отзывов покупателей и обсуждений на форумах. А для разработчика программного обеспечения для бизнеса подыскивает потенциальных клиентов. Обычно чтобы собрать такого рода данные в полном объеме требуется много времени. Однако создатели стартапа утверждают, что Diffbot изучает практически все доступные веб-страницы и может предоставить результаты поиска менее чем за секунду.

«Люди не могут узнать все обо всем. Поэтому нам нужно создать систему, которая будет способна это сделать», — говорит основатель Diffbot Майк Тан.

Как Diffbot играет на поле Google

Компании из всех отраслей экономики нанимают все больше специалистов по обработке данных и используют технологии искусственного интеллекта для моделирования спроса на свои продукты, анализа угроз со стороны конкурентов и поиска новых клиентов. Однако при проведении любого анализа даже искусственному интеллекту нужно опираться на конкретные данные. Здесь вступает в игру Diffbot. Основатели стартапа уверяют, что их поисковая система предоставляет более полные данные, а также делает это быстрее, чем разработки конкурентов.

Тан, которому сейчас 36 лет, говорит, что после почти десяти лет фальстартов и технических прорывов команде Diffbot удалось создать поисковый индекс, который уже проанализировал 90% открытых интернет-ресурсов. По неполным подсчетам, база данных Diffbot состоит из более чем триллиона фактов.

Это огромный объем, даже если сравнивать с базой данных Google. У интернет-гиганта есть своя технология структурирования информации, которая получила название Knowledge Graph. Именно ее можно назвать источником всех ответов, которые появляются в топе поиска, когда пользователи задают определенные вопросы. Последний раз Google обнародовала информацию о Knowledge Graph в конце 2016 года, и тогда в базе данных системы было лишь 70 млрд фактов.

Как и Knowledge Graph, поисковая система Diffbot постоянно просматривает миллиарды веб-страниц. Однако стартап использует поисковый индекс не для того, чтобы дать людям наиболее релевантные ссылки на информацию: Diffbot предоставляет компаниям данные, которые они могут затем интегрировать в свои собственные аналитические инструменты.

Diffbot привлек финансирование на сумму $12 млн и смог обзавестись несколькими именитыми клиентами, вроде Salesforce, eBay, Snapchat и Intel. В прошлом году доходы компании составили почти $5 млн. По мнению Тана, продажи вскоре могут удвоиться, поскольку все больше компаний находится в поиске крупномасштабных баз данных.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

От Цезаря до эльфа Добби: что такое иллеизм и зачем говорить о себе в третьем лице От Цезаря до эльфа Добби: что такое иллеизм и зачем говорить о себе в третьем лице

Почему люди говорят о себе в третьем лице и как это помогает решать конфликты?

Forbes
Переполох в волшебном королевстве: как гендиректор Disney стал богаче наследницы киноимперии Переполох в волшебном королевстве: как гендиректор Disney стал богаче наследницы киноимперии

Внучатая племянница Уолта Диснея назвала зарплату Боба Айгера слишком большой

Forbes
Искусственный коллега: как российские нейросети трансформировали бизнес и заменят ли людей алгоритмы Искусственный коллега: как российские нейросети трансформировали бизнес и заменят ли людей алгоритмы

ИИ-экспансия в бизнесе: чего ждать дальше и как подобрать для себя нужный сервис

Inc.
Все смотрят сериал «Чернобыль» от HBO: 5 причин, почему и вам тоже стоит Все смотрят сериал «Чернобыль» от HBO: 5 причин, почему и вам тоже стоит

Из этого сериала вы узнаете о стране больше, чем из любого российского

Playboy
Как повысить самооценку и обрести уверенность? 11 советов психолога Как повысить самооценку и обрести уверенность? 11 советов психолога

Заниженная самооценка мешает нам строить здоровые отношения и карьеру

Psychologies
DS 3 Crossback DS 3 Crossback

Состоятельный и эффектный кроссовер DS 3 Crossback

Quattroruote
10+ отличных корейских фильмов для мощного старта 10+ отличных корейских фильмов для мощного старта

Корейские картины, которые реально взбодрят

Maxim
Чернобыль, Беслан, Шереметьево: почему пора распустить «министерство правды» Чернобыль, Беслан, Шереметьево: почему пора распустить «министерство правды»

Чем вызвана задержка с обнародованием данных о погибших на аварийном борту SSJ?

Forbes
Зять миллиардера Рыболовлева решил стать президентом Уругвая Зять миллиардера Рыболовлева решил стать президентом Уругвая

Бизнесмену и начинающему политику еще необходимо победить в праймериз

Forbes
Сериал «Слишком стар, чтобы умереть молодым» — набор медленных видеоэссе, которые можно смотреть в любом порядке (и нужно посмотреть точно) Сериал «Слишком стар, чтобы умереть молодым» — набор медленных видеоэссе, которые можно смотреть в любом порядке (и нужно посмотреть точно)

Esquire рассказывает про новый гипнотизирующий сериал

Esquire
Победы — его конек Победы — его конек

GQ встретился с героем льда, а теперь и кино Игорем Ларионовым

GQ
Костюм свободы, равенства и братства Костюм свободы, равенства и братства

Ошибка думать, что революции означают лишь радикальные перемены

Дилетант
«Я плачу во время ссор»: почему так происходит и что с этим делать «Я плачу во время ссор»: почему так происходит и что с этим делать

Можно ли научиться справляться с эмоциями и перестать все время плакать?

Psychologies
Хлои Кардашьян избила стриптизершу, которую поймала в гостинице с мужем Хлои Кардашьян избила стриптизершу, которую поймала в гостинице с мужем

Первый муж Хлои Кардашьян рассказал, как она застала его в гостинице с девицами

Cosmopolitan
Выше уровнем Выше уровнем

Лестница в доме не только функциональная необходимость

SALON-Interior
Hyundai Santa Fe: Подарки от санты Hyundai Santa Fe: Подарки от санты

Утверждать, что «санта» третьего поколения безгрешен, будет неверно

АвтоМир
Эволюция пожирает своих детей: 10 новейших лауреатов премии Дарвина Эволюция пожирает своих детей: 10 новейших лауреатов премии Дарвина

Премия Дарвина — это особый жанр, в котором сливаются трагедия и идиотизм

Maxim
Кто такая Тара Разави, без которой A$AP Rocky, Билли Айлиш и Tyler, the Creator не сняли бы ваши любимые клипы Кто такая Тара Разави, без которой A$AP Rocky, Билли Айлиш и Tyler, the Creator не сняли бы ваши любимые клипы

Откуда взялась Тара Разави и почему вы о ней, скорее всего, не знаете

Esquire
Отпуск – время быть вместе? Отпуск – время быть вместе?

Как отдохнуть так, чтобы не разочароваться?

Psychologies
Каша из топора Каша из топора

Подруга Ларисы Гузеевой рассказала, как они выживали в голодные годы

StarHit
Полный дзен: японский подход к индустрии красоты Полный дзен: японский подход к индустрии красоты

Что означают слова «икигай» и «генке» и зачем в спа-центре работает психолог

Forbes
Как JPMorgan, Johnson & Johnson и другие хотят достичь капитализации в $3,1 трлн с помощью блокчейна Как JPMorgan, Johnson & Johnson и другие хотят достичь капитализации в $3,1 трлн с помощью блокчейна

Блокчейн может помочь решить фундаментальную проблему бизнеса

Forbes
Какой модем лучше купить для ноутбука, чтобы всегда иметь интернет? Какой модем лучше купить для ноутбука, чтобы всегда иметь интернет?

Рассказываем, чем отличаются похожие модели модемов

CHIP
Безумно благодарна за все, что у меня есть Безумно благодарна за все, что у меня есть

Интервью с актрисой Елизаветой Боярской

Добрые советы
Поменять привычку? Легко! Поменять привычку? Легко!

Создавая себе одни только полезные привычки, мы могли бы изменить характер

Psychologies
В чем пойти на свадьбу: 38 беспроигрышных образов В чем пойти на свадьбу: 38 беспроигрышных образов

Чем удивить друзей и родственников на свадьбе?

Cosmopolitan
Большая свалка Большая свалка

Кто только не борется за вывоз, сортировку и утилизацию отходов россиян

Forbes
Сердечные электрики: как кардиостимуляторы помогают сердцу биться Сердечные электрики: как кардиостимуляторы помогают сердцу биться

Сердце человека — это электромеханический насос

Популярная механика
5 шагов к обретению жизненного баланса 5 шагов к обретению жизненного баланса

Действительно ли необходим баланс между работой и жизнью

Psychologies
Убийца авианосцев: трагическая история «сотки» Т-4 Убийца авианосцев: трагическая история «сотки» Т-4

СССР пытался найти дешевое «противоядие» для борьбы с королями океанов

Популярная механика
Открыть в приложении