iFin-2011
На главную - Поиск - Карта сайта - Письмо
iFin-2018 - XVIII Международный Форум, посвященный дистанционным финансовым услугам и технологиям



Новая система веб-поиска думает так же, как пользователь

04.05.2009

Лондонский разработчик Стивен Вольфрам создал сетевое ПО, которое теоретически может стать поисковым сервисом нового поколения. Предназначение программы Wolfram Alpha простое - она отвечает на вопросы, задаваемые пользователями, однако делает это напрямую, тогда как поисковики совершают сеть сложных запросов к своим поисковым индексам.

В основе новой разработки лежит технология "вычислительного движка знаний". Сейчас разработка находится в стадии закрытого тестирования, ее публичный показ состоится летом, а финальная версия, доступная всем желающим, появится через год.

"Цель разработки - сделать экспертные знания доступные всем в любой момент времени в любом месте", - говорит Стивен Вольфрам на презентации разработки в Гарварде.

Необычная программа, говорит разработчик, вычисляет множество ответов на лету, выхватывая ряды данных из многих открытых баз знаний, лицензированных каталогов и энциклопедий. Кроме того, программа может подключаться и к текущим сведениям, например к лентам новостей, прогнозам погоды или биржевым сводкам. "Люди могут использовать систему для поиска простых фактов, таких как высота горы Эверест, или каких-то комплексных сведений, например прогнозов по экономическому развитию того или иного рынка или страны", - говорит он.

Еще из необычных возможностей программы можно выделить способность ее решения сложных уравнений, создание научных графиков или прогнозирование статистических трендов. "Это похоже на то, как если бы вы общались с каким-либо экспертом - программа анализирует, что вы имели в виду, проводит вычисления и предоставляет вам результат", - рассказывает Стивен Вольфрам.

Разработчик говорит, что пока система имеет явный научный уклон в анализе данных, но финальная версия будет более сбалансированной и сможет работать с данными о политике, культуре, обществе и других областях. "Для первичного набора данных были выбраны триллионы выборочных данных. На первом этапе их сортировали и группировали люди", - говорит Вольфрам.

С технической точки зрения новинка использует примерно те же семантические приемы, что и наш мозг при анализе данных и сопоставлении фактов. Именно этот подход позволяет задавать программе вопросы тем же языком, что и другому человеку, а от специальных поисковых синтаксических приемов можно будет отказаться.

"Пользователь может спросить - Кто был президентом Бразилии в 1923 году? Программа ответит - Артур да Силва Бернардес, - говорит создатель программы и директор компании Wolfram Research. - Программа Alpha может решить много проблем, возникающих у компьютеров при анализе языкового запроса от человека. Перед началом создания программы мы полагали, что на практике может быть великое множество комбинаций поискового запроса, но позже выяснилось, что дело совершенно не в этом".

Еще одна изюминка программы в том, что она уже сейчас научилась неплохо отсеивать "лингвистический шлак", оставляя лишь то, что действительно необходимо для понимания запроса и выдачи релевантных данных. "Много пользователей, как показали опыты, довольно быстро переставали давать поисковикам структурированные запросы. Очень быстро они становились ленивыми и просто говорили - мне не нужны все эти лишние слова", - говорит Вольфрам. "Вместо этого, они просто давали концепции, похожие на те, что получают обычные поисковики".

Впрочем, не все в восторге от подобной формализации запросов. По мнению доктора Бориса Кэтца, языковеда из Массачусетского технологического института, именно в подобном "лингвистическом шлаке" зачастую и скрывается суть запроса.

"Представьте себе, что пользователь спрашивает: "Когда Барак Обама посещал Николя Саркози"? Здесь понимание последовательностей и структур важно, так как можно трактовать, что Барак Обама был в гостях у Николя Саркози, а можно, формализовав, посчитать Николя Саркози был у Барака Обамы и речь идет о простой встрече, - говорит он. - Я считаю, что упрощение языка - это неверный путь развития. Лучше научиться анализировать концепции и преобразовывать их в структурные запросы".

Стивен Вольфрам говорит, что он и его единомышленники работали над системой несколько лет, но в определенном смысле они пока находятся на начальном этапе разработки.

Источник: Журнал "ИКС"




  поиск:

     
На главную - Поиск - Карта сайта - Письмо

Rambler's Top100
создание сайта: Aplex