04.05.2009 Лондонский разработчик Стивен Вольфрам создал сетевое ПО, которое теоретически может стать поисковым сервисом нового поколения. Предназначение программы Wolfram Alpha простое - она отвечает на вопросы, задаваемые пользователями, однако делает это напрямую, тогда как поисковики совершают сеть сложных запросов к своим поисковым индексам.
В основе новой разработки лежит технология "вычислительного движка знаний". Сейчас разработка находится в стадии закрытого тестирования, ее публичный показ состоится летом, а финальная версия, доступная всем желающим, появится через год.
"Цель разработки - сделать экспертные знания доступные всем в любой момент времени в любом месте", - говорит Стивен Вольфрам на презентации разработки в Гарварде.
Необычная программа, говорит разработчик, вычисляет множество ответов на лету, выхватывая ряды данных из многих открытых баз знаний, лицензированных каталогов и энциклопедий. Кроме того, программа может подключаться и к текущим сведениям, например к лентам новостей, прогнозам погоды или биржевым сводкам. "Люди могут использовать систему для поиска простых фактов, таких как высота горы Эверест, или каких-то комплексных сведений, например прогнозов по экономическому развитию того или иного рынка или страны", - говорит он.
Еще из необычных возможностей программы можно выделить способность ее решения сложных уравнений, создание научных графиков или прогнозирование статистических трендов. "Это похоже на то, как если бы вы общались с каким-либо экспертом - программа анализирует, что вы имели в виду, проводит вычисления и предоставляет вам результат", - рассказывает Стивен Вольфрам.
Разработчик говорит, что пока система имеет явный научный уклон в анализе данных, но финальная версия будет более сбалансированной и сможет работать с данными о политике, культуре, обществе и других областях. "Для первичного набора данных были выбраны триллионы выборочных данных. На первом этапе их сортировали и группировали люди", - говорит Вольфрам.
С технической точки зрения новинка использует примерно те же семантические приемы, что и наш мозг при анализе данных и сопоставлении фактов. Именно этот подход позволяет задавать программе вопросы тем же языком, что и другому человеку, а от специальных поисковых синтаксических приемов можно будет отказаться.
"Пользователь может спросить - Кто был президентом Бразилии в 1923 году? Программа ответит - Артур да Силва Бернардес, - говорит создатель программы и директор компании Wolfram Research. - Программа Alpha может решить много проблем, возникающих у компьютеров при анализе языкового запроса от человека. Перед началом создания программы мы полагали, что на практике может быть великое множество комбинаций поискового запроса, но позже выяснилось, что дело совершенно не в этом".
Еще одна изюминка программы в том, что она уже сейчас научилась неплохо отсеивать "лингвистический шлак", оставляя лишь то, что действительно необходимо для понимания запроса и выдачи релевантных данных. "Много пользователей, как показали опыты, довольно быстро переставали давать поисковикам структурированные запросы. Очень быстро они становились ленивыми и просто говорили - мне не нужны все эти лишние слова", - говорит Вольфрам. "Вместо этого, они просто давали концепции, похожие на те, что получают обычные поисковики".
Впрочем, не все в восторге от подобной формализации запросов. По мнению доктора Бориса Кэтца, языковеда из Массачусетского технологического института, именно в подобном "лингвистическом шлаке" зачастую и скрывается суть запроса.
"Представьте себе, что пользователь спрашивает: "Когда Барак Обама посещал Николя Саркози"? Здесь понимание последовательностей и структур важно, так как можно трактовать, что Барак Обама был в гостях у Николя Саркози, а можно, формализовав, посчитать Николя Саркози был у Барака Обамы и речь идет о простой встрече, - говорит он. - Я считаю, что упрощение языка - это неверный путь развития. Лучше научиться анализировать концепции и преобразовывать их в структурные запросы".
Стивен Вольфрам говорит, что он и его единомышленники работали над системой несколько лет, но в определенном смысле они пока находятся на начальном этапе разработки. |