Мы переехали!
Ищите наши новые материалы на SvobodaNews.ru.
Здесь хранятся только наши архивы (материалы, опубликованные до 16 января 2006 года)

 

 Новости  Темы дня  Программы  Архив  Частоты  Расписание  Сотрудники  Поиск  Часто задаваемые вопросы  E-mail
23.11.2024
 Эфир
Эфир Радио Свобода

 Новости
 Программы
 Поиск
  подробный запрос

 Радио Свобода
Поставьте ссылку на РС

Rambler's Top100
Рейтинг@Mail.ru
 Интернет
[01-05-01]
Ведущий Алексей Цветков

Люди как поисковые машины; электронные словари

Наша первая тема - люди как поисковые машины. Материал подготовил Владимир Воронько.

Воронько:

Герой одного детектива как-то заметил, что всякую вещь надо прятать среди ей подобных. Судя по всему, с информацией можно поступать так же, и многие пользователи Всемирной паутины могут сказать: "Если вы хотите спрятать какой-нибудь файл - выложите его в Интернете".

Это звучит странно, но те, кому приходилось безуспешно искать в Сети что-то нужное, понимают, что в такой шутке есть большая доля правды. Самые мощные поисковые Интернет-машины охватывают не больше половины реально существующих Web-страниц, так что с ростом Интернета в нем образуется все больше белых пятен.

Конечно, запросы роботам тоже можно отдавать по-разному, и даже самую необычную информацию случается найти в первых же результатах поиска. Однако, даже грамотно составленный запрос не гарантирует успеха, и кроме того - многие ли умеют их правильно составлять?

Контакт с живыми людьми часто оказывается эффективнее работы с программами-роботами. Поэтому в 99-ом году были созданы несколько веб-сайтов, помогающих людям, потерпевшим неудачу при поиске информации в Интернете. В прошлом году близнецы таких проектов появились в российском Интернете.

Сайт znatok.ru был создан в сентябре компанией "Hовый диск", ранее известной своими мультимедиа-энциклопедиями. Пользователи сайта делятся на две неравные части. Первая и большая - это те, кому нужен ответ на какой-нибудь вопрос, причём тема может быть какой угодно. Вторая часть пользователей называется знатоками. Это люди, желающие отвечать на такие вопросы, не получая за это никакого вознаграждения, поскольку весь проект полностью бесплатен.

Можно предположить, что внешне всё выглядит как один большой чат с присущим ему беспорядком, однако, это не так. Общение происходит не в реальном времени. Заданные вопросы запоминаются сайтом и хранятся в архиве, позволяя знатокам без спешки обдумать их и ответить в удобное для себя время. Все вопросы распределяются по каталогу в 20 различных темах, кстати - самые популярные из них связаны с компьютерами и культурой. Структура сайта вполне продумана, интерфейс достаточно понятен даже при беглом осмотре.

Те, кто попал на znatok.ru впервые, могут познакомиться с описанием самого проекта, заглянуть в архив вопросов и ответов, почитать, как знатоки представляют себя. Задавать свои вопросы и, тем более, отвечать на чужие, можно лишь после специальной регистрации. Пройдя её, пользователь получает на сайте что-то вроде личной папки, специального раздела, куда имеет доступ только он, куда помещаются ответы на его вопросы, откуда удобно задавать их и вести дискуссии со знатоками.

Помимо того, что каждый вопрос можно и нужно задавать в соответствующем тематическом разделе, предлагая ответить на него всем знатокам, есть возможность обращаться к конкретным людям, и спрашивать только их. При необходимости вопрос можно сделать закрытым, и тогда он будет виден только его автору и знатокам, которым задан, и даже не будет учитываться в статистике по сайту.

Проект в целом производит впечатление удобного и продуманного механизма. Например - при регистрации можно указать свой почтовый адрес, и тогда, задав вопрос, уже не нужно регулярно посещать сайт, проверяя, появился ли ответ. Как только кто-то из знатоков отвечает, пользователю высылается письмо, дескать, на один из ваших вопросов недавно получен ответ - посетите наш сайт и ознакомьтесь с ним.

Интернет-узел znatok.ru является посредником, организовавшим удобное общение желающих задавать вопросы и отвечать на них. Первых примерно в 8 раз больше, чем вторых, однако нехватки знатоков сайт явно не испытывает. В марте на нём было зарегистрировано больше 7-ми тысяч пользователей, на которые приходилось более 900 знатоков. Читая их самохарактеристики, убеждаешься, что народ это настолько разный, что нарисовать портрет типичного знатока нет никакой возможности. Можно только предполагать, почему они бесплатно отвечают на вопросы незнакомых людей.

Поскольку со временем энтузиазм может угаснуть, авторы проекта продумали механизм оценки ответов знатоков по пятибалльной шкале. Сложением оценок рассчитываются их рейтинги, а имена отличившихся появляются на своего рода доске почёта.

Для большей популяризации проекта на сайт в качестве знатоков регулярно приглашаются известные певцы или музыканты. Об их виртуальном приходе пользователей предупреждают заранее, указывают, в каких областях гость считает себя знатоком, и предлагают задавать вопросы. Через некоторое время появляются ответы. Всё это называется "Звезда на znatok.ru" и обычно упоминается в сетевых масс-медиа, создавая проекту дополнительную рекламу.

Зарегистрироваться в качестве знатока на сайте может любой желающий, надо лишь заполнить довольно большую анкету. В ней требуется указать области, в которых человек считает себя знатоком, объяснить - почему он себя им считает, сообщить о своём образовании, а также немного рассказать о себе. Авторы проекта предупреждают, что все введённые данные будут проверяться.

Автор этих строк решил испытать, как действует такая проверка, и заполнил анкету знатока скромными, но совершенно фиктивными данными. Никакие проверяющие со мной не связывались, но через несколько дней мне пришло письмо с сообщением, что я зарегистрирован как знаток и теперь могу отвечать на вопросы пользователей. На всякий случай, я по email-у спросил у службы поддержки проекта, каким образом проходит проверка. Андрей Анищенко ответил мне, что эта проверка целиком субъективна - главное, чтобы будущий знаток не указывал слишком много категорий, в которых он якобы хорошо разбирается, и достаточно подробно описывал себя. Таким образом, экзаменов знатокам не устраивают, полагая, что со временем о каждом из них у пользователей складывается впечатление, основанное на реальных ответах.

Другая интересная служба поиска, находится в Сети - по адресу internethelр.ru. Проект называет себя "Первой российской интерактивной поисковой системой". Он открылся в середине прошлого года, и с тех пор на нём ответили более чем на 200 тысяч вопросов. Ответили не простые пользователи. В штате проекта работают профессиональные операторы и его главное отличие от znatok.ru - в изначальной коммерческой направленности. Internethelр.ru это фирма, которая предлагает своим клиентам набор услуг - профессиональный поиск в Интернете по конкретным запросам, подготовку списков сетевых ресурсов по заказанной тематике, а также регулярные обзоры новостей на заданную тему. Internethelр в самом деле интерактивен - на его сайте с полдевятого утра до пол-одиннадцатого вечера с операторами можно общаться в онлайне, в специальном чате, обсуждая и уточняя свои вопросы. Это удобно, поскольку клиенты часто сами точно не знают, что хотят найти, и разговор с опытным оператором помогает определиться и точнее сформулировать задачу.

Все основные услуги internethelр.ru платные. С условиями и ценами желающие могут познакомиться на сайте, но важно одно обстоятельство - операторы загружены заказами далеко не постоянно, и когда платных клиентов обслуживать не нужно, они совершенно бескорыстно отвечают на вопросы всех желающих. Конечно, настоящие клиенты имеют свои привилегии, о которых можно было бы долго рассказывать, тем не менее - на сайте internethelр.ru каждый может задать вопрос, и профессиональные искатели информации попытаются на него ответить. Если они не заняты с кем-нибудь в чате, то вопрос можно даже обсудить с ними в живую. Повторю - совершенно бесплатно. В противном случае, вопрос запоминается сайтом и операторы отвечают на него когда освободятся.

Таким образом, internethelр можно использовать почти так же, как и znatok.ru. Кстати, операторы отвечают не на все вопросы. Посетителей предупреждают, что поиск ресурсов, пропагандирующих насилие, порнографию, терроризм и тому подобное - не проводится. Hа сайте даже проводится еженедельный конкурс на самый смешной вопрос, и победителям обещают призы. Встречаются весьма оригинальные экземпляры. Интересуются, например: "Почему тараканов называют "стасики"?", или "Каково мое отношение к роману "Евгений Онегин"?"

Рассказывая о справочных службах такого рода, появившихся в российском Интернете, надо упомянуть ещё одну, стоящую немного особняком как от znatok.ru,так и от internethelр-а.

В Западном административном районе Москвы уже много лет существует объединение библиотек, которое называется Централизованная Библиотечная Система "Киевская". Сейчас в эту систему входит 7 различных библиотек.

Поскольку эти библиотеки - бюджетные организации, от них трудно ожидать инициативы, однако ЦБС "Киевская", помимо обычной выдачи книг, за отдельную плату предлагает всем желающим множество дополнительных услуг, начиная от курсов обучения работы с Windows и заканчивая сложными информационно-аналитическими поисками и маркетинговыми исследованиями. Работники ЦБС занимаются даже веб-дизайном, создавая домашние страницы заказчиков.

Все библиотеки, входящие в ЦБС, объединены локальной сетью и имеют выход в Интернет, где их можно найти по весьма удобному адресу www.librarу.ru, т.е. - библиотека-ру. На сайте ЦБС есть удивительно полезный раздел под названием "Виртуальная справка". "Виртуальная справка" делает то же, что znatok.ru и internethelр.ru. Любой желающий может набрать в своем браузере адрес librarу.ru/helр, задать на страницах "Виртуальной справки" вопрос, запомнить номер, под которым он зарегистрирован и через несколько дней зайти за ответом. Всё совершенно бесплатно. Работники ЦБС "Киевской" стараются найти информацию с добросовестностью, присущей хорошим библиотекарям.

Наверное, стоит упомянуть о собственном опыте общения с описанными службами. Сперва я попытался с их помощью найти в Сети текст книги, которая была мне очень нужна, а Яндекс и Апорт ничего не нашли. К сожалению, все три службы тоже не помогли - видимо, такой книги в самом деле в Интернете пока нет. Затем я задал всем троим более сложный вопрос, начинавшийся словами "А правда ли что...?" и далее шло краткое описание того, что я хотел узнать. Znatok.ru не дал никакой информации - вероятно ни один из знатоков не был знаком с предметом. А вот internethelр и "Виртуальная справка" - ответили. Первый выдал две ссылки, которые оператор сопроводил словами "Да, это правда - ознакомьтесь с этим", а "Виртуальная справка" дала одну ссылку с положительным ответом, и одну с отрицательным. Пройдясь по этим ссылкам я полностью удовлетворил свое любопытство.

Радио "Свобода", программа "Седьмой континент". Передачу завершит рассказ Александра Костинского о двуязычных электронных словарях.

Костинский:

Анатоль Франс как-то остроумно заметил: "Словарь - это вселенная, расположенная в алфавитном порядке". Его слова кажутся некоторым преувеличением, но таким ли уж большим? Однажды в молодости Шарль Бодлер начинающим поэтом пришел к уже широко известному Теофилю Готье. В разговоре Готье неожиданно спросил: "Читаете ли вы словари?" "Да, конечно. Охотно!" - воодушевился Бодлер. И Готье стал горячо доказывать как необходимо это писателю, сколько полезного можно почерпнуть из чтения словарей.

Сегодня мы будем говорить об электронных словарях и тех серьезных преимуществах, которыми они обладают по сравнению со своими предками. Именно сейчас электронные словари вышли из тени бумажных и становятся самостоятельными игроками на языковой площадке, причем игроками, которые, похоже, в ближайшее время сделают остальных действующих лиц экспонатами Музея книги.

Но сначала вспомним, что любой хороший словарь - это гораздо больше, чем толкование, пояснение, подбор или перевод слов. Он не только фиксирует некоторый срез языка, словарь сам одновременно формирует язык. Словарь - это сжатая пружина, потенциал и этот потенциал доступен в той мере, в какой язык охвачен и описан словарями. Размер имеет значение. Имеет значение и характерное время доступа к общим ресурсам словарей, а также глубина разработки словарной статьи.

Электронных словарей сейчас выпущено довольно много, поэтому остановимся только на двуязычных англо-русских и русско-английских словарях. Для примера возьмем два самых известных: Lingvo компании Abbyy и МультиЛекс разработанный фирмой МедиаЛингва. Эти словари любопытно сравнить, ведь создающие их команды, исповедуют разные взгляды на принципы электронной лексикографии.

Компания МедиаЛингва придерживается при создании словарей МультиЛекс довольно простой стратегии. Она создает цифровую копию известных книжных изданий. На сайте фирмы можно найти формулировку этого принципа: "В основу электронных словарей заложены словарные базы книжных изданий, уже завоевавших популярность и признание среди переводчиков, преподавателей иностранных языков, студентов и школьников". Некоторые эксперты считают, что такая политика покоится на эксклюзивном договоре МедиаЛингва с "естественным монополистом" рынка российских словарей, издательством "Русский язык". С точки зрения МедиаЛингва, задача электронной лексикографии - как можно точнее перевести традиционный словарь в электронную форму.

За основу словаря МультиЛекс взят "Новый большой англо-русский словарь" под редакцией А.Д. Апресяна. Есть и расширенная версия, где к основному словарю добавлены экономико-финансовый, юридический, строительный, политехнический словари и словарь по полиграфии и издательскому делу.

Конечно, словарь Апресяна - выдающееся достижение лексикографии, но подход МедиаЛингва имеет и недостатки. Первое, традиционные словари довольно серьезно отстают от языковой реальности. Обычно это не менее десяти лет. А электронные словари можно пополнять чуть ли не ежедневно. Второе, словари, содержащие сотни тысяч словарных статей, какими бы квалифицированными лексикографами они не составлялись, всегда содержат ошибки и неточности, не говоря уже о возникновении дополнительных значений слов. Жесткая привязка к бумажному прототипу не дает возможности исправлять и дополнять электронный, тем более изменять структуру построения словарной статьи.

По другому, и на мой взгляд более перспективному пути, пошла компания Abbyy. Конечно, и в их большом электронном словаре Lingvo7.0 есть переведенные в цифровой вид лицензированные бумажные словари - это политехнический, юридический, экономический, финансовый, медицинский и что очень своевременно - динамично пополняемый компьютерный словарь. Но основу Lingvo, по словам руководителя лингвистического отдела фирмы Владимира Селегея, составляет электронный словарь собственной разработки. Каждая новая версия Lingvo дополняется актуальной лексикой, и в ней исправляются найденные ошибки и неточности. Таким образом, благодаря лексикографическим исследованиям англо-русский словарь фирмы Abbyy близок к языковой практике.

Удачной находкой Abbyy выглядит приглашение всем желающим размещать на их Интернет-узле словари собственного изготовления http://www.lingvo.ru/dictionaries/index.htm . Такое вовлечение пользователей в лексикографическую работу вполне соответствует духу открытых Интернет-сообществ. Дополнительных словарей на сайте уже набралось 23 штуки. Причем всякий желающий может скачать их из Интернета и присоединить хоть все к уже имеющимся в базовой версии. Надо сказать, что базовая версия Lingvo-7.0 содержит миллион двести тысяч словарных статей. Причем основные статьи тщательно проработаны. Например, не самая большая статья о слове go содержит более двадцати пяти тысяч знаков.

Первое, что бросается в глаза, когда мы говорим об электронных словарях - это резкое сокращение объема. На десятиграммовом компакт-диске помещается целая полка толстых словарей общим весом в двадцать пять килограмм. Но, естественно, не это главное. Важно, что электронный словарь принципиально может обойти ключевое противоречие книжной лексикографии: чем больше информации предлагает словарь, чем развитее его научный аппарат, тем сложнее им пользоваться. Поэтому классические словари разделяется на две категории. Первая - популярные, относительно удобные, но довольно простые. Вторая - обстоятельные академические издания, не позволяющие быстро получить искомую информацию.

Современные электронные словари не только значительно превосходят по объему книжные, но и находят искомое слово или словосочетание за несколько секунд. Причем искать можно в любой форме. Некоторые, например Lingvo, встраиваются во все основные офисные приложения и выделенное слово можно переводить нажатием нескольких клавиш.

Электронные словари не только содержат транскрипцию, но и могут произносить слова. Здесь тоже существует два подхода. В МультиЛекс встроен синтезатор звука и произносятся все слова. Однако полностью доверять такому подходу, не контролируя его по транскрипции, опасно. Синтезатор может неправильно поставить ударение или вообще исказить произношение слова. В Abbyy Lingvo основную лексику озвучивает диктор с оксфордским произношением, считающимся для английского языка классическим.

Но, конечно, самое главное преимущество хороших электронных словарей - одновременный поиск не только по названию словарной статьи, но и по всему огромному объему словарей, что просто нереально в бумажном варианте. Такой поиск создает многомерный портрет слова, при этом извлекаются из глубин словарной статьи не только конкретные примеры его использования и устойчивые выражения, в которых слово встречается, но и обнажаются, становятся явными языковые законы, которым подчиняются правила словообразования. Даже мобильный электронный словарь не может отразить все сиюминутные движения языка, но он может дать ключ для расшифровки и понимания этих изменений, делая пользователя соавтором лексикографа. Что очень важно, когда требуется точный смысловой перевод, ведь это не задача подбора подходящего выражения, а в широком смысле отображение одной культуры с помощью языка другой. Поэтому в Lingvo можно строить и свой собственный словарь под общей оболочкой.

Очень важно, что электронные словари, о которых мы сегодня говорим, используют последние достижения лексикографии и значительно превосходят широко распространенный англо-русский словарь под редакцией В.К. Мюллера. "Мюллер" - памятник той эпохи, когда считалось, что задача двуязычного словаря - найти слову из одного языка эквивалент в другом. По умолчанию предполагалось, что такое соответствие существует. С тех пор лингвисты убедились, как трудно даже просто определить что же такое слово. Слово нельзя понять без контекста и культуры или субкультуры в которой оно живет. Поэтому каждое значение в электронном словаре сопровождается синонимами, антонимами, примерами употребления, лингвистической информацией. Удобно, что не выходя из основной статьи, можно открыть окошки синонимов, антонимов и так далее и изучать их вместе. Замечательно, что в современных электронных словарях отражено пионерское достижение российской лексикографии - двуязычный словарь во многом становится толковым. Кроме того, такой электронный словарь, как Lingvo, строит нажатием нужной клавиши парадигму, то есть совокупность всех форм слова.

Попробовать поработать с упрощенными сетевыми версиями электронных словарей сейчас может каждый, кто имеет доступ в Интернет. И даже такое знакомство - впечатляет. Интернет-версия Lingvo, пожалуй, удобнее http://www.lingvo.ru/lingvo/index.asp , но всегда полезно в сложном случае заглянуть, в Новый большой англо-русский словарь http://www.multilex.ru/online.htm.


Все ссылки в тексте программ ведут на страницы лиц и организаций, не связанных с радио "Свобода"; редакция не несет ответственности за содержание этих страниц.


Другие передачи месяца:


c 2004 Радио Свобода / Радио Свободная Европа, Инк. Все права защищены