Сто процентов русского языка
М. Суханова
Что ни говори, а, заходя на русскоязычные Web-страницы, мы сейчас чаще видим обычные русские слова, чем, к примеру, текст на ломаном английском с предложением выбрать кодировку. Совместными, хоть и не всегда согласованными усилиями разработчики браузеров, администраторы серверов и Web-мастера в целом решили проблему поддержки русского языка в WWW; досадные исключения встречаются, но это именно исключения. А отечественные поисковые системы ищут слова из запросов в разных кодировках, причем некоторые ("Яндекс", "Апорт") еще и в разных формах.
Русские адреса
Казалось бы, чего еще желать? На этот с виду чисто риторический вопрос разработчики из компании "МедиаЛингва" дали вполне осмысленный ответ: пожелайте, чтобы адреса страниц тоже задавались по-русски. Сами URL (Uniform Resource Locators - единообразные определители местонахождения ресурсов), которые незабвенный Май Иванович Мухин в своих обзорах "Перелетные мухи" называл "урлами", русифицировать, конечно, нельзя - по стандарту в них допустимы только латинские буквы, цифры и некоторые специальные символы. Однако можно надстроить над URL еще один уровень адресов, на котором таких ограничений не будет.
Эта идея была реализована в созданной весной этого года Национальной службе имен (НСИ). Служба, как уже упоминалось, разработана компанией "МедиаЛингва", а поддерживает ее компания "100%". На сервере НСИ, который находится по адресу http://www.names.ru, хранится база адресов, позволяющая искать Web-страницы по их "русским именам" - названиям фирм и организаций, именам владельцев, характерным ключевым словам, рекламным девизам. Скажем, по запросу "Открытые системы" будет найдена страница http://www.osp.ru, по запросу "МПС" - http://www.css-mps.ru, по запросам "Яблоко" и "Явлинский" - http://www.yabloko.ru, а по запросу "машинный перевод" - http://www.ets.ru.
На том же сервере (и на нескольких других) имеется бесплатный драйвер, установив который можно вводить запросы к базе русских имен прямо в поле адреса; получив запрос, драйвер связывается с сервером НСИ, находит в базе нужный URL и производит автоматическое переключение на соответствующую страницу. Таким образом, с точки зрения пользователя вводимые им в качестве адресов русские слова и словосочетания будут полностью эквивалентны стандартным URL. Драйвер существует для Windows 3.x и 95/NT. Те же, кто работает в другой операционной системе или по какой-либо причине не хочет устанавливать драйвер, могут пользоваться Web-интерфейсом НСИ: он также есть на нескольких серверах, в том числе, разумеется, на самом http://www.names.ru и на http://www.infoart.ru.
База имен
База имен состоит из двух частей: имена фирм и организаций и имена частных лиц. Первые должны быть уникальными, т. е. коль скоро издательство ЭТС зарегистрировало для своей страницы имя "машинный перевод", то фирме ПРОМТ это сделать уже не удастся (зато на страницу, посвященную ПРОМТ, - правда, не на ее собственную, а на принадлежащую компании "Агама", - http://russia.agama.com/promt.htm, - отсылает запрос "программы перевода"); несколько адресов могут оказаться результатом поиска, но лишь в случае, когда запрос не имеет точного соответствия в базе. В обратную сторону, как мы видели, таких строгих ограничений нет: одному URL могут соответствовать и несколько имен; регистрационная форма предусматривает, помимо основного имени, до четырех синонимов. С именами частных лиц все наоборот: требование уникальности, естественно, отсутствует (человек не должен страдать из-за того, что у него есть однофамильцы), а синонимы - прозвища, псевдонимы - не допускаются. Имена обоих типов можно снабдить краткой аннотацией, с которой НСИ будет работать как обычная поисковая система.
Регистрация в базе производится только по заявкам, причем сотрудники НСИ предварительно проверяют соответствие имен и аннотаций страниц их реальному содержанию. Если частное лицо регистрирует только свой адрес электронной почты (что допускается), то проверить правильность сообщенных сведений, очевидно, невозможно. По вновь зарегистрированному адресу посылается уведомление - оно гарантирует, что владелец адреса действительно хотел зарегистрироваться, - а вот гипотетическую ситуацию, в которой кто-то присваивает себе имя другого человека, чтобы перехватить часть его переписки, предотвратить нельзя.
Регистрация с 1 октября сделана платной, она стоит 15 долл. в год для частных лиц и 40 долл. в год для фирм. Можно также бесплатно зарегистрироваться в демонстрационном режиме.
Перспективы и проблемы
Как уже упоминалось, для частных лиц в базу заносится информация об адресе не только домашней страницы, но и электронной почты. В дальнейшем предполагается обеспечить работу с русскими именами также в почтовых программах и открыть Национальную почтовую службу, естественным образом дополняющую Службу имен.
Две компании - "Телепорт-ТП" и "МТУ-Информ" - уже подписали со "100%" договор об установке дополнительных серверов НСИ, а со временем появятся и другие, так что запросы к службе (двум службам) будут обрабатываться быстро даже тогда, когда их число многократно возрастет. Драйвер НСИ должен быть помещен на русский "портал" Internet Explorer 5 и войти в состав русской версии Netscape Communicator 5. Вероятно, многие провайдеры включат его в свои пакеты программ для работы с Internet. Так что планы развития системы, с помощью которой мы сможем "стопроцентно по-русски" общаться со Всемирной сетью, как видим, весьма обширные.
Несомненно, по мере своего расширения Служба имен столкнется с различными проблемами технического и организационного характера. Имена НСИ, в отличие от стандартных доменных, никак не структурированы - не начнет ли это мешать эффективной работе с базой при возрастании ее объема? Ведь будет увеличиваться как число русскоязычных Web-страниц (по данным AltaVista, число страниц в домене .ru сейчас превышает 750 тыс.), так, надо полагать, и процент страниц, зарегистрированных в НСИ. Возможны осложнения и из-за способа, каким в НСИ обеспечивается уникальность имен (хотя вряд ли можно было бы предложить что-то более разумное). Если на какое-то имя имеют право несколько страниц (как в примере с запросом "машинный перевод"), оно присваивается той из них, для которой первой была подана заявка, так что она оказывается в никак содержательно не обусловленном привилегированном положении. Некоторой компенсацией может служить то, что, пока происходит подключение, НСИ показывает страницу с приглашением поискать нужный ресурс также с помощью серверов "Яндекс" и "Следопыт". Однако оно довольно быстро исчезает, и новичок (а служба рассчитана в первую очередь на новичков) может не придать ему значения.
Не вполне ясно, насколько активно будет происходить регистрация. Перепись населения русскоязычного Internet на сервере "Созвездие Internet" (http://www.stars.ru/people.htm) проходила довольно вяло: в общей сложности было заполнено менее 35 тыс. анкет (сравните это с 750 тыс. Web-страниц). База адресов электронной почты "Электронная Россия" (http://www.dubna.ru/eros) содержит сейчас более 100 тыс. записей, но по большей части эти адреса не внесены в базу их владельцами, а получены автоматически путем сканирования телеконференций. Более чем прохладное отношение к регистрации, разумеется, связано со страхом перед попаданием анкет в руки спэммеров или еще каких-нибудь людей, преследующих неблаговидные цели, причем определенные основания для опасений, конечно, есть: даже если честные намерения анкетирующих не вызывают сомнений, невозможно гарантировать, что анкеты не будут похищены хакерами. Однако куда более важную роль, по-видимому, играет самая обычная лень.
Так или иначе, в обоих случаях совершенно бесплатная регистрация (среди участников переписи к тому же разыгрывались призы) не вызвала особого энтузиазма. Не упадет ли он просто до нуля, если за регистрацию станут брать деньги? Как ни странно, вполне вероятно, что все будет наоборот, - вспомним, как Том Сойер красил забор. Кроме того, "100%" планирует заключить с рядом провайдеров договоры, по которым они включат регистрацию в базе НСИ в комплекс своих услуг; разумеется, пользователь будет иметь право отказаться от регистрации, но можно рассчитывать, что он этого не сделает, - опять же в силу лени.
Проблемы неизбежны: НСИ - новаторский проект, и странно было бы, если бы они не возникали. Но главное уже сделано: служба убедительно продемонстрировала, что работать с Internet по-русски вполне можно и что это удобно. Пожелаем ей успеха.