Информационные ресурсы Internet
П. Храмцов, РНЦ "Курчатовский Институт"
Реферат
В данном докладе приводятся основные характеристики информационных технологий сети Internet и кроткий перечень доступных через эти технологии информационных ресурсов. классификация технологий по типу коммуникаций, скорости доступа, объему трафика и его доле от всего объема трафика в сети Internet. Приводятся основные типы информационных ресурсов опубликованных в Сети.
Немного истории
Глобальная компьютерная сеть Internet начиналась как оборонный проект, который финансировался Агентством Перспективных Исследований Министерства Обороны США. Целю проекта являлась разработка компьютерной сети, призванной обеспечить устойчивое функционирование системы управления страной в условиях ядерной войны. Первые документы, описывающие технические требования к системе появились 1964 году, в 1969 первые четыре компьютера были объединены в реально действующую сеть. Эта сеть получила название ARPANET. В 1971 году сеть насчитывала уже 14 компьютеров, а в 1972 -- 37. Семидесятые -- это время роста сети и отладки технологии межсетевого обмена в рамках ARPANET. В 1982 году были опубликованы протоколы Transfer Control Protocol (TCP) и Internet Protocol (IP). С этого момента в лексикон специалистов по сетевым технологиям вошло сочетание "TCP/IP", которое прочно закрепилось за всем семейством документов и стандартов, связанных с работой ARPANET, а позже и сетью Internet. Собственно, Internet появилась как результат большой компьютерной программы Национального Научного Фонда США. Для проведения научных исследований Фонд организовал по всей стране несколько центров вычислений и оснастил их суперкомпьютерами. Для того, чтобы специалисты, занятые в фундаментальных исследованиях, могли использовать вычислительные мощности этих компьютерных центров, все они были объединены в единую компьютерную сеть. Первоначально планировалось использовать для этих целей ARPANET, но по различным соображениям администрация последней не разрешило подключение американских университетов к оборонной сети. В результате Фонд создал свою собственную сеть NSFNET. В качестве основы этой сети были выбраны средства межсетевого обмена разработанные в рамках проекта ARPANET. В это время появились первые шесть доменов Internet: gov, mil, edu, com, org и net. За каждой из этих аббревиатур скрывается своя собственная сеть: gov - сеть правительственных организаций, mil - сеть военных организаций, edu - сеть университетов, com - сеть коммерческих организаций, org - неправительственные и некоммерческие организации, net - сеть организаций, отвечающих за функционирование самой Сети.
Употребив слово сеть с заглавной буквы, мы делаем разделение между сетями, составляющими Internet и самой Internet, как совокупностью различных сетей. В настоящее время в Internet, кроме NSFNET входит еще порядка нескольких сотен различных сетей. Общим для всех этих сетей является тот факт, что для обмена информацией между собой они используют единый механизм, который называется технологией межсетевого обмена информацией - семейство протоколов TCP/IP. Основными моментами этой технологии являются единая система адресов всех компьютеров в сети, единая форма обмена информационными сообщениями между сетями - протокол IP и протоколы обмена данными с программным обеспечением, установленном на компьютерах Сети, которые используют IP для обмена информацией.
Став средством научной коммуникации в рамках программы NSF, Internet превратился в основное средство предварительной публикации результатов научных работ. Практически все лаборатории мира, имеющие доступ к Сети, стали размещать свои препринты в электронном виде в архивах Internet, а уже только после этого выпускать печатные копии этих работ.
Internet в России
Не обошла Internet и Россию. В стране существует, примерно, с десяток сетей, которые предоставляют возможность подключения к Сети. Стандартными услугами, которые обеспечивают эти сети являются: доступ к ресурсам Internet по электронной почте, подключение в режиме удаленного терминала к компьютеру, включенному в Сеть, полное IP-подключение, которое заключается в получении своего собственного адреса в Internet и возможность работы с использованием протоколов TCP/IP. Доступ к услугам Сети по электронной почте заключается в приеме и передаче, как правило, текстовых сообщений небольшого объема. Хотя сообщения доставляются довольно быстро, (от нескольких секунд до нескольких часов в любую точку земного шара) реально свой почтовый ящик просматривают раз в день. Такой сервис хорош для личной переписки и для распространения различного сорта информации по подписке. Обычно, почту используют для рекламы или распространения бюллетеней. Доступ к Сети в режиме удаленного терминала дает гораздо больше возможностей. Здесь пользователь работает на удаленных от него компьютерах, а следовательно и с их информационными ресурсами, так же, как если бы он находился за консолью вычислительной машины. Любая информация размещенная в Internet доступна для пользователя удаленного терминала, но рассмотреть графические образы он не может. Полное IP-подключение обеспечивает максимальный сервис для пользователя Сети. В этом режиме доступна вся мощь современных компьютерных технологий. Только полное IP-подключение позволяет просматривать графику хорошего качества, прослушивать звукозаписи и отображать видеофильмы. Большинство современных изданий на Internet ориентированы на полное IP-подключение.
Наиболее известными коммерческими организациями, предоставляющими услуги по доступу в Internet, являются АО РЕЛКОМ, ДЕМОС, РО Спринт, Совам-Телепорт. Среди некоммерческих сетей следует выделить Радио-МГУ, RUNNET, FreeNet. Кроме сетей, базирующихся на технологии Internet, существуют сеть, использующие другие технологии для обмена данными. Наиболее популярной из них является технология X.25. Собственно, сети РО Спринт и Совам-Телепорт - это сети X.25, но для связи с Internet они используют специальный механизм обмена с сетями Internet, который называется инкапсуляцией. В качестве большого реферативного архива в Российском Internet размещены базы данных Всероссийского Института Научной и Технической Информации (ВИНИТИ), к которым можно получить доступ по адресу в World Wide Web -- http://www.viniti.msk.su/. В настоящее время СовамТелепорт начал большой проект по публикации информации на Internet, который называется "Россия On-Line"(http://win.online.msk.ru/). Данный проект предполагает создание информационного коммерческого сервиса на подобие систем типа Yahoo(http://www.yahoo.com/) или Lycos(http://www.lycos.com/). Эти системы реализуют концепцию виртуальной библиотеки, в которой материалы размещены по тематикам, однако список этих тем не является стандартным и отражает предпочтения их создателей. В настоящее время в России насчитывается около 4000 узлов Internet. Страна занимает 34 место по числу подключенных к Сети шлюзов, и по темпам роста числа подключений (142% в год) сравнялась с такими странами как Новая Зеландия (157%) и Бельгия(147%). Всего же в Internet к середине 1995 года насчитывалось около 50 млн. пользователей.
Информационные технологии Internet
Такое большое количество пользователей Сети делает ее очень привлекательной с точки зрения средства распространения информации. В настоящее время Internet широко используется как: средство коммерческой рекламы, огромный реферативный справочник, всемирная библиотека, всемирная справочная служба, средство индивидуального и группового информационного обмена, средство проведения конференций, мировой архив звуковой и видеоинформации и т.п.
Первым текстовым документом, который был специально предназначен для распространения по сети Internet, в то время ARPANET, был документ под названием "Программное обеспечение сетевого узла", который был разработан Стивом Крокером, одним из участников проекта ARPANET. Этот документ был подготовлен и распространен по сети в 1969 году. Работа Крокера положила начало библиотеке стандартов сети Internet - знаменитым Request For Comments. Из названия этих документов, буквально - "Материалы для комментариев", следует, что они предназначались для обсуждения сетевым сообществом и результатом такого обсуждения должен был быть некий стандарт на программное обеспечение или нормы поведения в сети. Каждый из участников обсуждения мог вносить любые замечания в документ, и после этого рассылал документ другим участникам дискуссии.
Второй важной вехой в деле распространения информации в Internet стало рождение системы телеконференций Usenet. Собственно, появление первой системы обмена новостями не связано непосредственно с Сетью. В 1979 году в университете штата Северная Каролина двумя аспирантами: Томом Траскотом и Джимом Элисом на базе протокола обмена сообщениями между компьютерами с операционной системой Unix -- UUCP было создано программное обеспечение электронной доски объявлений, при помощи которого они связали два компьютера. В 1981 году система была реализована на языке программирования "С" в университете Беркли аспирантами Маком Нортоном и Метом Гликманом и в 1982 году была выпущена свободно-распространяемая версия этой программы. В 1984 и 1986 годах система была переписана с учетом опыта распространения информации в ARPANET, а в 1986 году для системы новостей был разработан специальная форма обмена информацией - протокол Network News Transfer Protocol (NNTP), который был зафиксирован в качестве стандарта Internet под номером 977 (RFC-977). С этого момента система телеконференций Usenet становится одним из стандартных информационных ресурсов Сети.
Usenet - это огромная электронная доска объявлений, разделенная на части согласно интересам ее пользователей. Каждая группа новостей имеет свое название. Система названий имеет иерархическую структуру. Например, группа новостей, описывающих информационные технологии Internet называется comp.infosystems, что означает - группа "компьютеры" подгруппа "информационные системы". В свою очередь каждая подгруппа может быть разбита на новые подгруппы. Так группа comp.infosystems.www имеет более 10 подгрупп (comp.infosystems.www.misc, comp.infosystems.www.users, comp.infosystems. www.providers и т.п.)
В момент рождения Usenet задумывалась как средство обмена мнениями между коллегами по работе, затем ее стали использовать как средство общения групп пользователей Сети, объединенных определенным интересом. Это могли быть пользователи какого-нибудь программного продукта, скажем СУБД Oracle, или любители фантастики Толкиена. Однако очень скоро пользу Usenet осознали и рекламные агентства. В настоящее время боле 35% всех сообщений Usenet являются рекламными объявлениями специально подготовленными для распространения по Сети. Примером такого сорта является коммерческая группа новостей Relis акционерного Общества РЕЛКОМ. Долгое время новости распространялись в виде простых текстовых файлов, однако в последнее время, после появления специальных стандартов разметки текстовой информации ( языки Hypertext Markup Language и Standard Generalised Markup Language ), программные средства просмотра новостей стали позволять просматривать не только текст, но и графические образы, и короткие фильмы, прослушивать звуковые объявления.
Другим важным средством обмена информацией в Internet является электронная почта. Электронная почта появилась приблизительно в то же время, что и Usenet. Долгое время Usenet даже использовала для передачи новостей каналы электронной почты. Главной задачей электронной почты является обеспечение надежной и быстрой доставки корреспонденции от одного адресата другому. Пионером внедрения систем электронной почты в СССР являлась сеть РЕЛКОМ. Однако, как и по обычной почте, по электронной почте также возможно распространение периодических изданий. Этот способ опубликования на сети называется почтовыми списками. Почтовые списки (Listserv) появились впервые в компьютерной сети BITNET и завоевали всемирное признание. Как правило каждый список ведется специальным администратором или группой администрирования. В качестве примера такого списка можно назвать каталог программных средств фирмы Cognitive - известного производителя систем распознавания образов и оцифровки текстов.
Если в вашем распоряжении имеется телефон и он достаточно хорошо работает, т.е. способен поддерживать соединение абонентов в течении четверти часа, то преимущества электронной почты перед обычной очевидны. Первое преимущество - это скорость доставки. Если абоненты включен в глобальную сеть Internet непосредственно через IP-соединение, то он получит послание через несколько секунд. Если абонент имеет коммутируемое соединение с Internet, то скорость доставки ограничивается периодичностью его подключения, которую он определяет сам. В любом случае, пользователь точно получит послание в течении дня. Если учесть, что даже по Москве почта не ходит быстрее суток, а из Московской области в Москву ее доставляют почти неделю, то электронная почта выглядит на этом фоне просто сверхзвуковым лайнером на фоне черепахи. Что уж говорить о скоростях доставки обычной почты из дальнего и ближнего зарубежья. Иногда она просто не доходит.
Долгое время считалось, что электронная почта пригодна только для передачи текстовых сообщений, поэтому ее не рассматривали в качестве серьезного конкурента обычной почты при распространении подписных изданий. Такое мнение было основано на том факте, что передача больших фалов по коммутируемой линии дело довольно муторное. Как правило наша телефонная сеть не позволяет передать по линии связь файл размером в один мегабайт за один сеанс связи. Однако ситуация постепенно меняется, а это значит, что по почте становится возможным передача и графики и видео и другой нетекстовой информации. В странах Европы и США стало нормальной практикой электронная почта, в которую встроены графические картинки или аудио информация. Для сообщений этого рода разработан даже специальный формат -- MIME. Кроме того международная организация стандартизации --ISO разработала еще один стандарт для передачи сообщений с нетекстовой информацией -- X.400. Важной особенностей, перечисленных выше стандартов является передача специально размеченного текста, что дает возможность при отображении сообщений на экране или при печати управлять стилем текста и шрифтами.
Еще одним большим преимуществом электронной почты является ее дешевизна по сравнению с обычной почтой.. Особенно ясно это становится при отправке и получении международной корреспонденции. Разница в тарифах достигает одного двух порядков и это вообще-то понятно: не надо жечь керосин и гнать на другой конец света самолет или океанский лайнер. Тот же эффект просматривается и при сравнении с такими средствами связи как телефон или факс. Для того, чтобы не терять такое качество телефаксовой связи как графику многие почтовые сети используют специальные программы -- телефаксовые серверы. Суть работы телефаксового сервера заключается в том, что пользователь вместо того, чтобы связываться по международной телефонной связи для передачи телефаксового сообщения, отправляет его по электронной почте на телефаксовый аппарат, который находится недалеко от места получения факса. Совершенно очевидно, что при этом стоить такое отправление будет гораздо дешевле, чем непосредственная доставка.
Долгое время, до появления компьютерных сетей, информация в электронном виде хранилась в локальных информационных система. Как правило, это были либо каталоги библиотек, либо реферативные журналы. Для получения доступа к этим системам нужно было устанавливать у себя программное обеспечение для работы с этими базами данных, и, затем, периодически докупать магнитные ленты с документами для актуализации содержания информационных массивов. Наиболее известным ресурсом такого рода являлись реферативные базы данных ВИНИТИ, которые хранили копии реферативных научно-технических журналов. В мире наиболее известной системой такого сорта являлись системы STN, Dialog, Индекс Цитирования Гардфилда и др. С появлением сетевых технологий трудно отказаться от такого богатого наследства с одной стороны, но чрезвычайно трудно весь этот объем материалов преобразовать в формы принятые при сетевом обмене информацией. Выход был найден в механизме доступа к информационным системам в режиме удаленного терминала. Собственно программное обеспечение удаленного терминала разрабатывалось для других целей (ARPANET все-таки - это оборонный проект), но оказалось чрезвычайно удобным и для удаленного доступа к старым информационным системам. Через удаленный терминал в сети Internet доступны каталоги многих библиотек США, словари, газеты, журналы и другая информация. Наиболее полным собранием адресов, по которым можно войти в режиме удаленного терминала является база данных Hytelnet, версии которой реализованы для компьютеров всех типов и большинства наиболее распространенных операционных систем.
После электронной почты обратим свое внимание на безусловного лидера среди технологий опубликования в Сети электронных -- файловые архивы Internet, которые называют еще FTP-архивами по имени механизма обмена информацией -- File Transfer Protocol. FTP- архивы первоначально создавались для обмена и хранения стандартов сети -- документов RFC и программного обеспечения. Но со временем они превратились в огромные многопрофильные хранилища данных. Из всего обилия информации, которая содержится в FTP-архивах Internet наибольший интерес с точки зрения электронных изданий представляют специальные проекты направленные на создание электронных копий знаменитых книг. Наиболее известными из них являются проект "Гуттенберг" и проект "Руттенберг". Первый призван создать архив электронных копий книг на английском языке, а второй архив книг на скандинавских языках. В настоящее в время в архиве "Гуттенберг" насчитывается 351 полный текст. Вот некоторые из них: Charles Dickens: The Chimes; Bible: Holy Bible; Henry Longfellow: The Song of Hiawatha; Doyle The Adventures of Sherlock Holmes; Mark Twain: The Adventure of Tom Sawyer.Lewis Carrol: Alice`s Adventures in Wonderland. Любопытно то, что в США создается архив славянских книг, который называется "Нестор", но здесь работы только в самом начале. Создание электронных копий книг сопряжено с рядом проблем. В настоящее время самой серьезной из них является проблема авторского права. Дело в том, что выше упомянутые проекты ставят своей целью создать публичные, т.е. бесплатные и доступные всем пользователям сети архивы. Но это означает, что тексты книг должны попасть в категорию свободно распространяемой информации или как ее называют на Западе -- Public Domain. Проект "Гуттенберг" разрешил эту проблему соответственно законодательству США, где в настоящее время к этой категории относятся тексты опубликованные до 1917 года. В проекте "Руттенберг" в 1995 году возникли неожиданно проблемы, связанные с тем, что проектом заинтересовался шведский парламент, и в настоящее время проект может оказаться на грани закрытия, т.к. публиковать материалы разрешено только до первого января 1996 года. Руководство проекта подготовило обращение в парламент страны с просьбой рассмотреть возможность продолжения работ. А пока суть да дело, набирает добровольцев для интенсификации работ по вводу информации.
В отечественно секторе Internet пока дело до таких масштабных акций не дошло, хотя подвижки в эту сторону есть. Наиболее интересным из проектов такого сорта является проект LIBWEB, финансируемый Российским Фондом Фундаментальных Исследований. Целью этого проекта является создание распределенного электронного каталога ведущих научных библиотек страны, доступ к которому будет осуществляться по российской части Internet. Хотя главной технологией поддержки этого проекта является World Wide Web, но возможен также будет и доступ по FTP.
Кроме таких фундаментальных работ, связанных с созданием электронного наследия человечества, существуют мене притязательные базы данных публикаций отдельных организаций. К таким системам относятся библиотеки юридической литературы Библиотеки Конгресса США, библиотеки препринтов университетов и научных центров, каталоги издательств и университетских библиотек. Как правило литература в этих хранилищах представлена в виде файлов формата PostScript, либо файлов формата TeX. PostScript -- это стандарт de facto для печати документов. Этот формат был разработан фирмой Adobe и реализован для печати на лазерных принтерах. В настоящее время широко применяется в настольных издательских системах. Для любого типа печатающего устройства можно приобрести необходимый картридж для печати файлов формата PostScript. В сети Internet широко распространена программа преобразования файлов формата PostScript в форматы печатающих устройств - ghost. Другим стандартом, который продвигает фирма Adobe, является Portable Document Format (PDF). Данный формат специально предназначен для обмена информацией на электронных носителях. Для просмотра документов в этом формате по сети Internet можно получить специально разработанную фирмой свободно распространяемую программу Acrobat, реализация которой существует для всех распространенных компьютерных архитектур, начиная от обычных персоналок до высоко производительных рабочих станций. Формат TeX широко распространен в научной среде. Многие научные журналы принимают публикации авторов в этом формате. Фалы TeX, или его модификации - LaTeX, представляют из себя обычные текстовые файлы со встроенными в них командами разметки документа. TeX был разработан в Американском Математическом Обществе для стандартизации публикаций по математике. Формат обладает очень мощными средствами описания математических формул и таблиц, он также допускает использование встроенной графики. Типичным примером FTP-архива такого сорта является архив препринтов Международного Европейского Ядерного Центра (CERN), который, видимо, является одним из первых архивов такого рода.
От FTP-архивов, которые являются обычными иерархическими хранилищами информации перейдем к более современной информационной технологии опубликования информации на Сети - распределенной информационно-справочной системе Internet - Gopher. До 1995 года Gopher являлся самой динамичной информационной технологией Сети. Темпы роста числа Gopher серверов, т.е. программ, управляющих базами данных Gopher, опережали темпы роста серверов всех остальных технологий Internet. Gopher был разработан как информационная система университетского городка. Здесь, видимо следует пояснить, что университетские городки США отличаются от наших комплексов высших учебных заведений тем, что учебные и жилые корпуса университета, как правило составляют единый комплекс и находятся на некотором удалении от крупных городов. Такая система называется университетским кампусом (campus). Вот для информационного обеспечения такого кампуса и был придуман Gopher. Само слово "Gopher" переводится на русский язык как "суслик". Но в данном случае имеется в виду совсем другой подтекст. Дело в том, что Gopher-ом или "сусличным" штатом называют штат Миннесота. "Сусликами" называют и жителей этого штата. Информационная система Gopher была разработана в 1989 году в университете Миннестоы, и названа в честь своего штата не без определенной доли юмора. Главным стержнем системы является идея представления всей информации в виде иерархического дерева. Разработчики Gopher считали, что такая форма очень понятно пользователям, т.к. они каждый день имеют дело с иерархическими каталогами библиотек и иерархической структурой файловой системы. Кроме того дерево Gopher прекрасно совпадало с иерархией подразделений университета и его организационной структурой. В 1990-1992 годах Gopher получает широкое распространение в других университетах США и Европы. С 1992 года специалисты Internet и энтузиасты Gopher стали говорить о Gopher-пространстве (GopherSpace), которое было образована в Internet серверами Gopher. В 1993 году появляется универсальная поисковая машина Gopher - Veronica. Она дает возможность сканировать Gopher-пространство как простую текстовую базу данных, используя запросы построенные на использовании ключевых слов. К этому времени на Gopher стали обращать свое внимание и коммерческие организации. В частности такое издательство как O`Reilly организовало свой Gopher-сервер для опубликования на сети каталога издательства, журнала издательства и ряда других материалов. Прелесть Gopher заключалась в том, что текстовые файлы, которые хранились в FTP-архивах включались в качестве элементов Gopher-каталога без каких-либо их изменений. Кроме текстов Gopher позволяет обеспечить доступ и к графической информации и к звуковым записям и даже поисковым запросам, которые также являются элементом дерева Gopher-базы данных, однако, для просмотра этих документов необходимо наличие специальных программ просмотра, которые не являются составной часть Gopher-клиентов.. Ко времени появления Gopher в сети, развивая концепцию полнотекстовых архивов стали появляться новые проекты хранения литературных произведений. Одним из них является проект всемирной детской библиотеки. В настоящее время на одном из серверов Gopher хранятся книги 16 детских авторов, среди которых: Эдгар ПО, Льюс Кэрол, Фрэнк Баум, Роберт Стивенсон, Марк Твен, Даниель Дефо. Однако, появление Gopher не прибавило изобразительности электронным книгам. Это по-прежнему были обычные текстовые файлы. В рамках Gopher не было разработано никаких специальных механизма описания информации или управления ее отображением. Для представления текстовых страниц со встроенных в них графикой необходимо было делать графические копии этих материалов. Такие копии занимают слишком много места, поэтому перечисленные выше архивы и содержат только текстовую информацию. Правда издатели стали задумываться о едином формате хранения информации, который позволял бы использовать одну и туже копию документа как для обычного издания, так и для электронной публикации. К этому времени уже был разработан специальный стандартный язык разметки документов - Standard Generalised Markup Language (SGML), который в последнее время получает все большую популярность в качестве стандарта хранения и представления информации. Этот язык используется такими пионерами электронного опубликования, как O`Reilly Inc. и Chicago Business School Publishing. Правда это происходит в контексте развития другой информационной технологии Internet - World Wide Web или, в переводе на русский язык, "Всемирной паутины".
Информационные ресурсы Internet
Следует отметить, что в первую очередь World Wide Web страницы создали на Сети практически все, кто занимался опубликованием материалов до появления Web. И проект "Гуттенберг" и проект "Руттенберг" и издательство O`Reilly и масса других, перечисленных выше организаций включились в процесс создания "Всемирной паутины". В настоящее время все электронные издания Web можно разбить на несколько категорий. Это во-первых рекламные страницы, во-вторых -- это электронная периодика, в третьих -- это серьезные электронные монографии и справочники. Остановимся подробно на каждом из этих видов изданий.
Рекламные материалы публикуются в Сети наиболее широко. Web страницы с различного рода рекламой можно встретить наиболее часто. Обычно, реклама размещается на своих собственных серверах. Свои собственные страницы имеют почти все фирмы так или иначе связанные с компьютерным бизнесом. Если есть желание и время познакомиться с пресс-релизами Microsoft, IBM, DEC, Apple, Symantec и т.п. нет необходимости читать компьютерные журналы. Фирмы сами публикуют о себе различного сорта информацию, начиная от истории создания и отцах основателях, и кончая характеристиками последних изделий фирмы и прайс-листами. Здесь же можно найти доклады представителей фирмы на различных конференциях и выставках, а также их интервью различного рода специализированным изданиям. Все эти материалы богато иллюстрированы графикой и фотографиями. Часто, можно даже прослушать приветствия или обращения руководителей фирмы к пользователям Web, если конечно позволяют возможности компьютера и его программного обеспечения. Качество этих рекламных материалов часто не уступает печатным их аналогам.
Отдельное место среди материалов Web занимают каталоги. Если речь идет о коммерческой информации или коммерческих изделиях, то их также можно отнести к рекламе, но кроме коммерческого использования Сети, которое по некоторым оценкам составляет 30-40% от всего набора Web-страниц, существует еще и некоммерческое обслуживание пользователей сети, которое осуществляется либо за государственный счет, либо за счет энтузиазма отдельных лиц, которых на удивление много в этом мире наживы и чистогана. В каталогах Web чего только нет: это и списки знаменитых киноактеров, это и оглавления компакт-дисков, это и списки хит-парадов и многое многое другое. Все это иллюстрируется, например, фотографиями кино-див, или записями фрагментов музыкальных композиций. Существуют справочники по античному искусству, справочники по истории авиации или флота, каталоги научной фантастики. Одним словом в Internet есть что почитать, посмотреть и послушать.
Первыми из печатных периодических изданий World Wide Web стали осваивать иллюстрированные журналы. Причин такой активности, видимо несколько. Во-первых это возраст и пол пользователей Internet. По данным многочисленных опросов, проведенных среди лиц использующих сеть в 1995 году боле половины (69%) опрошенных это лица в возрасте от 25 до 45 лет. Наиболее массовую группу пользователей составляют 30-40-а летние мужчины. Женщины составляют не более 20% всех пользователей Сети. Во вторых - это профессиональный состав пользователей и их образование. До 70% занимаются бизнесом или компьютерными технологиями, больше половины имеют высшее образование. Стереотип того, что сетевые технологии - это удел молодых не совсем точен. Студенты и молодежь до 30 составляют не более одно пятой от числа всех пользователей сети. Соответственно и развлекательные журналы делятся в такой же пропорции. Основную массу составляют такие издания как Fortune, Time, Playboy, Penthouse, UFO Library, и т.п.. В последнее время профессионалы из Playboy стали применять принципы опубликования на сети гипертекстовых материалов в полном смысле этого слова. Примером такого материала может считаться "Парк развлечений", где пользователю представляется возможность "походить", посмотреть и побеседовать с обитателями этого мира, подобие игрушки "ходилки-стрелялки". Следует также заметить, что в настоящее время электронные копии печатных изданий - это скорее дайджест печатного издания. Компании выпускающие печатную продукцию с одной стороны заинтересованы в привлечении новых читателей, а с другой стороны нельзя терять традиционных клиентов печатных изданий. Для решения этой проблемы применяется комбинированный подход, который заключается в том, что, во-первых пользователь сети может, не отходя от своего компьютера подписаться на издание, перечислив на счет издательства или компании-посредника необходимую сумму денег, либо списав соответствующую сумму с кредитной карточки. При этом операции с карточками также можно выполнять, используя свой компьютер. Во-вторых, можно подписаться на электронную версию издания. В этом случае после перечисления денег, пользователя регистрируют в информационной службе издания, т.е. присваивают определенное имя и пароль, использую которые пользователь может войти в защищенные разделы базы данных издания. В связи с последней возможностью и расширением средств защиты данных при обмене ими по сети, число коммерческих закрытых для публичного использования информационных ресурсов Internet стало увеличиваться.
Электронные газеты - еще один вид периодических публикаций на сети, который стал осваивать новую технологию Internet - World Wide Web. Электронные газеты появились несколько позже журналов, примерно с задержкой в полгода. Главным препятствием для газетного бизнеса является сложность подготовки публикаций для Сети. Первыми изданиями такого сорта стали Computer World, PC Magazine Daily и другие компьютерные издания. подача материалов в этих газетах отличается от аналогичных материалов в печатном оригинале. Во-первых размер страницы электронного издания ограничен размером экрана дисплея компьютера. Во-вторых при подаче материалов следует учитывать такие возможности современных программ управления отображением информации на экране дисплеев, как одновременное открытие нескольких окон, в которых можно разместить либо разные страницы текста, либо поместить рисунок, поясняющий текст. Это позволяет "уплотнить" информацию на экране дисплея. В обычном печатном издании это просто нельзя реализовать. Авторы электронных изданий также учитывают такую возможность как звуковая подача материала, что чрезвычайно полезно при опубликовании интервью. Кроме того в качестве обзоров часто публикуют не обширный текст, а набор графических материалов: графиков гистограмм, круговых диаграмм, сопровождая их текстовым комментарием. Совершенно очевидно, что это порождает совершенно новый тип издания, сильно отличающийся по форме и оформлению от традиционного печатного оригинала.
Наиболее фундаментальными электронными изданиями на Сети являются, реализованные в технологии World Wide Web аналоги крупных печатных изданий типа Библии или различного рода энциклопедии. Следует сразу оговориться, что о простом копировании текстов в данном случае речь не идет. Материалы такого рода сразу реализуются с учетом ограничений и новых возможностей компьютерных технологий. Пример гипертекстовой организации Книг Нового Завета приведен в предыдущем разделе, поэтому к нему возвращаться не будем, а рассмотрим один из самых крупных проектов такого сорта "Британика Он-лайн". Этот проект связан с организацией в Internet одной из самых старых энциклопедий мира -- энциклопедии "Британика". Электронная версия "Британики" представляет из себя довольно сложный конгломерат информационных технологий. Главным в этой информационной базе данных является представление статей энциклопедии в виде гипертекстовых страниц в формате языка гипертекстовой разметки документов - HTML, который применяется для опубликования материалов в World Wide Web. Каждая статья имеет связи со следующим по порядку в текстовом варианте энциклопедии статьей и статьей предшествующей. Кроме этого каждая статья связана с другими статьями гипертекстовыми ссылками, которые употребляются в тексте статьи, и базой данных персоналий, стран и графических иллюстраций. Кроме этого для навигации по энциклопедии существуют оглавление, индекс и механизм поиска статей по ключевым словам. Оглавление и индекс являются списками гипертекстовых ссылок. При чем, если в оглавлении ссылки указывают на статьи энциклопедии, то в индексе ссылки указывают на списки статей, которые в свою очередь также являются списками гипертекстовых ссылок. Отдельный интерес представляет поисковый аппарат энциклопедии. Он основан на использовании технологии распределенной информационно-поисковой системы Internet -- WAIS (Wide Area Information System). О самой этой системе речь пойдет чуть позже. Здесь мы обращаем внимание читателя на тот факт, что результат работы WAIS -- это список гипертекстовых ссылок на статьи энциклопедии, который система генерирует "на лету". Этот список внешне ни чем не отличается от списка индекса, например, но с точки зрения системы - это совершенно разные объекты. Список индекса реально существует в виде файла базы данных World Wide Web, а списки, которые порождает WAIS, реально не существуют, а являются временными образованием и порождаются запросами пользователя. Зарегистрированные пользователи могут сохранять полученные таким образом списки для последующего использования при работе с системой.
Здесь мы вплотную подошли к понятиям "зарегистрированный пользователь" и "режим доступа" к базе данных "Британика Он-лайн". Данный проект не является благотворительностью и за доступ к ресурсам энциклопедии надо платить денежки. Для пользователя, использующего базу данных в своих "домашних" целях установлена плата в $150 в год, для студентов университетов - $120 в год , для бизнесменов - $300 в год. Подписчиками могут быть не только частные лица, но и организации здесь плата устанавливается в зависимости от масштаба организации, и рода ее уставной деятельности. В каждом конкретном случае размер взноса устанавливается индивидуально. Однако, не все так жестко. Для того, чтобы познакомиться с энциклопедией вовсе не обязательно платить перечисленные выше взносы. Существует два способа определиться: нужна в вашей работе энциклопедия "Британика" или нет. Первый способ -- это демонстрация ее возможностей. Здесь пользователю предлагают пройтись по заранее проложенному маршруту и понять как работает система. Второй путь гораздо интереснее -- это семидневное бесплатное использование энциклопедии. В этом случае читатель должен зарегистрироваться, получить имя и пароль, и после этого он может работать в системе.
Корме "Британики" в Internet существуют и другие энциклопедии, например, энциклопедия научной фантастики или энциклопедия вин. При этом доступ к ним совершенно свободный, и раскошеливаться для этого не требуется. Вообще говоря прежде чем подписываться на что-либо следует как следует просканировать Сеть на предмет наличия в ней интересующих Вас, уважаемый читатель, материалов, и только, если нет ничего подходящего в открытых публичных архивах, следует подписываться на коммерческий информационный сервис.
В этом месте мы подошли к проблеме поиска информации в Internet. В свое время любая организация имела в своей структуре информационные подразделения. В научных организациях они назывались отделами научно-технической информации. Главной задачей этих подразделений был поиск информации по профилю организации, ведение тематической библиотеки и оперативное информирование специалистов о материалах периодики. Мнение о том, что в Internet все можно найти самому является ошибочным. Сеть слишком велика, чтобы каждый ее пользователь мог просмотреть все имеющиеся информационные архивы даже если они и имеют необходимые поисковые службы. Поэтому одной из форм деятельности на Сети стала организация коммерческих информационных служб. Самыми популярными коммерческими службами этого типа являются Yahoo и Galaxy.
Информационные службы представляют из себя иерархические списки информационных ресурсов очень похожие на предметные каталоги библиотек. Как правило, кроме предметного каталога, имеется каталог информационных ресурсов Internet, упорядоченный по странам, и специальная страница для запуска запросов с использованием ключевых слов. Пользователи могут использовать каждую из этих альтернатив по своему вкусу. Для первого знакомства с системой обычно используют тематический каталог, и перемещаясь по нему, ищут нужные World Wide Web страницы. Здесь, правда следует учитывать тот факт, что представление о предметной области и терминах, которые ее характеризую у создателей системы и у пользователя могут серьезно различаться. Для адаптации необходимо определенное время, которое на первый взгляд тратится в пустую. Однако, тоже самое происходит и при работе с обычными информационно-поисковыми системами и при первом знакомстве с новыми журналами. Создатели информационных каталогов стремятся приблизится к совершенству, но это пока не очень удается. В Сети нет единого тематического разбиения типа Универсальной Десятичной классификации, принятой в библиотечном деле, поэтому предметные каталоги могут значительно отличаться один от другого. Так каталог World Wide Web Consortium является очень длинным. Первая страница занимает несколько экранов дисплея, что, вообще-то, не очень удобно. Каталоги Yahoo и Galaxy разбиты на множество вложенных подкаталогов. Это делает каждую страницу более компактной и удобной при просмотре. Однако, здесь также есть свои минусы: большое количество вложений страниц друг в друга может привести к потере ориентировки пользователя в дереве каталога.
Национальные ресурсы также имеют различные системы упорядочивания. В ряде случаев за основу берется административное деление страны, а в других ресурсы упорядочиваются по принадлежности к сфере человеческой деятельности, например, ресурсы университетов, ресурсы правительства, коммерческие информационные ресурсы и т.п.. Есть каталоги, в которых оба подхода сочетаются и тогда в базе данных национальных информационных ресурсов, содержится два оглавления или более.
Поиск страниц по ключевым словам - это неотъемлемая часть любого информационного каталога Сети. Обычно, для поиска используют специальные поля ввода ключевых слов, которые можно соединять в поисковые запросы при помощи слов связок "или" "и". В данном случае слово "и" показывает, что ключевые слова должны одновременно встречаться в искомом документе, а слово "или" требует вхождение в документ одного из указанных слов. Поисковая страница может быть совмещена с первой страницей каталога, как это сделано в Yahoo, или быть дополнением каталога и загружаться отдельно. Как это реализовано в Galaxy. При формировании запроса можно воспользоваться простой формой, когда просто вводится список слов, или перейти к более сложной структуре, где можно указать даже части документов где следует проводить поиск, а где нет. Результаты поиска выдаются в виде списка названий найденных документов, который является также страницей Web. Отличие этой страницы от других заключается в том, что такой страницы не существует ни в одной базе данных сети. Она создается "на лету" поисковой программой, но если система позволяет, то может быть сохранена в качестве одной из страниц пользователя.
Завершая разговор о каталогах, следует обратить внимание на каталог электронных изданий, который активно использовался автором для подготовки данного текста. Авторы этого каталога просмотрели всю Internet и включили в свой список только те ссылки, которые связаны с опубликованием материалов на сети. Название этого каталога EDOC - Электронные Документы. Как следует из названия в этом каталоге указаны не только газеты, журналы, справочники, но и любые типы электронных текстов и даже нетекстов (каталоги живописи, музеев, выставок и т.п.).
Последним видом электронных документов, о которых хочется рассказать, являются издания подготовленные с учетом новых компьютерных технологий и специально для опубликования в Сети. Издать эти материалы в виде обычных книг просто нельзя. Всю эту продукцию принято называть виртуальной литературой. Виртуальная литература может быть разделена на специальную, развлекательную и исследования в области виртуальных публикаций. Специальную литературы составляют специализированные журналы, специализированные справочники и учебники. Развлекательная литература - это иллюстрированные журналы, художественная литература (поэзия, научная фантастика, сказки для взрослых и детей и т.п.), а исследования - это публикации призванные продемонстрировать новые способы организации информации и ее представления для пользователей Internet.
Специальные журналы - это, главным образом компьютерные издания типа журнала Национального Центра Прикладного Программного Обеспечения для Суперкомпьютеров. "Access". В данном издании каждая статья оформлена в виде гипертекста. В тело статьи встроены графика таблицы и даже результаты динамического моделирования в виде кинороликов. Как правило, графика подготавливается отдельно от текста и демонстрируется по специальному запросу пользователя. В свое время, очень интересный материал был представлен по моделированию процесса столкновения кометы Шумейкера-Леви с планетой Юпитер. общение об этом эксперименте сопровождалось короткими фильмами, показывающими в различных ракурсах процесс столкновения. Интересным было и сообщение Национального Агентства по Аэронавтике и Исследованию Косметического Пространства США (NASA), в котором динамически отображалась поверхность Земли во время полета одного из американских космических кораблей в 1995 году.
Справочники - это, пожалуй первые издания на Сети, которые были реализованы в технологии World Wide Web. В 1994 году лучшим специальным изданием "Всемирной паутины" был признан справочник по онкологии, который был рассчитан на три типа различных пользователей: пациентов, студентов и специалистов. Справочник содержал информацию как о типичных онкологических заболеваниях, так и о специальных случаях, с которыми может столкнуться врач при лечении различных раков.
Учебники - это третий тип гипермедийных изданий, которые доступны по Сети. Ни один из видов виртуальной литературы не имеет более глубокого обоснования и более детальной проработки реализаций, чем распределенный в сети учебник. В США, в рамках работ по созданию информационной супермагистрали, был запущен проект виртуального публичного университета. В качестве обоснования возможности такого учебного заведения был проведен исторический анализ различных форм высшего образования начиная с античности и до сегодняшнего времени. Учитывая уровень развития современной вычислительной техники было признано, виртуальный публичный университет вполне реален и будет обеспечивать своих студентов достаточным уровнем профессиональной подготовки. Кроме функций стандартного колледжа на такой университет можно было бы легко возложить и задачи переподготовки кадров промышленности. Естественно, что университет не может обойтись без учебных пособий. Но виртуальном университете и пособия должны быть виртуальными. Для медицинских факультетов не надо теперь ходит в анатомичку и резать трупы. все это можно проделывать в условиях виртуальной реальности или в конце концов за экраном дисплея. Конечно, существует мнение, и оно достаточно обосновано, что реальная практика никогда не может быть замена моделями. Примеров тому множество. Но в данном случае, видимо стоит говорить о сбалансированном сочетании использования программных средств и практических занятий. Возвращаясь к пособиям виртуального университета, можно сказать, что историки теперь могут за своим рабочим столом, просматривать архивные материалы и видеозаписи исторических событий, слушать голоса исторических личностей, юристы участвовать в воображаемых судебных разбирательствах, а физики проводить опыты по делению радиоактивных материалов не угрожая при этом окружающим. Одним словом - это фантастика, но фантастика реальная, элементы которой уже реализованы.
Когда специалисты стали всерьез заниматься проблемами гипермедийных и гипермультимедийных технологий, которые мы в первой части окрестили гипертекстом, то часто высказывалось мнение о том, что компьютер становится новым печатным станком Гуттенберга, который изменит представление о восприятии информации и формах ее организации. Сейчас грань, которая отделяет большинство граждан развитых стран от этого нового печатного станка, практически исчезла. Мощности современных персональных компьютеров достаточны для установки сложных программ представления комбинированной информации, а современные системы коммуникаций способны обеспечить необходимый сервис для каждого пользователя телефона к громадным сетевым информационным ресурсам. В преддверии этого прорыва многие энтузиасты начинают создавать гипертекстовую художественную литературу. В этом желании особо выделяются сочинители стихов и фантастики. Параллельное изложение материала от нескольких лиц, представление различных взглядов на одно и тоже событие - это норма современной гипертекстовой литературы. Уже сейчас можно легко назвать кандидатов на гипертекстовые реализации и из числа обычных художественных произведений: пьесы, диалоги, детективы. Научная фантастика выделяется из этого списка тем, что позволяет реализовать видовые эффекты, которые очень трудно описать. Однако, существует мнение, что там где появляется гипертекст, исчезает литература. Если рассматривать литературу как способ выражения мыслей и искусство описания реальности, то такое мнение отчасти является верным.
Последним объектом, которого хотелось бы коснуться при описании Internet, как виртуального издательства, являются системы типа MUD (Multi-User Dungeons). На русский язык этом можно перевести, как "Многопользовательские подземелья", которые стали развитием игры "Подземелья и Драконы". Если считать, что комиксы -- это издания, то тогда и "подземелья" - это тоже электронные издания. Дело в том, что любую сказку, детектив, хронику можно также организовать в виде такой распределенной программной среды, которая будет имитировать первоисточник. Однако, сетевая технология вносит в такую реализацию свои, присущие только ей черты -- возможность одновременной работы нескольких пользователей и реальный масштаб времени. MUD -- это, фактически, виртуальная вторая жизнь в выдуманной среде. можно расписать по ролям, и в этом случае каждый ее персонаж начинает действовать в соответствии с законами своего характера, причем это реальный человек, который может находится за многие тысячи километров от других участников действа. До последнего времени MUD, как и весь Internet, был уделом любителей, но для качественной реализации графики и видео нужны профессионалы и большие материальные вложения. По мере увеличения числа пользователей сети, видимо будет и развиваться индустрия виртуальных сред и их коммерческое использование. Психологи уже сейчас предвидят новые проблемы, которые вызовет эта технология, новые виды психических расстройств, маний и т.п.. На их взгляд главная проблем заключается в том, что общество технически готово к реализации виртуальных сред, а юридически и морально не готово.
Но Сеть стала уже серьезным фактором жизни развитых стран. Президент США в 1995 году объявил о создании информационной магистрали, как о национальной программе, Европейское сообщество в 1994 году рассматривало программу информатизации Европы, в России успехи в деле использования компьютерных сетей скромнее, но тем не менее в стране развивается около трех крупных проектов подключения к Internet сферы образования и науки. Видимо, Internet станет одним из основных средств международных коммуникаций и развитие издательского дела в этом направлении вполне оправдано и своевременно.
[Назад]
[Содержание]
[Вперед]