Система гипермедиа WWW
WWW (World Wide Web - всемирная паутина) - самый популярный и инте-
ресный сервис Интернет сегодня, самое популярное и удобное средство ра-
боты с информацией. Самое распространенное имя для компьютера в Интернет
сегодня - www, больше половины потока данных Интернет приходится на долю
_WWW. Количество серверов WWW сегодня нельзя оценить сколько-либо точно,
но по некоторым оценкам их более 30 тысяч. Скорость роста WWW даже выше,
чем у самой сети Интернет. Сегодня WWW - самая передовая технология Ин-
тернет, и она уже становится массовой технологией - возможно, недалек
тот день, когда каждый человек, знающий, что такое телефон, будет знать,
что такое _WWW.
Подробное описание WWW - тема отдельной статьи, поэтому здесь будут
приведены самые общие понятия и представления, которые нужно иметь о
WWW, как об одном из сервисов Интернет. WWW - информационная система,
которой весьма непросто дать корректное определение. Вот некоторые из
эпитетов, которыми она может быть обозначена: гипертекстовая, гиперме-
дийная, распределенная, интегрирующая, глобальная. Ниже будет показано,
что понимается под каждым из этих свойств в контексте _WWW.
WWW работает по принципу клиент-сервер, точнее, клиент-серверы: су-
ществует множество серверов, которые по запросу клиента возвращают ему
гипермедийный документ - документ, состоящий из частей с разнообразным
представлением информации (текст, звук, графика, трехмерные объекты и т.
д.), в котором каждый элемент может являться ссылкой на другой документ
или его часть. Ссылки эти в документах WWW организованы таким образом,
что каждый информационный ресурс в глобальной сети Интернет однозначно
адресуется, и документ, который Вы читаете в данный момент, способен
ссылаться как на другие документы на этом же сервере, так и на документы
(и вообще на ресурсы Интернет) на других компьютерах Интернет. Причем
пользователь не замечает этого, и работает со всем информационным прост-
ранством Интернет как с единым целым. Ссылки WWW указывают не только на
документы, специфичные для самой WWW, но и на прочие сервисы и информа-
ционные ресурсы Интернет. Более того, большинство программ-клиентов WWW
(browsers, навигаторы) не просто понимают такие ссылки, но и являются
программами-клиентами соответствующих сервисов: ftp, gopher, сетевых но-
востей Usenet, электронной почты и т.д. Таким образом, программные
средства WWW являются универсальными для различных сервисов Интернет, а
сама информационная система WWW играет интегрирующую роль.
Вот некоторые термины, использующиеся в WWW - конечный пользователь
может их и не знать, но рано или поздно они Вам встретятся и они не
должны вызвать у Вас недоумение. Первый термин - html (hypertext markup
language, язык разметки гипертекста). Это формат гипермедийных докумен-
тов, использующихся в WWW для предоставления информации. Формат этот не
описывает то, как документ должен выглядеть, но его структуру и связи.
Внешний вид документа на экране пользователя определяется навигатором -
если Вы работаете за графическим или текстовым терминалом, то в каждом
случае документ будет выглядеть по-своему, но структура его останется
неизменной, поскольку она задана форматом html. Имена файлов в формате
html обычно оканчиваются на html (или имеют расширение htm в случае, ес-
ли сервер работает под MS-DOS или Windows). Второй термин - URL (uniform
resource locator, универсальный указатель на ресурс). Так называются те
самые ссылки на информационные ресурсы Интернет. Еще один термин - http
(hypertext transfer protocol, протокол передачи гипертекста). Это назва-
ние протокола, по которому взаимодействуют клиент и сервер _WWW.
WWW - сервис прямого доступа, требующий полноценного подключения к
Интернет, и более того, часто требующий быстрых линий связи, в случае,
если документы, которые Вы читаете, содержат много графики или другой
нетекстовой информации. Однако существуют мосты, позволяющие получать
информацию, содержащуюся в WWW, посредством электронной почты. Возмож-
ность такая есть, но таких мостов мало, да и толку от них немного - что-
бы успешно использовать возможности WWW, требуется прямой доступ в Ин-
тернет, а при его отсутствии теряются многие плюсы, создавшие WWW сегод-
няшнюю популярность. Кроме того, некоторые возможности, имеющиеся при
обычной работе, просто недоступны через электронную почту. Это, в основ-
ном, относится к элементам интерактивности в_WWW. Например, в языке html
поддерживаются формы. Пользователь вводит в них некоторую информацию,
которая затем может передаваться на сервер. Таким образом заполняются
анкеты, регистрационные карты, проводятся социологические опросы. Напри-
мер, на сервере CNN можно было передать свое отношение к делу Симпсона,
а в электронном журнале SunWorld OnLine можно выразить свою удовлетво-
ренность статьями: не слишком ли коротко, достаточно ли информативно и
т.д.
Практически любая информация, которая предоставляется в публичный
доступ, отображается средствами _WWW. Если какая-та информация не может
быть помещена в WWW, то это обусловлено некоторыми ограничениями и не-
достатками _WWW. Во-первых, соединение между клиентом и сервером WWW од-
норазовое: клиент посылает запрос, сервер выдает документ, и связь пре-
рывается. Это значит, что сервер не имеет механизма уведомления клиента
об изменении или поступлении новых данных. Проблема решается сегодня
несколькими способами: разрабатывается новая версия протокола http, ко-
торая будет позволять длительное соединение, передачу данных в несколько
потоков, разделение каналов передачи данных и управления ими. Если она
будет реализована и станет поддерживаться стандартным программным обес-
печением WWW, то это решит снимет вышеописанные недостатки. Другое путь
предлагается с использованием навигаторов, которые смогут локально ис-
полнять программы на интерпретируемых языках - как это сделано в проекте
Java компании Sun Microsystems, о котором будет рассказано ниже. Следую-
щая проблема WWW - недостаточность языка описания документов html для
решения многих задач. Например, html не предусматривает вывод математи-
ческих символов, и текста уменьшенного по сравнению со стандартным раз-
мера. Эта задача решается тем же образом, что и предыдущая - разработкой
новых версий языка html и новых типов навигаторов, расширяемых произ-
вольным образом.
Усилия эти затруднены децентрализованностью WWW - например, сегодня
стандартом становятся не те расширения языка html, которые лучше, но те,
которые привносятся самыми популярными навигаторами, такими как Netscape
Navigator. Децентрализованность несет и множество других проблем: от-
сутствие общего каталога серверов и средств тотального поиска по ним.
Однако и эта проблема решается, причем более успешно, чем предыдущие -
сегодня есть и каталоги, и поисковые системы, которые, если и не являют-
ся глобальными, то тем не менее охватывают достаточно большую часть до-
кументов WWW, чтобы быть полезными и успешно применяться для поиска ин-
формации.
В заключение - простой совет: если Вы еще не работаете с WWW, то нач-
ните. В подавляющем большинстве случаев это лучшее решение Ваших задач
при работе с глобальными информационными сетями.