Формат
|
Макс. глуб. цвета
|
Макс. число цветов
|
Макс. размер
изображения,
пиксел
|
Методы
сжатия
|
Кодирование нескольких
изображений
|
BMP
|
24
|
16'777'216
|
65535x65535
|
RLE*
|
-
|
GIF
|
8
|
256
|
65535x65535
|
LZW
|
+
|
JPEG
|
24
|
16'777'216
|
65535x65535
|
JPEG
|
-
|
PCX
|
24
|
16'777'216
|
65535x65535
|
RLE
|
-
|
PNG
|
48
|
281'474'976'710'656
|
2147483647x
2147483647
|
Deflation (LZ77)
|
TIFF
|
24
|
16'777'216
|
всего 4'294'967'295
|
LZW, RLE и другие*
|
+
|
Кроме этого
следует отметить, что наиболее компактными являются форматы JPEG, GIF, PNG,
которые, к тому же, платформенно-независимы. Формат BMP является стандартным
форматом Windows, однако большого распространения не получает из-за непомерных
размеров файлов, особенно при сохранении графики с глубиной цвета 24
бит/пиксел. Касаемо формата TIFF следует заметить, что он, как и JPEG, GIF,
является частично платформенно-независимым, однако слишком объемен для
использования в сети и, что еще хуже, слишком сложен для интерпретации. Кроме
того любые программные изделия, в том числе и просмотровщики графических файлов,
содержащие код для кодирования / декодирования данных по алгоритму LZW
должны распространяться по соответствующему лицензионному соглашению компании
Unisys Corp., владельца алгоритма, что дополнительно удорожает эти продукты.
Дальнейшее
рассмотрение мне хотелось бы обратить к межплатформенным форматам, принятым в
Internet в качестве стандарта де-факто: JPEG, GIF, PNG.
Сразу хочу
заметить, что формату PNG (Portable Network Graphic) не будет уделено много
внимания, хотя, возможно, он его и заслуживает. Это является следствием того,
что формат этот появился не так давно и несмотря на все свои достоинства еще не
получил всеобщего признания.
Итак,
фактически перед человеком или компанией, которая намерена размещать на своих
дисках большое количество изображений и, возможно, предоставлять их для
использования в Internet, встает дилемма: что выбрать GIF или JPEG.
Формат GIF,
разработанный компанией CompuServe, и изначально предлагавшийся именно как
формат для обмена изображениями в сети является форматом с достаточно высокой
степенью сжатия изображения. Кроме того, GIF обладает дополнительными
возможностями, которые делают его использование в сети привлекательным. Первая
– это возможность изменения порядка вывода на экран строк изображения, с
заполнением промежутков между ними временной информацией. Визуально это
выглядит так, что по мере загрузки из сети (что происходит нередко с
катастрофически низкой скоростью) изображение на экране появляется как бы «в
низком качестве», а затем, по мере подгрузки дополнительной информации,
восстанавливает пропущенные строки изображения. Таким образом, пользователь еще
до окончания процесса загрузки может получить представление о содержимом
изображения и прервать загрузку ненужного файла большого размера. Вторая
возможность заключается в хранении в одном файле боле чем одного изображения,
что делает возможной элементарную покадровую анимацию. Еще одной отличительной
особенностью GIF является то, что один из цветов можно объявить «прозрачным», и
тогда при выводе изображения те его части, которые выкрашены этим цветом не
будут выводиться на экран и под ними будет виден фон, на который изображение
накладывается. Самым же большим недостатком GIF является то, что он может
хранить изображение, состоящее максимум из 256 цветов, что в последнее время
становиться все менее и менее приемлемым. Вместе с этим, пользователей GIF
преследует такая же неприятность, что и в случае с форматом TIFF: GIF также
использует LZW-сжатие, а следовательно, каждое изображение может
распространяться только при наличии соответствующего лицензионного соглашения.
Формат JPEG
является TrueColor-форматом, то есть может хранить изображения с глубиной цвета
24 бит/пиксел. Такой глубины цвета достаточно для практически точного
воспроизведения изображений любой сложности. Более глубокое представление цвета
(например 32 бит/пиксел) реально оказывается практически неотличимым от данного
при просмотре на современных мониторах и при распечатке на большинстве
доступных принтеров. Такая глубина цвета может оказаться полезной разве только
в издательской деятельности. JPEG в общем обладает более высокой степенью
сжатия изображений, нежели GIF (подробнее этот аспект описан в главе «Практики
использования JPEG»), но не обладает возможностью хранить несколько изображений
в одном файле. Недавно была разработана модификация формата JPEG, получившая
название Progressive JPEG, что приблизительно можно перевести на русский язык
как «постепенный JPEG», который предназначен для тех же задач, что и
чересстрочное отображение GIF-изображений. Это сделало формат JPEG еще более
привлекательным в качестве сетевого стандарта. Однако, и в JPEG присутствуют
свои недостатки. В отличие от GIF, который может эффективно сжимать изображения
практически любого содержания, JPEG ориентирован прежде всего на реалистичные
изображения, то есть изображения фотографической направленности, и качество
сжатия значительно ухудшается при обработке изображений с четко очерченными
линиями и границами цветов.
Таким
образом, нельзя до сих пор сделать окончательного выбора в пользу одного или
другого формата. Однако, мне формат JPEG представляется более интересным с
точки зрения оригинального алгоритма сжатия и больших возможностей для развития
в перспективе. Также формат JPEG следует считать однозначно более гибким: он
позволяет выбирать между хорошим качеством изображения или хорошей степенью
сжатия и находить приемлемый компромисс для каждого конкретного случая. Поэтому
все дальнейшее исследование посвящено именно этому формату.
1.3 Поисковые
системы и правила поиска информации
Удобство
Интернета в том, что в нем можно найти практически любую информацию, даже когда
мы не знаем точно, где она находиться. Если адрес страницы с интересующим нас
материалом неизвестен и страницы с подходящими ссылками тоже нет, приходиться
разыскивать материалы по всему Интернету. Для этого применяют поисковые системы
Интернета – специальные web-узлы, позволяющие найти нужный документ.
Существует
два основных метода поиска в Интернете. В первом случае вы ищите web-страницы, относящиеся к
определенной теме. Поиск производится путем выбора тематической категории и
постепенным ее сужением. Подобные поисковые системы называют поисковыми
каталогами. Они удобны, когда вам нужно вые познакомиться с новой для
себя темой или добраться до широко известных «классических» ресурсов по данной
теме. Второй способ поиска используется, когда тема носит узкий, специфический
характер или нужны редкие, малоизвестные ресурсы. В этом случае вы должны
представлять себе, какие ключевые слова должны встретиться в документе по
интересующей вас теме. Эти слова надо выбрать таким образом, чтобы они, скорее
всего, имелись в нужных документах, не имеющих отношения к выбранной теме.
Системы, позволяющие выполнять подобный поиск, называют поисковыми указателями.
Поисковые каталоги отличаются от поисковых указателей не только методом поиска,
но и способом формирования. Любая поисковая система Интернета состоит из двух
частей. Специализированная web-страница, доступная всем желающим и позволяющая
выполнять поиск, опирается на большую, постоянно пополняемую и обновляемую базу
данных, которая содержит сведения о ресурсах Интернета.
Способ
пополнения этой базы данных зависит от типа поисковой системы, поисковых
каталогов самое главное – это точность отбора. Каждый найденный ресурс должен
быть полезным. Тематика страницы определяется или проверяется вручную. Из-за
этого объем поисковых каталогов относительно невелик. Когда объем приближается
к миллиону страниц, объем ручного труда настолько велик, что дальнейший рост
каталога останавливается.
Поисковые
указатели, напротив, ориентированы на широту охвата. С определением слов,
имеющихся на web-странице, вполне справляется автоматика, данных поискового
указателя может охватывать многие миллионы web-страниц. При этом
выполнять поиск в указателе труднее, чем в каталоге, потому что одни те же
ключевые слова могут встречаться на web-страницах, посвященным разным темам.
Информационно-поисковые
системы размещаются в Интернете на общедоступных серверах. Основой поисковых
систем являются так называемые поисковые машины, или автоматические индексы.
Специальные программы-роботы (известные также как пауки) в автоматическом
режиме периодически обследуют Интернет на основе определенных алгоритмов,
проводя индексацию найденных документов. Созданные индексные базы данных
используются поисковыми машинами для предоставления пользователю доступа к
размещенной на узлах Сети информации. Пользователь в рамках соответствующего
интерфейса формулирует запрос, который обрабатывается системой, после чего в
окно браузера выдаются результаты обработки запроса. Механизмы обработки
запросов постоянно совершенствуются, и современные поисковые системы не просто
перебирают огромное число документов. – Поиск ведется на основе
оригинальных и весьма сложных алгоритмов, а его результаты анализируются и
сортируются таким образом, чтобы представленная пользователю информация в
наибольшей степени соответствовала его ожиданиям.
В настоящее время в развитии поисковых систем наблюдается тенденция объединения
автоматических индексных поисковых машин и составляемых вручную каталогов
Интернет-ресурсов. Ресурсы этих систем удачно дополняют друг друга, в
объединение их возможностей вполне логично.
Тем
не менее исследования возможностей поисковых машин, даже самых мощных из них,
таких как AltaVista или HotBot, показывают, что реальная полнота охвата ресурсов Всемирной
паутины отдельной такой системой не превышает 30%. Поэтому не стоит
ограничиваться использованием какой-либо одной из них. Если вам не удалось
отыскать интересующую вас информацию с помощью одной системы, попробуйте
воспользоваться другой.
Каждая
поисковая Система имеет свои особенности и, и качество полученного результата
зависит от предмета поиска и точности формулировки запроса. Поэтому, приступая
к поиску информации, прежде всего, нужно четко представлять себе, что именно и
где вы хотите найти. Например, зарубежные системы поражают числом
проиндексированных документов. Для поиска в области профессиональных знаний,
особенно информации на иностранном языке, такие системы, как AltaVista, HotBot или Northern, подходят наилучшим
образом.
Однако
для поиска информации на русском языке, особенно в российской части Интернета,
лучше приспособлены русские поисковые машины. Во-первых, они специально
ориентированные именно на русскоязычные ресурсы Сети и, как правило, отличаются
большей полнотой охвата и глубиной исследования эти ресурсов. Во-вторых,
российские системы работают с учетом морфологии русского языка, то есть в поиск
включаются все формы искомых слов. Российские системы лучше учитывают и такую
исторически сложившуюся особенность российских Интернет-ресурсов, как
сосуществование нескольких кодировок кириллицы.
2.
Обзор и характеристика поисковых систем сети Internet
2.1 Rambler
Для поиска
русскоязычной информации в Интернете лучше использовать русские поисковые
системы. В этом опыте и в следующих других мы будем искать информацию с помощью
нескольких систем, предназначенных для поиска в русскоязычной части Интернета.
Как вы увидите, принципиально они не отличаются от всемирных поисковых систем.
Так как мы уже рассмотрели несколько систем, и вы знаете общие принципы поиска
информации в Интернете, то в дальнейших опытах мы не будем подробно
останавливаться на всех тонкостях. Так как эти системы общаются с вами на
русском языке, то вы сможете самостоятельно изучить их, используя знания,
полученные вами при выполнении предыдущих опытов.
Выполним
поиск с помощью системы Рамблер. Как вы увидите, эта система обладает удобной
системой поиска и выдачи найденной информации.
Вы можете
выполнить поиск как во Всемирной паутине, так и в группах новостей, а также в
каталоге этой системы и в товарах. Кроме простого запроса имеется возможность
работы с детальными запросами. Но мы выполним простой запрос, как и для других
русских поисковых машин.
Ø
Введите
в поле ввода запроса слова поиск Интернет. Мы хотим найти документы,
одновременно содержащие слово «поиск» и слово «Интернет».
Ø
Нажмите
кнопку Найти!. Мы получили список найденных страниц.
Список
найденных страниц удобно организован. Вначале расположены ссылки на страницы,
наиболее соответствующие критериям поиска. Наиболее полно удовлетворяют запросу
документы, в которых искомые слова часто повторяются и стоят недалеко друг от
друга. Кроме того, в кратком фрагменте текста найденного документа выделены
обнаруженные ключевые слова.
В системе
Рамблер можно посмотреть слова, которые наиболее часто используются в запросах
пользователей. Кроме того, Рамблер ведёт список наиболее популярных Российских
узлов Интернета. Так как вся информация в системе представлена на русском языке
мы надеемся, что вы сможете самостоятельно в дальнейшем познакомиться с
возможностями данной поисковой машины.
2.2 Yandex
Поисковая
система Яndех располагается по адресу www.уаndех.ru. Она была официально
введена в эксплуатацию 23 сентября 1997 года.
Что
же такое Яndех? Вот как отвечают на этот вопрос создатели системы. Яndех – это полнотекстовая
информационно-поисковая система (ИПС), учитывающая морфологию русского и
английского языков. Система Яndех предназначена для поиска информации в
электронных текстах различной структуры и разных способов представления
(форматов). Яndех (произносится «яндекс») расшифровывается как «языковый индекс»
или, в английском написании, Yandex – Yet Another INDEX. Также можно рассматривать Яndех как частичный перевод
слова Index с английского на русский язык («I» означает «Я»).
В
основе поисковой системы Yandex. Ru лежит системное ядро, общее для всех продуктов с
префиксом Яndex (Яndex. Site, Яndex. Lib, Яndex. Dict, Яndex.СD). Первые продукты серии Яndex (Яndex. Site, Яndex. Dict) были представлены
широкой публике 18 октября 1996 года на выставке Netcom’96. Поисковая машина для
«русского Интернета». явилась естественным продолжением линии Яndex. Как уже говорилось, в
хорошем вопросе содержится половина ответа. Искать и находить нужное в ворохе
текстов в Интернете – умение не только поисковой системы, мо и пользователя,
задающего запрос. Яndex не требует от пользователя знания специальных команд для поиска.
достаточно набрать вопрос («где найти дешевые компьютеры» или «нужны телефоны
Москвы и Московской области»), и вы получите результат – список страниц, где
встречаются эти слова. Независимо от того, в какой форме вы употребили слово в
запросе, поиск учитывает все его формы по правилам русского языка. Например,
если задан запрос идти, то в результате поиска будут найдены ссылки на
документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.
Яndex работает не только с
языковыми запросами, но и позволяет выполнять поиск только на определенных
серверах ИЛИ же исключить из поиска заведомо ненужные серверы. Появилась
возможность поиска изображений по подписям к ним и по именам файлов. Также
стали доступными для поиска такие объекты, как сценарии, апплеты и стили (поиск
осуществляется по названию). Удобная работа с новыми возможностями предлагается
на странице расширенного поиска, где сложный язык запросов сведен к заполнению
полей в форме. Кроме стандартной сортировки результатов – по релевантности (то
есть по степени соответствия запросу), можно отсортировать документы по дате
обновления. Интересной особенностью системы является возможность поиска в
Яндексе в любом месте Интернета. Для этого нужно загрузить с сайта www. AltaVista.com) – одна из старейших поисковых
систем в Интернете. Первый web-индекс был представлен компанией в 1995 году.
Ядро поисковой системы обязано своим рождением странной особенности
исследовательской лаборатории компании Digital Equipment Corp. Сотрудники этой
лаборатории зачем-то хранили всю свою электронную переписку за последние 10
лет. Чтобы эта куча информации не просто занимала дисковое пространство, а
приносила хоть какую-то пользу, была создана программа для индексирования
документов и поиска нужных слов в ворохе пожелтевшей от времени электронной
корреспонденции. Система получилась настолько удачной, что впоследствии с
успехом перекочевала на просторы Всемирной паутины.
Индекс
AltaVista содержит документы на
более чем 25 языках. Локализованные версии сайта AltaVista располагаются в доменах
20 стран. В область поиска можно включить документы на всех поддерживаемых
языках или только в документах на определенном языке, а на специальной странице
можно узнать несколько языков для поиска на всех выбранных языках одновременно.
Выводы
и предложения
настоящее
время в сети Internet используются практически все известные линии связи от
низкоскоростных телефонных линий до высокоскоростных цифровых спутниковых
каналов. Операционные системы, используемые в сети Internet, также отличаются
разнообразием. Большинство компьютеров сети Internet работают под ОС Unix или
VMS. Широко представлены также специальные маршрутизаторы сети типа NetBlazer
или Cisco, чья ОС напоминает ОС Unix.
Фактически
Internet состоит из множества локальных и глобальных сетей, принадлежащих
различным компаниям и предприятиям, связанных между собой различными линиями
связи. Internet можно представить себе в виде мозаики сложенной из небольших
сетей разной величины, которые активно взаимодействуют одна с другой, пересылая
файлы, сообщения и т.п.
Примером
топологии сети Internet может служить сеть Х-Атом, состоящая из нескольких
подсетей, и в то же время являющаяся фрагментом всемирной сети Internet.
На
сегодняшний день в мире существует более 130 миллионов компьютеров и более 80%
из них объединены в различные информационно-вычислительные сети от малых
локальных сетей в офисах до глобальных сетей типа Internet. Всемирная тенденция
к объединению компьютеров в сети обусловлена рядом важных причин, таких как
ускорение передачи информационных сообщений, возможность быстрого обмена
информацией между пользователями, получение и передача сообщений (факсов, E – Mail
писем и прочего) не отходя от рабочего места, возможность мгновенного получения
любой информации из любой точки земного шара, а так же обмен информацией между
компьютерами разных фирм производителей работающих под разным программным
обеспечением.
Такие
огромные потенциальные возможности которые несет в себе вычислительная сеть и
тот новый потенциальный подъем который при этом испытывает информационный
комплекс, а так же значительное ускорение производственного процесса не дают
нам право не принимать это к разработке и не применять их на практике.
Поэтому
необходимо разработать принципиальное решение вопроса по организации ИВС
(информационно-вычислительной сети) на базе уже существующего компьютерного
парка и программного комплекса отвечающего современным научно-техническим
требованиям с учетом возрастающих потребностей и возможностью дальнейшего
постепенного развития сети в связи с появлением новых технических и программных
решений.
Internet продолжает
развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на
распространение и получение информации в мире. Однако в этом информационном
океане бывает не очень легко найти необходимый документ. Следует также иметь в
виду, что в сети наряду с давно действующими серверами возникают новые.
Помимо
серверов «общего» назначения имеются специализированные сайты в той или иной
области, как например для физики высоких энергий – http://xxx.lanl.gov.
При
импортировании файлов статей следует так же иметь в виду, что часто они
хранятся в PostScript формате (с расширением, PS’’, EPS’’) предназначенном для
распечатывания на лазерном принтере, поэтому в этом случае, после их получения
для просмотра и печати на матричном или струйном принтере следует использовать
специальную программу, например GhostView.
Не вызывает
сомнения, что использование Internet в научной работе позволяет получать самую,
горячую’’ информацию и поддерживать контакт с коллегами в мире.
Есть
предположение, что Интернет вытеснит и заменит книги. Сейчас этому препятствует
ряд факторов. Во-первых, отсутствие комфорта при чтении книг с монитора
компьютера. И хотя портативные устройства для чтения электронных текстов уже
существует, разрешение их экранов явно недостаточно. Во-вторых, не до конца
разработаны авторские права на электронные публикации.
Интернет в
перспективе значительно потеснит традиционные средства массовой информации
благодаря гибкости, оперативности и интерактивности.
Сегодня
множество людей неожиданно для себя открывают для себя существование глобальных
сетей, объединяющих компьютеры во всем мире в единое информационное
пространство, которое называется Internet. Что это такое, определить непросто. С
технической точки зрения Internet – это объединение транснациональных компьютерных
сетей, работающих по различным протоколам, связывающих всевозможные типы
компьютеров, физически передающих данные по всем доступным типам линий – от
витой пары и телефонных проводов до оптоволокна и спутниковых каналов. Большая
часть компьютеров в Internet связано по протоколу TCP/IP. Можно сказать, что Internet – это сеть сетей,
опутывающая весь земной шар.
Список
рекомендуемой литературы
1. Информатика / Курносов А.П.,
кулев С.В., Улезько А.В. и др.; Под ред. А.П. Курносова.-М: КолосС,
2005. – 72 с. (Учебники и учеб. пособия для студентов высш. учеб.
заведений)
2. Практикум по
информатике: Учеб. пособие / Под ред. Курносова А.П. – Воронеж: ВГАУ, 2004.
-239 с.
3. Информатика. Учебник.
– 3-е изд., перераб./ Под ред. Н.В. Макаровой. – М.:Финансы и статистика,
2002. – 256 с.
4. Информатика. Базовый
курс / Симонович С.В. и др.-Спб.: Питер, 2006. – 639 с.: ил.
5. Крупник А.Б. Поиск
в Интернете: самоучитель. – 2-е изд. – СПБ.: Питер, 2004. – 572 с.
6. Орлов А.А. Нужные
программы для Интернета – СПб.: Питер, 2006. – 127 с.
7. Солоницын Ю.А.,
Холмогоров В. Интернет. Энциклопедия. – 3-е из. – СПб.: Питер, 2003. –
592 с.
8. Резников Ф.А. Быстро
и легко осваиваем работу в сети Интернет. – М.: Лучшие книги, 2002. –
284 с.
9. Компьютерные сети и
средства защиты информации: Учеб. пособие / Камалян А.К., Кулев С.А.,
Назаренко К.Н. и др. – Воронеж: ВГАУ, 2003. – 119 с.
10. Олифер В.Г., Олифер Н.А. Компьютерные
сети. Принципы, технологии, протоколы. – СПб.: Питер, 2002. – 672 с.:
ил.
11. Интернет: Энциклопедия
/ Под ред. Л. Мелиховой. – 2-е изд.-СПб.; М.; Харьков; Минск; Питер, 2000. –
527 с.
12. Муштоватый И.Ф. Самоучитель
по работе в Интернете/ Под общ. ред. М.И. Монастырского. – 2-е изд.,
доп. и перераб.-Ростов н/Д: Феникс, 2002.-312 с.
13. Попов В. Практикум по
Интернет – технологиям: Учебный курс / В. Попов.-СПб.; М.; Харьков; Минск:
Питер, 2002. – 476 с.:ил.
14. Компьютерные сети и
средства защиты информации: Учебное пособие / Камалян А.К., Кулев С.А.,
Назаренко К.Н. и др.-Воронеж: ВГАУ, 2003.-119 с.
15. Заика А.А. Компьютерные
Сети – М: Олма-Пресс, 2005. -448 с.
16. Компьютерные сети:
Учебный курс – 2-е изд. (+CD-ROM). – MicrosoftPress, Русская редакция, 1998.
17. Основы современных
компьютерных технологий. Под ред. Хомоненко А.Д. – Корона-принт, СПб 1998.
18. Персональные
компьютеры в сетях TCP/IP. Крейг Хант; перев. С англ. – BHV-Киев, 1997.
20. Комер Д. Принципы
функционирования Интернета: Пер. с англ./ Д. Комер. – СПБ.; М.;
Харьков; Минск: Питер, 2002.-379 с.