Wprowadzenie do Internetu
materiały pomocnicze do ćwiczeń
Instytut Fizyki
Uniwersytet Mikołaja Kopernika
Toruń, listopad 2002
Internet takim jak go teraz znamy i z jakiego korzystają już dziesiątki milionów ludzi każdego dnia jest zjawiskiem stosunkowo młodym, bo powstałym około roku 1980., choć za jego początek można uznać rok 1969, kiedy w Kalifornii powstała sieć ARPANet, pierwsza, pilotowa sieć tego typu. W samych tylko Stanach Zjednoczonych z usług Internetu korzysta ponad 80 milionów ludzi. W Polsce Internet pojawił się w środowiskach akademickich i naukowych około roku 1990. służąc głównie szybkiej wymianie informacji naukowej (poczta elektroniczna) oraz ułatwiając dostęp do danych i oprogramowania. Kilka lat później przestał być domeną tych środowisk i zaczął stawać się coraz powszechniejszym medium komunikacyjnym wykorzystywanym przez przedsiębiorstwa, sklepy, banki, instytucje rządowe i samorządowe, szkoły, wydawców czasopism i książek, stacje radiowe i telewizyjne, itp. W chwili obecnej w Polsce rośnie liczba sprzedawanych komputerów osobistych i mamy już około dwóch milionów osób, które regularnie korzystają z Internetu. Można więc powiedzieć, że Internet jest na najlepszej drodze, by trafić pod przysłowiową strzechę.
Internet rozwija się bardzo burzliwie. Zmieniają się usługi dostępne w Internecie, zmianie ulegają także narzędzia (oprogramowanie) umożliwiające i ułatwiające korzystanie z tych usług. ,,Wprowadzenie do Internetu" zostało pomyślane jako przewodnik i pomoc dla tych wszystkich, którzy pragną zrozumieć czym jest Internet, jakie - zdaniem autora - najważniejsze usługi są w nim dostępne i jak z nich korzystać. Trudno o tych sprawach mówić całkowicie unikając posługiwania się charakterystycznymi dla tej dziedziny pojęciami i skrótami. W celu ułatwienia lektury skryptu najważniejsze terminy zostały zebrane i wyjaśnione w części ,,Słownik wyrażeń i skrótów".
Słowo Internet jest utworzone z dwóch słów: inter (między) oraz net (ang. siatka, sieć) i oznacza połączone między sobą sieci komputerowe. W ten sposób tworzą one sieć sieci, czyli skomplikowaną strukturę o zasięgu globalnym pozwalając dowolnej parze komputerów przyłączonych gdzieś do sieci wymieniać między sobą informacje. Właściwie Internet jest nazwą własną jednej z sieci komputerowych powstałych w USA około roku 1980., w której dane były przekazywane przy wykorzystaniu specjalnego protokołu komunikacyjnego zwanego Internet Protocol (IP). Z uwagi na przewagę sieci wykorzystujących ten właśnie protokół komunikacyjny przyjęło się, aby cały system połączonych ze sobą sieci komputerowych nazywać po prostu Internetem lub Siecią.
Tytułem przykładu rozważmy komputery znajdujące się w pracowni komputerowej. Jeszcze nie tak dawno było regułą, że każdy komputer stanowił niezależne stanowisko pracy. Jeżeli te stanowiska pracy miały być z funkcjonalnego punktu widzenia identyczne, to na każdym z komputerów musiało być zainstalowane to samo oprogramowanie i umieszczone te same dane. Nie ulega wątpliwości, że wygodniej byłoby, gdyby każdy z komputerów był połączony z komputerem-serwerem, w taki sposób, aby zasoby tego komputera (dyski, drukarki, skanery, itp) były - z punktu widzenia użytkownika któregokolwiek z komputerów - dostępne (,,widoczne") jako zasoby lokalne tego komputera. Komputery osobiste pracujące pod kontrolą systemu operacyjnego Windows (w jednej ze swych wersji 95, 98, 2000, NT lub XP) mogą być połączone ze sobą w taki właśnie sposób tworząc sieć w oparciu o protokół komunikacyjny NETBUI firmy Microsoft. Każdy z takich komputerów może pełnić nie tylko rolę klienta sieci, czyli komputera, który potrzebuje pewnych usług i zleca ich wykonanie wyróżnionemu komputerowi-serwerowi, ale także rolę serwera tej sieci. Ten sam komputer może być klientem w odniesieniu do jednej usługi, np. kiedy pobiera oprogramowanie z dysku komputera-serwera, a serwerem dla innej, kiedy przyłączona do niego drukarka jest wykorzystywana także przez inne komputery. System operacyjny Windows umożliwia także komputerom pracę w sieci novellowej oraz internetowej, czyli sieciach korzystających z innych protokołów komunikacyjnych, odpowiednio IPX (Internet Packet eXchange) oraz TCP/IP (Transmission Control Protocol/Internet Protocol). Tworzenie zatem niewielkich, lokalnych sieci komputerowych (LAN - Local Area Network) złożonych z kilku lub kilkudziesięciu komputerów jest możliwe i stosunkowo proste pod warunkiem wyposażenia każdego z komputerów w adapter sieciowy (kartę sieciową) i połączenia ich ze sobą odpowiednim rodzajem kabla (najczęściej tzw. nieekranowaną skrętką, UTP) za pośrednictwem odpowiedniego urządzenia sieciowego (koncentratora bądź przełącznika), do którego podłączone są wszystkie komputery. W ten sposób powstaje lokalna sieć komputerowa o topologii gwiazdy.
Tak właśnie tworzone są lokalne sieci komputerowe w szkołach, uniwersytetach, bankach, przedsiębiorstwach, itd. Np. w szpitalach możliwe staje się wygodne gromadzenie i przetwarzanie danych o pacjencie, jego chorobie i leczeniu. Informacje wprowadzane są do centralnej bazy danych w tych miejscach, gdzie są zdobywane (izba przyjęć, laboratorium, oddział) i mogą być udostępniane równocześnie wielu lekarzom w dowolnym miejscu szpitala. System taki umożliwia również łatwy dostęp do historii choroby danego pacjenta i informacji o jego poprzednich pobytach w szpitalu. Dzięki przyłączeniu lokalnej sieci komputerowej do zewnętrznej, np. miejskiej sieci komputerowej (MAN - Municipal Area Network), możliwa jest wymiana danych pomiędzy komputerami znajdującymi się w różnych sieciach lokalnych. W ten sposób temu dane o pacjencie zgromadzone w jednym szpitalu mogą zostać szybko przekazane do innego szpitala lub kliniki. Co więcej, możliwe staje się przekazywanie obrazu pola operacyjnego poprzez sieć do kliniki, gdzie inni specjaliści mogą śledzić przebieg operacji i służyć radą. W chwili obecnej możliwe jest już przeprowadzanie niektórych zabiegów zdalnie, dzięki wykorzystaniu robotów chirurgicznych. Przyłączenie sieci lokalnej do sieci miejskiej pozwala także na korzystanie przez lekarzy i inny personel szpitalny z usług poczty elektronicznej oraz z informacji dostępnej w Internecie. Jest to jednak możliwe pod warunkiem, że MAN ma z kolei połączenie z rozległą (krajową) siecią komputerową, czyli tzw. WAN (Wide Area Network), a za jej pośrednictwem ze światową siecią komputerową.
Połączenie lokalnej sieci komputerowej z innymi sieciami jest możliwe dzięki specjalnym urządzeniom sieciowym zwanym bramami (gateway) lub ruterami (router), które są odpowiedzialne za przekazywanie danych z sieci do sieci.
Sieci komputerowe mogą być otwarte bądź zamknięte. Przykładem otwartej sieci komputerowej jest sieć tworzona przez komputery Uniwersytetu Mikołaja Kopernika. Komputery w poszczególnych budynkach tworzą lokalne sieci (instytutowe, wydziałowe), które są ze sobą połączone poprzez magistralę światłowodową lub poprzez przyłącza modemowe. Jednak ze względu na bezpieczeństwo i konieczność zapewnienia poufności oraz integralności danych, niektóre komputery, (np. komputery pracujące na potrzeby administracji UMK) pozostają zupełnie wydzielone, tj. nie są połączone z innymi, zewnętrznymi sieciami. Często stosowane jest rozwiązanie pośrednie, w którym lokalną sieć komputerową przyłącza się do sieci zewnętrznej poprzez odpowiednie komputery (zwane ścianami ogniowymi, firewalls), których zadaniem jest kontrolowanie ruchu wychodzącego, a przede wszystkim wchodzącego do lokalnej sieci. Dzięki temu uniemożliwia się niepowołanym osobom, w tym włamywaczom komputerowym, korzystanie z zasobów lub ich niszczenie. Wydzielone sieci obsługujące pojedynczą instytucję lub organizację nazywają się sieciami intranetowymi. Udostępniają one szereg usług typowych dla Internetu, ale dostęp do nich jest ograniczony.
W chwili obecnej funkcjonuje w Polsce kilka ogólnopolskich sieci komputerowych. Najstarszą z nich jest Naukowa i Akademicka Sieć Komputerowa (NASK), która powstała na początku lat 1990. (www.warman.pl/siec_wan.html). W celu zaspokojenia rosnących potrzeb środowisk akademickich i naukowych została uruchomiona z początkiem 1999 r. szerokopasmowa sieć POL-34 (www.pol34.pl), która korzysta z infrastruktury (kabli światłowodowych) sieci TELENERGO, a w chwili obecnej trwają prace nad zbudowaniem nowej, szkieletowej sieci łączącej 22 miejskie sieci komputerowe o nazwie PIONIER1 W ostatnich latach uruchomione zostały także oddzielne sieci komputerowe pracujące na potrzeby takich przedsiębiorstw i instytucji jak Telekomunikacja Polska SA (TPNET), banki (TELBANK, która m.in. obsługuje około 4 tys. bankomatów), itp.
Zazwyczaj lokalne sieci komputerowe zapewniają użytkownikom stosunkowo dużą szybkość przesyłania danych rzędu 10, 100 a nawet 1000 megabitów na sekundę (Mb/s). Szybkości oferowane w sieciach rozległych są zdecydowanie mniejsze. Komputer podłączony do sieci WAN poprzez modem może przesyłać dane z szybkością od kilkudziesięciu kilobitów (kb/s) do kilku megabitów na sekundę w zależności od rodzaju modemu i podłączenia. Wzrost zasobów i usług w Internecie oraz szybko rosnąca liczba internautów spowodowała konieczność tworzenia szybkich, światłowodowych połączeń pomiędzy głównymi węzłami sieci, które umożliwiają przesyłanie od kilku do kilkudziesięciu gigabitów na sekundę (Gb/s).
Komputery lub inne urządzenia przyłączone do Sieci pełnią rozmaite funkcje służąc w ten sposób swoim użytkownikom, co oddaje ich żargonowa nazwa host (z ang. gospodarz). Każdy z komputerów (hostów) funkcjonuje w sieci na równych prawach, żaden nie jest dyskryminowany ani wyróżniony i może ,,rozmawiać" z innymi hostami jak równy z równym, bo sieć Internet jest tzw. siecią równorzędną.
Komunikowanie się komputerów ze sobą łatwo sobie wyobrazić rozważając dwie analogie zaczerpnięte z życia codziennego. Wyobraźmy sobie przedsiębiorstwa, które utrzymują kontakty ze swoimi fabrykami (filiami) poprzez gońców. Kiedy trzeba przekazać wiadomość z jednej do drugiej fabryki goniec przenosi tę wiadomość idąc pieszo, jadąc na rowerze lub samochodem. Każde przedsiębiorstwo ma swoją grupę gońców, co prowadzi do trudności we wzajemnej komunikacji między firmami - goniec firmy X nie może z wiadomością dotrzeć na teren firmy Y, gdyż nie ma właściwej przepustki. Z podobną sytuacją mamy do czynienia, kiedy firmy komputerowe stosują różne standardy przekazywania danych pomiędzy produkowanymi przez siebie komputerami. Tak długo jak komputery pracują w wydzielonej, zamkniętej sieci nie powoduje to istotnych problemów, chociaż zwykle zmusza użytkownika do stosowania sprzętu i oprogramowania jednego producenta.
Poważne trudności pojawiają się dopiero wówczas, kiedy chcielibyśmy, aby w jednej sieci komputerowej mogły razem pracować komputery różnych producentów, w dodatku komputery pracujące pod nadzorem różnych systemów operacyjnych.
A oto druga z analogii. Dyrektor przedsiębiorstwa X przygotował obszerną dokumentację na zamówienie przedsiębiorstwa Y. Jak należy dostarczyć zamówiony materiał do siedziby dyrektora firmy Y? Może to oczywiście zrobić goniec, ale istnieje inne, lepsze rozwiązanie. Dyrektor firmy X przekazuje materiał swojej sekretarce z poleceniem przekazania dyrektorowi przedsiębiorstwa Y. Z uwagi na objętość przesyłki sekretarka dzieli dokumentację na części, które wkłada do oddzielnie zaadresowanych i ponumerowanych kopert, które nadaje na poczcie. Dla poczty nie jest istotna zawartość kopert, a jedynie adresat i nadawca. Przesyłki są segregowane, umieszczane w oddzielnych workach i transportowane do innych urzędów pocztowych samochodami, koleją lub samolotami. Po pewnym czasie koperty z dokumentacją docierają do adresata, na biurko sekretarki dyrektora przedsiębiorstwa Y. Sprawdza ona, czy wszystkie przesyłki dotarły, i, jeśli jakiejś brakuje, to kontaktuje się z sekretarką firmy X i prosi o ponowne przysłanie brakującej koperty. Po skompletowaniu całej dokumentacji przekazuje ją swojemy dyrektorowi.
Taka jest idea przekazywania większości danych w Internecie. Jest to możliwe dzięki uzgodnieniu przez producentów sprzętu i oprogramowania sposobów komunikowania się i przekazywania danych między komputerami pracującymi w sieci, czyli tzw. protokołów komunikacyjnych. Proces opracowywania tych protokołów rozpoczął się około roku 1997, kiedy odpowiedni podkomitet Międzynarodowej Organizacji Normalizacyjnej (ISO International Standard Organization) rozpoczął prace nad zdefiniowaniem standardów dla produktów stosowanych do łączenia różnorodnych komputerów i urządzeń sieciowych.
Funkcjonowanie sieci Internet opiera się na rodzinie protokołów TCP/IP zbudowanych według tzw. modelu warstwowego TCP/IP.2 W tym modelu wyróżnia się szereg warstw, pomiędzy którymi zachodzi wymiana danych w ramach ściśle określonych specyfikacji (protokołów). Warstwa
W języku drugiej z analogii mamy odpowiednio warstwę dyrektorów, sekretarek, urzędów pocztowych oraz warstwę samochodowo-kolejowo-samolotową. Dyrektorzy chcąc sobie coś zakomunikować muszą tylko wiedzieć jak wiadomość przekazać sekretarkom (czyli warstwie bezpośrednio niższej). Sekretarki muszą ze swej strony poprawnie wiadomości dzielić i adresować oraz przekazać najbliższemu urzędowi pocztowemu, którego zadaniem jest jak najlepsze wykorzystanie istniejącego systemu połączeń pomiędzy placówkami pocztowymi w różnych miastach i krajach do szybkiego i pewnego dostarczenia przesyłki.
Komputery w lokalnej sieci komputerowej łączy się ze sobą w sieć Ethernet poprzez wspólną magistralę komunikacyjną, którą może być kabel koncentryczny lub kabel telefoniczny (skrętka). W pierwszym przypadku mamy do czynienia z siecią 10Base2 (standard IEEE 802.3), w której komputery wczepia się do tzw. cienkiego kabla koncentrycznego o długości nie przekraczającej 185 m. Taka sieć o topologii szyny zapewnia maksymalną szybkość przesyłania danych wynoszącą 10Mb/s. W drugim przypadku można połączyć komputery oddzielnymi kablami (nieekranowaną skrętką składającą się z 4 par skręconych przewodów o długości nie przekraczającej 95 m), których zakończenia schodzą się w urządzeniu zwanym wieloportowym koncentratorem lub przełącznikiem. W zależności od rodzaju kart sieciowych i zastosowanych urządzeń sieciowych możemy w ten sposób uzyskać sieć o przepustowości 10 Mb/s (10BaseT, standard IEEE802.3) lub 100 Mb/s (100BaseT), a nawet 1 Gb/s (1000BaseT). Do łączenia urządzeń sieciowych można także wykorzystywać światłowody, dzięki czemu można zbudować lokalną sieć komputerową łączącą wiele budynków i rozciągającą się na przestrzeni kilku kilometrów.
Przesyłanie danych między komputerami w LAN-e jest możliwe dzięki temu, że każdy interfejs sieciowy, poprzez który komputer jest przyłączony do medium transmitującego sygnały (elektryczne bądź świetlne) jest wyposażony w unikatowy 48-o bitowy adres sprzętowy (adres MAC).3 Dzięki tym adresom (i protokołowi komunikacyjnemu NETBUI) komputery osobiste pracujące w sieci LAN pod nadzorem systemu operacyjnego Windows mogą się ze sobą kontaktować i dzielić zasoby (dyski, drukarki).
Jednym ze sposobów łączenia komputerów ze sobą bez względu na odległość jest przyłączanie ich do Internetu poprzez sieć telefoniczną. Ze względu na to, że systemy łączności telefonicznej zostały opracowane do przekazu dźwięku, a nie sygnałów cyfrowych komputery trzeba podłączać poprzez dodatkowe urządzenia, zwane modemami4, które odpowiedzialne są za zamianę sygnałów cyfrowych na analogowe i odwrotnie. Modem podłącza się do portu szeregowego komputera (RS-232) lub do jednego ze złącz rozszerzeń. Większe możliwości stwarza przyłączenie komputera do sieci telefonicznej przystosowanej do pracy z sygnałami cyfrowymi, czyli cyfrowej sieci usług zintegrowanych (ISDN Integrated Services Digital Network).
Sieciowe systemy operacyjne takie jak Windows i Unix/Linux pozwalają bez kłopotu podłaczyć komputer poprzez modem do sieci telefonicznej.
Dostawców usług internetowych można podzielić na dwie grupy. Pierwsza, do której należy np. TP SA, pozwala użytkownikowi uzyskać dostęp do Internetu poprzez przydzielenie dynamicznego adresu IP, co pozwala na swobodne żeglowanie po sieci. Oferta dostawców grupy drugiej jest wzbogacona o dostęp do ich własnych, stale uaktualnianych baz danych obejmujących aktualne informacje ekonomiczne, finansowe, polityczne, meteorologiczne, turystyczne, dotyczące oprogramowania komputerów, dostęp do elektronicznych, multimedialnych encyklopedii, itp. Do takiej kategorii dostawców należy np. CompuServe i America OnLine, czyli główni dostawcy usług bieżących w USA.
Firma TP SA udostępnia w całej Polsce numer 0-202122, który umożliwia nawiązanie połączenia modemowego z urządzeniami tej firmy poprzez protokół PPP (Point-to-Point Protocol) i przekształcenia (na czas połączenia) komputera osobistego w hosta sieci Internet, dzięki przydzieleniu temu hostowi unikatowego adresu internetowego. Szczegółowe informacje są dostępne pod adresem www.tpnet.pl/tpnet/komutowany/.
Modem jest urządzeniem, które przekształca sygnały cyfrowe generowane przez komputer na sygnały analogowe, które mogą być przesyłane po linii telefonicznej oraz przekształca docierające sygnały analogowe na ich cyfrowe odpowiedniki (modem pochodzi od słów MOdulator/DEModulator). Przekształcanie sygnałów odbywa się zgodnie z odpowiednimi protokołami modulacyjnymi (V.22, V.22bis, V.24, V.32, V.32bis, V.34bis, V.90, V.92), które decydują o surowej prędkości przesyłania danych, tj. szybkości przesyłania danych nie poddanych kompresji.
Modemy dostępne w tej chwili na rynku wyposażone są nie tylko w protokoły do szybkiej modulacji (komunikacji), ale także protokoły do korekcji błędów oraz kompresji przesyłanych danych. Są dwa standardy korekcji błędów: MNP 4 oraz V.42 (standard V.42 obejmuje dwa protokoły korekcji błędów, jednym z nich jest MNP 4 (Microcom Network Protocol pochodzący od firmy Microcom). Modemy pracujące z korekcją błędów potrafią odfiltrowywać szumy oraz ponownie przesyłać uszkodzone dane. Kompresji danych w czasie transmisji modemowej dokonuje się w oparciu o dwa podstawowe standardy: MNP 5 oraz V.42bis. Nowoczesne modemy potrafią wykorzystywać protokoły MNP oraz V i przy nawiązywaniu połączenia potrafią uzgodnić najwyższą możliwą prędkość przesyłania danych oraz rodzaj korekcji błędów. Podstawowe informacje o protokołach wykorzystywanych w modemach zostały zebrane w Tabeli 1 (patrz Uzupełnienie).
ISDN jest siecią cyfrową usług zintegrowanych pozwalającą na przesyłanie danych z szybkością do 128kb/s. Oferowane są zazwyczaj dwa rodzaje dostępu: podstawowy i rozszerzony. W trybie podstawowym zwanym BRA 2B+D (Base Rate User Access) dostępne są dwa kanały po 64kb/s, tzw. kanały B (Bearer Channel) do transmisji oraz kanał D o przepustowości 16kb/s przesyłania informacji sterujących. Całkowita przepustowość łącza podstawowego wynosi zatem 144kb/s.
W przypadku łącza rozszerzonego PRA 30B+D (Primary Rate User Access) mamy odpowiednio 30 kanałów B oraz jeden D (o przepustowości 64kb/s). W ramach tego typu dostępu abonent ma do dyspozycji łącze o przepustowości 1920kb/s.
Do łącza ISDN można podłączyć maksymalnie 8 urządzeń abonenckich, tzw. terminali, czyli telefonów, faksów, komputerów. Każdy z terminali może mieć oddzielny miejski numer. Jednocześnie mogą być aktywne jedynie dwa spośród zainstalowanych urządzeń. Zamiast dwóch niezależnych połączeń użytkownik może nawiązać połączenie dwukanałowe i wówczas przepustowość linii wzrasta dwukrotnie. Podczas odbierania połączeń wybór terminalu następuje automatycznie. Do terminali można się odwoływać poprzez ich numery wewnętrzne.
Wyższe szybkości transmisji zapewnia standard DSL (Digital Subscriber Line), czyli cyfrowa linia abonencka, która wykorzystuje stałe połączenie pomiędzy siedzibą klienta, a centralą operatora sieci telefonicznej do przesyłania danych z szybkością w zakresie od 1,5 do 8 Mb/s.5
Zwykle łącze telefoniczne (stałe lub komutowane) pozwala na podłączenie do sieci Internet tylko pojedynczego komputera. Jednak dzięki włączeniu takiego komputera do lokalnej sieci komputerowej (poprzez instalację dodatkowej karty sieciowej) i zastosowaniu odpowiednich rozwiązań programowych (tzw. translacji adresu sieciowego) można zapewnić dostęp do Internetu wszystkim komputerom z tej sieci. Takie rozwiązanie można zastosować w przypadku komputera dostępowego pracującego w systemie Windows lub Linux.
Oto lista podstawowych usług internetowych:
Każdy komputer pracujący w sieci Internet posiada unikatowy adres, tzw. adres IP (od ang. Internet Protocol), składający się z 32 bitów, które zwykle zapisuje się w postaci czterech liczb naturalnych (tzw. oktetów, każdy z zakresu 1-254) oddzielonych kropkami, np. 158.75.13.13. Dzięki temu staje się (teoretycznie) możliwe zaadresowanie prawie 4,3 mld węzłów (hostów) w sieci i przesyłanie między nimi danych (pakietów). Adres IP składa się z części sieciowej oraz części hosta i w zależności od podziału należy do jednej z poniższych klas:
Użyteczne bloki adresów IP stają się niewystarczające ze względu na nieefektywność systemu klas. W praktyce oznaczać to może, że mała instytucja lub firma będzie miała kłopoty z otrzymaniem adresów klasy C. W celu stworzenia oddzielonej od Internetu własnej sieci wykorzystującej ten sam schemat adresowania, tj. sieci intranetowej, można wykorzystać specjalnie zarezerwowane do tego celu adresy (10.x.x.x, 172.16.x.x, 192.168.x.x). Jeżeli potrzebny jest dostęp do Internetu, to można go zrealizować poprzez użycie adresów z puli przydzielonej dostarczycielowi usług internetowych. Niedogodnością takiego rozwiązania jest konieczność ścisłego związania się z jednym dostawcą. Można tego uniknąć podłączając sieć intranetową do Internetu poprzez jeden lub kilka komputerów korzystających z adresów uzyskanych od dostawców usług internetowych i realizując dostęp wszystkich pozostałych hostów z sieci do Internetu poprzez odpowiednią translację adresów specjalnych adresy IP komputerów dostępowych.
Zwykle komputer z lokalnej sieci komputerowej ma przydzielony stały adres IP. Natomiast komputer przyłączany do sieci Internet poprzez modem i komutowaną linię telefoniczną otrzymuje przy każdym połączeniu odrębny adres IP.
Przydzielanie adresów IP hostom w lokalnej sieci komputerowej można zautomatyzować dzięki usłudze wykorzystującej protokół DHCP (Dynamic Host Configuration Protocol). Usługa ta umożliwia dynamiczny przydział adresów IP hostom z sieci w oparciu o adresy sprzętowe kart sieciowych tych hostów, tj. adresy MAC, lub na podstawie kolejności zgłoszeń (przydzielane są wówczas kolejne adresy IP z pewnej określonej ich puli).
Posługiwanie się adresami liczbowymi jest raczej niezbyt wygodne. Dlatego wprowadzono możliwość nadawania komputerom tzw. nazw domenowych. Np. adresowi IP 158.75.5.90 odpowiada nazwa nobel.phys.uni.torun.pl. nobel jest nazwą własną serwera lokalnej sieci komputerowej w Instytucie Fizyki, który pracuje w domenie phys.uni.torun.pl. Nazwa domenowa jest wieloczłonowa (hierarchiczna), co pozwala odgadnąć, że serwer nobel należy do instytucji edukacyjnej (uni6), która znajduje się w Toruniu (torun), w Polsce (pl). phys wskazuje, że mamy do czynienia z instytutem/wydziałem fizyki. Nazwy innych komputerów w Instytucie Fizyki różnią się tylko pierwszym członem. Np. pełna nazwa serwera kont studenckich to ferm.phys.uni.torun.pl.
Z wyjątkiem nazw domenowych w USA (w ojczyźnie Internetu) wszystkie pozostałe nazwy zawierają na końcu kod kraju, w którym znajduje się komputer (np. uk - Wielka Brytania, de - Niemcy, fi - Finlandia, itp.). Oto kilka najczęściej występujących nazw domen:
Pod koniec 2000 r. odbyło się spotkanie przedstawicieli ICANN (Internet Corporation for Assigned Numbers and Names), w czasie którego postanowiono powiększyć strukturę adresową Internetu. Uzgodniono mianowicie wprowadzenie nowych końcówek nazw domenowych:
Nie uzyskały akceptacji takie propozycje jak: tel dla numerów telefonicznych, geo dla adresów związanych z położeniem geograficznym, kids dla (bezpiecznych) stron dla dzieci oraz health, dla stron poświęconych zdrowiu.
Zamianą adresów domenowych na adresy IP zajmują się serwery DNS (Domain Name Service), które są zorganizowane hierarchicznie, zgodnie z porządkiem widocznym w adresie domenowym.
MS-DOS wraz ze środowiskiem graficznym Windows 3.11 oraz wywodzące się z niego systemy Windows 95/98/2000/NT/XP to w chwili obecnej najpopularniejsze systemy operacyjne dla komputerów osobistych (korzysta z nich około 80% komputerów na świecie). System operacyjny jest specjalnym programem komputerowym, który jest pośrednikiem pomiędzy użytkownikiem komputera i jego programami, a sprzętem komputerowym (tzw. hardware'em), na który składają się procesor, pamięć operacyjna, dyski, monitor, klawiatura, itd. System operacyjny przekształca zatem sprzęt komputerowy w pożyteczne narzędzie pracy i zabawy uwalniając użytkownika od konieczności posiadania szczegółowej wiedzy o budowie komputera i jego funkcjonowaniu.
Z punktu widzenia użytkownika komputera najważniejszą cechą systemu operacyjnego jest organizacja (sposób przechowywania) plików na dysku oraz tryb komunikowania się użytkownika z systemem i korzystania z jego zasobów.
System operacyjny MS-DOS jest systemem jednozadaniowym oraz jednoużytkownikowym. Oznacza to, że w danej chwili tylko jeden użytkownik może z niego korzystać i może być wykonywane tylko jedno zadanie (uruchomiony może być tylko jeden program). Komunikacja z systemem odbywa przy pomocy klawiatury i monitora działającego w trybie tekstowym.
Środowisko Windows 3.11 oraz system operacyjny Windows 95/98 w dalszym ciągu pozwalają na wykorzystywanie systemu w zasadzie tylko przez jednego użytkownika, chyba że komputer pracuje w sieci i udostępnia swoje zasoby (pliki, drukarkę) innym komputerom. Na komputerach osobistych klasy 386 lub lepszej możliwe jest uruchamianie kilku programów (aplikacji) w osobnych, graficznych ,,oknach" i jednoczesne ich wykonywanie. Uruchamianie programów zostało zredukowane do wskazywania przy pomocy myszy odpowiedniej ,,ikony", czyli graficznej reprezentacji programu, umieszczonej w oknie menadżera plików lub po prostu znajdującej się na ekranie monitora traktowanego jak biurko, przy którym się pracuje.
W systemie DOS i Windows dane posiadają strukturę hierarchiczną, dzięki możliwości tworzenia katalogów i podkatalogów na dyskach stałych i dyskietkach (taki sposób organizacji danych został zapożyczony z systemu operacyjnego Unix). Polecenie dir c:\ (od ang. słowa directory, które oznacza katalog) pozwala obejrzeć zawartość katalogu podstawowego oznaczanego przez lewy ukośnik na dysku oznaczonego literą C. Zwykle tą literą oznacza się pierwszy dysk w komputerze (litery D, E, itd. używane są do oznaczania kolejnych dysków i napędu CD-ROM/DVD). Litery A i B zarezerwowane są na określenie stacji dyskietek.
Polecenie cd <nazwa katalogu> (od ang. change directory) pozwala zmienić bieżący katalog na wskazany przez argument komendy. MS-DOS zawiera szereg poleceń pozwalających tworzyć i usuwać katalogi, kopiować i przenosić pliki między dyskami oraz usuwać pliki. Dla wygody użytkownika stworzono jednak szereg narzędzi takich jak Norton Commander (dla DOS-u), menadżer plików dla Windows 3.11 oraz Explorator Windows dla innych wersji systemu Windows, które pozwalają przeprowadzać wszelkie operacje na katalogach i plikach bez znajomości składni odpowiednich poleceń systemowych. W systemie Windows 2000/NT/XP tryb MS-DOS jest dostępny poprzez okno terminala.
World Wide Web (WWW, W3) wymyślił około roku 1990. Tim Berners-Lee, fizyk z Europejskiego Centrum Badań Jądrowych (CERN), aby usprawnić system rozpowszechniania informacji naukowej. W tym celu został przez niego opracowany specjalny język opisu strony, tzw. HyperText Mark-up Language (HTML). Język ten pełni podobną rolę jak system znaków stosowanych przez redaktorów, aby przekazać zecerom informacje o ostatecznym wyglądzie redagowanej strony. Przeglądarka sieciowa jest odpowiedzialna za poprawne złożenia strony WWW w oparciu o zestaw komend i znaczników zawartych w jej opisie. Ogromna przydatność języka HTML polega głównie na możliwości umieszczania w dokumentach HTML-owych odnośników do innych stron WWW, co pozwala na bardzo łatwy dostęp do rozproszonej informacji.
Początkowa wersja standardu HTML pozwalała jedynie na dostęp do danych tekstowych, ale od 1994 r. możliwe stało się także umieszczanie na stronach WWW elementów graficznych i multimedialnych.
World Wide Web to światowa pajęczyna utworzona z połączonych ze sobą serwerów umożliwiających dostęp do globalnego, rozproszonego systemu informacyjnego, na który składają się powiązane ze sobą strony WWW wypełnione informacjami w postaci tekstowej, graficznej, dźwiękowej, wideo. Dostęp do tych informacji jest interaktywny, gdyż są one udostępniane po ,,kliknięciu" przez użytkownika na odpowiednio oznaczone aktywne miejsca na takiej stronie. Język Java spowodował dodatkowe ,,ożywienie" stron WWW poprzez możliwość wykonywania przez przeglądarki sieciowe apletów, czyli niewielkich programów napisanych w tym języku. Oprócz tego skryptowe języki programowania, takie jak php3 czy perl, umożliwiły dynamiczne tworzenie stron WWW, w zależności o rodzaju usług i informacji poszukiwanych przez użytkownika.
Przeglądarka sieciowa zainstalowana na komputerze przyłączonym do sieci pozwala żeglować po zasobach WWW. Program taki pobiera z serwerów W3 dane zapisane w formacie HTML i wyświetla je na monitorze. Pobranie i przesłanie danych jest możliwe dzięki specjalnemu protokołowi obsługującymi przekazywanie danych hipertekstowych, tj. protokołowi HTTP (HyperText Transmission Protocol).
Każdy z zasobów WWW ma jednoznacznie określony adres URL (Uniform Resource Locator), zwany ujednoliconym lokalizatorem zasobów. Taki URL składa się z ciągu znaków http://, adresu internetowego serwera (w postaci liczbowej lub domenowej) oraz ewentualnie ścieżki dostępu do danego zasobu. Np. adres serwera WWW Wydziału Fizyki, Astronomii i Informatyki Stosowanej wygląda następująco: http://www.phys.uni.torun.pl/ (zamiast podawać nazwę własną serwera często stosuje się nazwę zastępczą www). Po podaniu przeglądarce takiego adresu pobiera ona z serwera zawartość pliku home.html lub index.html (rozszerzenie html informuje, że plik zawiera dane w formacie HTML), tak więc pełen adres poszukiwanego zasobu wygląda następująco: http://www.phys.uni.torun.pl/home.html. Ta strona, to strona domowa danej instytucji, zwana też czasami jej witryną internetową. Podobnie chcąc obejrzeć witrynę Polski trzeba przeglądarkę skierować pod adres http://plwww.fuw.edu.pl/PolandHome.html. Natomiast pod adresem http://www.amg.gda.pl/MEDIC można zapoznać się z polskimi medycznymi stronami WWW.
Zanim nastała era serwerów WWW w sieci Internet działały już serwery FTP (a także serwery Gopher, które już prawie zanikły wyparte przez serwery WWW). Aby ułatwić użytkownikom docieranie do zasobów oprogramowania i danych oferowanych przez te serwery przeglądarki sieciowe zostały dostosowane do prowadzenia ,,rozmowy" także z nimi. Wystarczy w tym celu jako URL serwera ftp podać jego adres IP poprzedzony przez ftp://. Zatem adres jednego z największych w Polsce serwerów tego typu jest następujący: ftp://sunsite.icm.edu.pl/. Do tego archiwum oprogramowania można także dotrzeć poprzez adres http://sunsite.icm.edu.pl/. (Część http:// adresu zasobu sieciowego można pominąć, gdyż przeglądarki domyślnie traktują niekompletny URL jako adres serwera stron WWW.)
WWW to rozproszony systemu informacyjny, czyli zbiór powiązanych ze sobą stron, które nie muszą koniecznie znajdować się na jednym serwerze. To powiązanie uzyskuje się poprzez umieszczanie na jednej stronie WWW symbolicznych odsyłaczy do adresów URL odpowiednich zasobów. Przez wskazanie myszką takiego odsyłacza użytkownik nakazuje przeglądarce skomunikowanie się z właściwym serwerem i pobranie szukanych danych bez konieczności posługiwania się pełnymi adresami zasobów. Przy odpowiednio szybkiej komunikacji między komputerem-klientem i serwerami użytkownik może odnieść wrażenie, że wszystkie dane są zgromadzone na jego komputerze osobistym.
W sieci WWW jest już dwa miliardy odrębnych stron, więc zasadniczym problemem jest organizacja dostępu do zgromadzonych na nich informacji. Jak wśród tych stron znaleźć te, które zawierją szukane przez nas dane? W naturalny sposób powstanie serwisu WWW pociągnęło za sobą konieczność stworzenia dodatkowych usług i narzędzi do porządkowania zasobów WWW oraz ułatwiających ich przeszukiwanie. W ten sposób powstały katalogi sieciowe oraz wyszukiwarki. W chwili obecnej te usługi raczej nie występują w formie czystej, lecz pod postacią portali internetowych (wystarczy popatrzeć na stronę domową pierwszego katalogu sieciowego Yahoo!).
Portale sieciowe to witryny, które oferują typowy zestaw usług sieciowych oraz umożliwiają łatwy i szybki dostęp do innych zasobów sieciowych. Do najczęściej oferowanych usług należy poczta elektroniczna, katalogi sieciowe, wyszukiwarki, zakupy internetowe, grupy dyskusyjne, pogawędki (tzw. czaty), dostęp do informacji giełdowych, prognozy pogody, programu telewizyjnego, itp. Z sondażu przeprowadzonego we wrześniu i październiku 2002 r. na 2015-osobowej grupie Polaków powyżej 15. roku życia wynika, że najbardziej znaną w Polsce witryną internetową jest Onet (www.onet.pl). Wskazało na nią 70% badanych. Wirtualną Polskę (www.wp.pl) wybrało 57,1% Interię (interia.pl) - 30,3%, ,,Gazetę Wyborczą'' (www.gazeta.pl) - 25,7%, RMF FM (www.rmf.fm) - 16,6%, Radio Zet (www.radiozet.com.pl) - 14,5%, a ,,Rzeczpospolitą'' (www.rp.pl) - 10,7%. Wśród korzystających z Internetu 48,4% korzysta z portalu Onet, 27,3% - Wirtualnej Polski, 14,5% - ,,Gazety Wyborczej'', a 10% - Interii.
Katalogi sieciowe (patrz np. katalog.onet.pl, katalog.wp.pl, www.yahoo.com) to starannie opracowane wielopoziomowe listy tematyczne przypominające w strukturze dokładny spis zawartości książki z wyszczególnieniem rozdziałów, hierarchii podrozdziałów i paragrafów. Tworzone są one przez grupy redaktorów, którzy przeglądają strony WWW, oceniają ich zawartość i decydują o ich umieszczeniu w katalogu. Witryny nieaktualne lub niezgodne z regulaminem danego katalogu są usuwane, te które zmieniły lokalizację są aktualizowane. W czasie dodawania strony do katalogu tworzony jest także jej krótki opis na potrzeby bazy danych katalogu. Redaktorzy selekcjonują także nadsyłane zgłoszenia od osób i firm zainteresowanych umieszczeniem swoich stron w takich katalogach. Katalogi sieciowe dysponują zazwyczaj możliwością wyszukiwania informacji podług słów kluczowych, ale przeszukiwanie jest ograniczone do słów składających się na streszczenie każdej ze stron znajdujących się w katalogu. Oznacza to, że zmiany zawartości strony dokonane już po jej zarejestrowaniu nie są automatycznie uwzględniane. Zatem jednym z poważniejszych problemów w utrzymaniu dobrego katalogu sieciowego jest zapewnienie aktualności i adekwatności udostępnianych informacji.
Katalog Yahoo!, który istnieje od sierpnia 1994 r, ma w swojej bazie ponad milion zaindeksowanych stron. Jest on w całości przygotowywany przez zespół 150 redaktorów. To sprawia, że umieszczenie w nim witryny trwa zwykle wiele miesięcy (ale można ten proces przyspieszyć wnosząc stosowną opłatę). Korzystając z serwisu wyszukiwawczego związanego z katalogiem należy zdawać sobie sprawę, że działa on zupełnie inaczej niż typowe wyszukiwarki (o których dalej). Jeśli zapytanie pasuje do jednej z kategorii katalogu, to Yahoo zwróci wyniki zapytania. Jeśli zapytanie pasuje do nazwy firmy, której strona znajduje się w katalogu lub do opisu takiej strony, to pojawi się także stosowna informacja. W przeciwnym razie Yahoo korzysta (od 2002 roku) z wyszukiwarki Google, żeby znaleźć strony pasujące do zapytania.
W przypadku katalogu sieciowego portalu Onet jej wyszukiwarka bazuje na serwisie Inktomi (dawniej Infoseek). Zespół programistów Onetu stale dostosowuje kolejne wersje wyszukiwarki Inktomi do specyfiki języka polskiego i polskiego Internetu. Oznacza to, że możliwe jest wyszukiwanie z odmianą języka polskiego, wyszukiwanie wyrazów podobnych, zastosowanie filtru rodzinnego, powiązano wyszukiwarkę z katalogiem stron WWW, zastosowano specyficzne metody przeszukiwania i indeksowania polskiego Internetu w realiach powolnych łącz i zapchanej sieci.
Katalog Wirtualnej Polski podzielony jest na 16 kategorii głównych i około 5000 kategorii zwykłych ,,wprowadzonych po dogłębnej analizie potrzeb i zachowań'' (katalog.wp.pl, katalog.wp.pl/zmiany.html). Wirtualna Polska używa wyszukiwarki FAST i Google do przeszukiwania własnych katalogów stron internetowych. Ranking wyszukanych stron jest dokonywany poprzez specjalne oprogramowanie KlikoHit, które szereguje strony podług częstości odwiedzin (popularności witryn). Możliwe jest jednak także sortowanie trafień podług ich trafności (patrz szukaj.wp.pl/klikohit-info.html). Z katalogiem sieciowym związana jest dodatkowa usługę zwana InfoBazy WP (szukaj.wp.pl/bazy.html). Jest to strona, na której zgromadzone są odnośniki do informacji zgromadzonych w serwisach portalu WP (około 10 mln stron). Stanowią je pogrupowane w linie tematyczne i podzielone na poszczególne serwisy WP bazy wyszukiwawcze, katalogowe, informacyjne i adresowe.
Warto wspomnieć o Open Directory Project (dmoz.org), który jest największym (ponad 2,2 mln stron, ponad 323 tys. kategorii) i najczęściej odwiedzanym katalogiem sieciowym i który jest redagowanym przez ponad 31 tys. redaktorów-ochotników z całego świata. Został utworzony na zasadach ruchu Open Source (www.opensource.org) i jako taki jest jedynym dużym katalogiem dostępnym za darmo. Zatem nie ponosi się żadnych kosztów w celu umieszczenia strony w tym katalogu i nie ponosi się opłat z tytułu dostępu do zasobów katalogu. Ten katalog stanowi podstawę działania katalogów sieciowych udostępnianych przez największe i najpotężniejsze serwisy wyszukiwacze i portale takie jak Netscape Search, America OnLine Search, Google, Lycos, HotBot, DirectHit, i inne.
Inny rodzaj narzędzi, które ułatwiają docieranie do potrzebnych informacji, stanowią programy wyszukujące informację według podanych przez użytkownika kryteriów. Są to wyszukiwarki bądź szperacze pełnotekstowe (search engines), które składają się z dwóch zasadniczych części. Na pierwszą, składa się program analizujący i indeksujący tekst dokumentów na stronach WWW i stronach, do których prowadzą odsyłacze. Druga część, to program, który obsługuje zapytania użytkowników umożliwiając im wygodny dostęp do zgromadzonej bazy danych o skatalogowanych stronach WWW.
Pierwszy z tych programów określa się w żargonie jako ,,pająk" (spider, crawler), gdyż jest to program, który dociera do kolejnych dokumentów znajdujących się w węzłach sieci WWW, próbuje określić ich tematykę, wybiera słowa kluczowe (wg miejsca i częstotliwości ich występowania) i decyduje o ich ważności w bazie danych.
Drugi z programów obsługuje zapytania użytkowników (kwerendy) kierowane do bazy danych o słowach kluczowych. Wyszukanie potrzebnej informacji wymaga podania programowi przeszukującemu zasoby WWW kryteriów wyszukiwania, tj. słowa bądź słów kluczowych, wyrażeń i zdań połączonych operatorami. Niestety, nie wszystkie szperacze korzystają z tych samych operatorów, więc dobrze jest zapoznać się ze stosownym fragmentem opisu działania konkretnej wyszukiwarki lub używać możliwości tworzenia złożonych kwerend przy pomocy odpowiednich formularzy.
Oto najważniejsze z wyszukiwarek internetowych:
Do przeszukiwania zasobów internetowych można także używać tzw. multiwyszukiwarek, czyli serwisów internetowych, które w imieniu użytkownika potrafią wysyłać zapytania do szeregu samodzielnych szperaczy i uzyskanych odpowiedzi tworzyć jedną, zbiorczą listę. Oto niektóre z nich: search.com, www.startingpage.com, www.xrefer.com, www.zeek.com, www.c4.com, www.mamma.com (patrz np. www.searchengines.pl, www.philb.com/msengine.htm).
Warto wypróbować działanie szeregu z tych serwisów, aby ocenić ich przydatność, skuteczność oraz szybkość. Okazuje się bowiem, że mimo identycznie zadanego pytania programy te mogą dawać (i na ogół dają) różne odpowiedzi. Dzieje się tak dlatego, że każdy z nich przeszukuje i indeksuje strony WWW według nieco innych kryteriów i inaczej podaje wyniki tych przeszukiwań.
W celu szybkiego dotarcia do poszukiwanego dokumentu należy jako słowa kluczowe wybierać słowa (wyrażenia), które są dla danego dokumentu charakterystyczne i nie wystepują lub występują rzadziej gdzie indziej. To jest najłatwiejszy sposób poprawienia jakość otrzymywanych odpowiedzi. Im więcej słów wystąpi w zapytaniu, tym odpowiedź będzie lepsza i dokładniejsza. Np. zamiast drukarka lepiej napisać drukarka HP kolorowa, gdyż google (podobnie jak inne wyszukiwarki) porządkuje znalezione strony w taki sposób, aby na początku listy znalazły się dokumenty najbardziej odpowiadające poszukiwanym słowom.
Niezależnie od używanego systemu operacyjnego internauta może wybierać spośród dziesiątków rozmaitych programów do przeglądania zasobów Sieci. Do najpopularniejszych przeglądarek należy niewątpliwie Internet Explorer, który jest dołączany do systemu Windows oraz Netscape Navigator dostępny dla systemu Windows oraz Unix/Linux (pierwszej z nich używa około 74% internautów, drugiej około 24%). Wsród innych przeglądarek warto wymienić Mozillę, Galeon oraz Operę, która uważana za najszybszą przeglądarkę, tj. przeglądarkę, która najszybciej tworzy obraz strony po pobraniu składających się na nią elementów).
Pod wieloma względami są one podobne. Bezpośrednio po uruchomieniu programu następuję samoczynne ładowanie strony głównej (home page). Jeśli jest to strona nielokalna, to prawidłowe funkcjonowanie przeglądarki wymaga uprzedniego przyłączenie komputera do sieci. Można jednak łatwo zmienić URL strony głównej lub w ogóle zrezygnować z jej ładowania i w ten sposób korzystać z przeglądarki w trybie odłączenia od sieci do przeglądania plików HTML-owych zgromachonych na dysku.
Po podaniu przez użytkownika URL-u rozpoczyna się ładowanie wskazanej strony i ewentualnie uruchamianie odpowiednich nakładek. Kolejno pobierane strony są automatycznie zapamiętywane na dysku w obszarze zarezerwowanym na tzw. pamięć pomocniczą (cache), aby można było szybko dotrzeć do już przeglądanych strony posługując się odpowiednimi klawiszami. Całe strony (ramki) oraz elementy graficzne można zapisywać na dysku w wybranym katalogu posługując się odpowiednimi opcjami głównego menu (Plik w IE) lub menu rozwijanym przez naciśnięcie prawego klawisza myszki. Jeśli od ostatniego ładowania jakiejś strony jej zwartość uległa zmianie, to można zaktualizować jej zawartość w przeglądarce korzystając z klawisza Odśwież.
Zazwyczaj strony WWW zawierają informację o stosowanym sposobie kodowania znaków danego języka, co pozwala przeglądarce poprawnie je wyświetlać. W przeciwnym razie można poprzez wybór odpowiednich opcji z menu wymusić na przeglądarce stosowanie wskazanego rodzaju kodowania znaków. W przypadku polskich stron WWW najczęściej jest stosowany format kodowania ISO 8859-2 i Windows (CP-1250).
W czasie żeglowania po WWW odwiedza się dziesiątki rozmaitych stron i adresy niektórych z nich chciałoby się zapisać, aby móc do nich łatwo wrócić w przyszłości. Dlatego przeglądarki są wyposażone w odpowiednie narzędzie do szybkiego tworzenia ,,zakładek", czyli zapamiętywania (i porządkowania) adresów URL ulubionych stron.
Ładowanie stron zawierających grafikę (ew. sekwencje audio lub wideo) wymaga zazwyczaj przesłania kilkudziesięciu, a nawet kilkuset kilobajtów danych, co szczególnie przy korzystaniu z wolnych połączeń modemowych może być uciążliwe. W takich przypadkach, a także kiedy nie zależy nam na oglądaniu graficznych ozdobników stron lub animacji realizowanych przez aplety i skrypty napisane w języku Java, lecz jedynie na samej informacji tekstowej, należy zmienić w tym celu odpowiednie ustawienia konfiguracyjne przeglądarki.
Przeglądarki automatycznie obsługują szereg podstawowych formatów danych takich jak html, txt, gif, jpeg oraz niektórych formatów danych dźwiękowych i filmowych (jest to zależne od rodzaju przeglądarki). Z uwagi jednak na ogromną rozmaitość stosowanych formatów danych multimedialnych nie jest możliwa obsługa ich wszystkich. Dlatego przeglądarki są wyposażone w mechamizm pozwalający na współpracę z innymi, zewnętrznymi programami (tzw. wtyczkami, plugins) w celu obsługi specyficznych typów danych, np. grafiki trójwymiarowej, animacji, gier, audycji radiowych, itp. Jeśli takiego programu nie ma, to napotkany plik jest zapisywany na dysku komputera.
Jeśli kliknie się na stronie WWW łącze (link), który wskazuje na jakiś plik, to wówczas serwer strony przekazuje przeglądarce typ MIME tego pliku. Np. text/html jest typem przypisanym do zwykłej strony WWW. W większości przypadków tego typu identyfikacja wystarcza do poprawnej obsługi pliku. W przeciwnym razie trzeba uzależnić działania podejmowane przez przeglądarkę od rozszerzenia pliku modyfikując odpowiednio ustawienia konfiguracyjne przeglądarki.
Oto lista najczęściej spotykanych typów plików i charakterystycznych dla nich rozszerzeń:
Przykłady typów MIME i odpowiadających item rozszerzeń plików znajdują się w poniższej tabeli:
| application/bzip2 | bz2 |
| application/mime | mim,mime |
| application/msword | doc,dot,wiz,wzs |
| application/pdf | |
| application/postscript | ps,eps,ai |
| application/rtf | rtf |
| application/vnd.ms-excel | xl,xla,xlb,xlc,xld,xlk |
| application/vnd.ms-powerpoint | pot,ppa,pps,ppt,pwz |
| application/x-latex | latex,ltx,tex |
| application/x-msdownload | exe |
| audio/mpeg | mp3,mp2,mpga |
| audio/mpeg3 | mp3 |
| audio/wav | wav |
| image/gif | gif |
| image/jpeg | jpeg,jpe,jpg |
| text/comma-separated-values | cvs |
| text/css | cvs |
| text/html | htm,html |
| text/plain | txt |
| text/xml | xml |
| video/mpeg | mpeg,mpg,mpe,m2v,m1v,mpa |
| video/msvideo | avi |
| video/x-msvideo | avi |
Poczta elektroniczna jest obok serwisu WWW najpopularniejszą usługą internetową. W przeciwieństwie jednak do WWW nie wystarczy dysponować odpowiednio skonfigurowanym komputerem przyłączonym do sieci, aby móc z niej korzystać. Otrzymywanie i wysyłanie listów wymaga dostępu do tzw. serwera poczty elektronicznej i posiadania na takim serwerze osobnego konta. Wiele instytucji naukowych, firm, itp. posiada własne serwery pocztowe i naturalnie ich pracownicy mają swoje konta i związane z nimi skrzynki pocztowe na tych właśnie serwerach. Indywidualnym użytkownikom dostęp do skrzynek pocztowych oferują (odpłatnie i nieodpłatnie) dostawcy usług internetowych oraz portale internetowe. Procedura rejestracyjna jest dokonywana zdalnie pod adresem przy pomocy przeglądarki WWW i stosownego formularza zgłoszeniowego. Użytkownik wybiera swój identyfikator, np. j.kowalski, pod którym będzie znany w Internecie. Pełny adres pocztowy składa się z identyfikatora użytkownika oraz nazwy domenowej serwera przedzielonych znakiem @. Tak więc internetowy adres, tj. adres poczty elektronicznej, Jana Kowalskiego w serwisie np. Wirtualnej Polski byłby następujący: j.kowalski@wp\.pl.
Załóżmy, że w pewnym mieście mamy dwa urzędy pocztowe: onet.pl i wp.pl. W którymś z nich każdy z mieszkańców ma swoją osobistą skrytkę pocztową (zamykaną na kluczyk). Przekazanie wiadomości listownej może przebiegać na dwa sposoby.
Jan może jednak wykorzystać swój komputer do uruchomienia programu pocztowego (takiego jak Outlook Express, Netscape Messenger, Pegasus, Eudora, itp.), przy pomocy którego redaguje list, podaje adres pod który list ma zostać doręczony i przesyła go do serwera pocztowego, na którym ma skrytkę pocztową. Do przekazania listu pomiędzy komputerem użytkownika i serwerem pocztowym wykorzystywany jest również protokół SMTP. Karol, aby sprawdzić czy jest dla niego poczta, może udać się do swojego urzędu pocztowego i sprawdzić zawartość skrytki. Odpowiada to logowaniu się do serwera wp.pl i uruchomieniu odpowiedniego programu pocztowego. Może jednak wykorzystać program pocztowy (np. Outlook Express) do sprawdzenia, czy w jego skrytce są nowe listy i kazać je sobie przesłać do domu, czyli umieścić na swoim komputerze. Operacja sprawdzania i pobierania poczty jest wykonywana w oparciu o protokół POP (Post Office Protocol) lub IMAP (Internet Mail Access Protocol).
Zatem działanie poczty elektronicznej można przedstawić przy pomocy następującego schematu:
mail <-----> |-------------| <-----> TCP/IP
mutt <-----> | sendmail |
pine <-----> |-------------| <-----> lokalna
POP/IMAP
Outlook Express <-----> <----- |-------------| <-----> TCP/IP
| sendmail |
Netscape Messenger <-----> -----> |-------------| <-----> lokalna
SMTP
|-------------| <------> |------------|
| sendmail | TCP/IP | sendmail |
|-------------| SMTP |------------|
Jak wiadomo przy pomocy poczty elektronicznej można przesyłać nie tylko informacje tekstowe, ale wszelkie dane binarne. Trzeba to jednak robić w postaci tzw. załączników, czyli danych binarnych, które na potrzeby poczty elektronicznej są przekształcane do postaci tekstowej (ASCII). Służy do tego metoda zwana base64, która zamienia grupy 3 kolejnych bajtów w 4 znaki ASCII.
Wszystkie nowoczesne programy pocztowe pozwalają na odczytywanie załączników do listów i równie łatwe dołączanie dowolnych plików z danymi do listów. Problem może powstać jedynie wówczas, gdy dwa programy pocztowe (nadawcy i adresata) stosują odmienne zasady kodowania danych. Obecnie najpopularniejszym standardem rozwiązującym ten problem i umożliwiającym przesyłanie dowolnych danych, w tym listów zawierających polskie litery (a funkcjonuje około 20 sposobów kodowania polskich znaków!) jest standard MIME (Multipurpose Internet Mail Extension) - uniwersalne rozszerzenie poczty internetowej. Jeśli przesyłany plik jest duży, to warto przed przesłaniem poddać go kompresji.
W Uzupełnieniu znajduje się przykład listu wysłanego przy pomocy komendy telnet oraz struktura listu zawierającego załączniki.
Dostępnych jest cały szereg rozmaitych programów pocztowych pracujących w systemie Windows. Bardzo popularne, bo dobre, wygodne w użyciu i bezpłatne są także programy takie jak Eudora firmy Qualcomm ( ftp.qualcomm.com) oraz PMessenger firmy Pegasus ( www.pegasus.usa.com). Ten ostatni program jest godny polecenia szczególnie wówczas, gdy jeden komputer osobisty ma być wykorzystywany do kontaktu z serwerem pocztowym przez wiele osób, z których każda chce posługiwać się oddzielnym identyfikatorem. Pegasus Messenger pozwala się bowiem skonfigurować oddzielnie dla każdego z użytkowników wymagając jednak stosowania dodatkowych identyfikatorów i haseł.
Przy pomocy komputera osobistego można także wysyłać i przyjmować faksy pod warunkiem posiadania tzw. fax-modemu i odpowiedniego oprogramowania, które zwykle dostarczane jest wraz z urządzeniem.
Każdy z programów pocztowych pozwala na przygotowanie nowego listu. W tym celu należy wskazać myszą właściwą ikonę lub wybrać odpowiednie ,,danie" z menu. Zwykle wysłanie listu składa się z czterech kroków:
Ponadto programy pocztowe umożliwiają dodatkowo wskazania w polu Kopia (Carbon Copy, CC) adresu pocztowego osoby (osób), które otrzymają kopię listu. Podobnie w polu BCC (od Blind Carbon Copy) można podać adres osoby, która otrzyma kopię listu, ale w taki sposób, że nie będzie o tym wiedział główny adresat listu. Dodatkowo można do listu włączyć zawartość pliku tekstowego z dysku, dorzucić załącznik, dodać własny nagłówek itp.
Jeśli komputer nie jest na stałe przyłączony do sieci, to próba wysłania listu spowoduje umieszczenie go w kolejce listów oczekujących na wysłanie. Wysłanie bowiem listów wymaga najpierw nawiązania połączenia z serwerem dostawcy usług internetowych, w celu uzyskania dostępu do Internetu. Dopiero po uzyskaniu połączenia można zażądać od programu pocztowego, aby nawiązał połączenie (poprzez protokół SMTP) z serwerem pocztowym zajmującym się rozsyłaniem listów i przekazał do wysłania przygotowane wcześniej listy. Program pocztowy na komputerze osobistym sam nie rozsyła poczty, lecz jedynie przekazuje listy serwerowi pocztowemu. Korzystając z usług tradycyjnej poczty piszemy list, wkładamy go do zaadresowanej koperty i wrzucamy do najbliższej skrzynki pocztowej. Program pocztowy na komputerze osobistym pełni rolę tego pracownika poczty, którego zadaniem jest opróżnienie skrzynki pocztowej i dostarczenie listów do urzędu pocztowego, gdzie następuje ich sortowanie i rozesłanie.
Przy prowadzeniu rozległej korespondencji jest rzeczą bardzo uciążliwą wpisywanie za każdym razem pełnego adresu i sprawdzanie, czy adres został podany poprawnie. Dlatego każdy dobry program pocztowy umożliwia korzystanie z ,,książki adresowej", czyli odpowiednio tworzonej listy adresów pocztowych. Najczęściej programy pocztowe pozwalają na podawanie w polu przeznaczonym na adres pocztowy nie pełnego adresu, lecz jedynie jego skrótu (alias, nickname), który przed wysłaniem listu jest zastępowany przez właściwy adres pocztowy adresata. Zwykle nie trzeba mozolnie przepisywać adresu z otrzymanego listu, ale wykorzystać właściwe dla danego programu pocztowego sposoby przeciągania i wklejania adresu (z pola To, From, CC, Replay-To do książki adresowej).
Większość programów pocztowych pozwala także na wygodne dołączanie do zwykłego listu (czyli informacji tekstowej) w formie tzw. załączników innych danych tekstowych oraz nietekstowych, takich jak obraz, dźwięk.
Pobieranie poczty z serwera pocztowego jest czynnością odwrotną do wysyłania listów i oczywiście również wymaga wcześniejszego podłączenia do sieci komputerowej. Dopiero po uzyskaniu takiego połączenia staje się możliwe nawiązanie ,,rozmowy" (w ramach protokołu POP) przez komputer użytkownika z serwerem pocztowym, sprawdzenie czy są jakieś nowe listy i ewentualne pobranie poczty i umieszczenie jej na lokalnym dysku. Trzeba pamiętać, że serwer pocztowy, z którego odbierana jest poczta nie musi być identyczny z serwerem obsługującym wysyłanie poczty. W czasie konfigurowania programu pocztowego trzeba podać adres IP zarówno serwera POP/IMAP (poczty przychodzącej) jak i serwera SMTP (poczty wychodzącej).
Zwykle program pocztowy jest tak skonfigurowany, że po pobraniu poczty i umieszczeniu (skopiowaniu) jej na lokalnym dysku komputera, listy na serwerze pocztowym są usuwane. Można jednak spowodować, aby listy na serwerze pocztowym pozostawały. Takie postępowanie nie jest jednak zalecane, gdyż w końcu dojdzie do całkowitego zapełnienia skrzynki pocztowej i odmowy przyjmowania przez serwer nadchodzącej poczty.
Niezwykle prostą czynnością jest przygotowanie odpowiedzi na otrzymany list. Wystarczy z odpowiedniego menu (lub przy pomocy ikony) wybrać Odpowiedź ( Reply), aby otworzyć osobne okno z automatycznie wypełnionymi polami adresu, tematu i kopii oraz oryginalną wiadomością będącą fragmentem przygotowywanego listu (każda linia tej wiadomości jest wyróżniona znakiem > ).
Podobnie łatwo jest otrzymany list przesłać na inny adres. Wystarczy skorzystać z funkcji Przekaż (Forward) i podać adres pocztowy adresata.
Wiele z listów, które otrzymujemy nadaje się do usunięcia zaraz po przeczytaniu (niektóre listy warto usunąć nawet przed przeczytaniem!). Z tymi, które pozostają trzeba prędzej czy później zrobić porządek. Do tego służą segregatory (foldery, ang. folders) pozwalające segregować listy podług adresata, tematu, itd. Idea jest taka same we wszystkich programach pocztowych, różnice występują jedynie w szczegółach realizacji i złożoności proponowanego użytkownikowi systemu. Dobrze jest pod tym kątem przyjrzeć się kilku programom pocztowym, by wybrać najdogodniejszy.
Z wymianą wiadomości w Internecie związane są dwie bardzo rozpowszechnione i niezmiernie użyteczne usługi jakimi są listy adresowe oraz grupy dyskusyjne. Służą one szybkiej wymianie informacji i ułatwiają prowadzenie dyskusji.
Każda lista adresowa jest obsługiwana przez jakiś serwer, który przechowuje listę członków listy i ich adresy poczty elektronicznej oraz zajmuje się rozsyłaniem listów kierowanych na adres listy do wszystkich jej subskrybentów. By zostać członkiem takiej listy trzeba wysłać na adres serwera listy, np. listserv@man.torun.pl, list zawierający tylko jeden wiersz z komenda subscribe, nazwą listy oraz imie i nazwisko osoby wysyłającej list. Np. wysłanie listu z tekstem subscribe test-l Jan Kowalski spowoduje automatyczne uzupełnienie członków testowej listy adresowej utrzymywanej na serwerze flis.man.torun.pl o Jana Kowalskiego i dopisanie jego adresu poczty elektronicznej (pobranej z nagłówka listu) do listy adresowej test-l. Jeżeli operacja rejestracji została wykonana poprawnie, to zwykle po niedługim czasie Jan Kowalski otrzyma list z serwera listy z odpowiednim zawiadomieniem oraz instrukcjami jak z korzystać z usług serwera. Od tej chwili Jan Kowalski nie tylko będzie otrzymywał kopie listów słanych na adres listy (tj. test-l@man.torun.pl), ale także sam uzyskuje prawo do kierowania listów na adres listy.
Grupy dyskusyjne podobnie jak listy adresowe służą szybkiemu dzieleniu się informacjami lub opiniami z internautami. W przeciwnieństwie jednak do list adresowych dostęp do zasobów list dyskusyjnych mają wszyscy użytkownicy Internetu, a nie tylko subskrybenci. Wysłanie wiadomości na adres jakieś grupy dyskusyjnej można traktować jak umieszczenie jej na ogólnodostępnej tablicy ogłoszeń, z tym tylko zastrzeżeniem, że każda grupa dyskusyjna dysponuje swoją własną tablicą. Wystarczy mieć odpowiedni program komputerowy oraz znać adres serwera list dyskusyjnych, by móc przeglądać i uzupełniać zawartość tych tablic.
Najbardziej znanym i najpopularniejszym zbiorem grup dyskusyjnych z całego świata jest Usenet. Jest to system serwerów obsługujących konkretne grupy dyskusyjne i jednocześnie wymieniających między sobą informacje o pozostałych (wybranych) grupach. Wymiana poglądów odbywa się w ponad 30 tys. grup dyskusyjnych zawierających teksty rozpoczynające dyskusję (artykuły) oraz komentarze do tych artykułów (kontynuacje wątku). Wątkowa przeglądarka grup dyskusyjnych porządkuje artykuły, aby można było łatwo śledzić przebieg dyskusji. Grupy dyskusyjne są codziennie odwiedzane przez około 15 mln ludzi z ponad 100 krajów. Wiadomości z grup dyskusyjnych są udostępniane w Internecie przez serwery NNTP (Network News Trasfer Protocol - protokół przesyłania sieciowych grup dyskusyjnych).
Z uwagi na ogromną liczbę rozmaitego rodzaju grup tematycznych oraz ograniczenia sprzętowe serwery Usenet oferują jedynie dostęp do wybranych grup tematycznych. Grupy dyskusyjne w Usenecie podzielone są na około 20 zasadniczych klas tematycznych (kategorii nadrzędnych). Oto kilka takich klas:
Adresy grup dyskusyjnych nie są przypadkowe, lecz mają swoją strukturą odzwierciedlającą hierarchię klas tematycznych i grup dyskusyjnych. Np. adres sci.med.diseases.cancer wyraźnie wskazuje na charakter zainteresowania tej grupy dyskusyjnej, która stanowi część kategorii sci.
Skrótem FAQ (Frequently Asked Questions - często zadawane pytania) określa się dokument (regularnie) publikowany w grupie dyskusyjnej, który zawiera listę najczęściej zadawanych pytań przez uczestników grupy dyskusyjnej wraz z odpowiedziami uzyskanymi od bardziej doświadczonych jej uczestników.
Występują dwa rodzaje grup dyskusyjnych: moderowane i niemoderowane. W grupie moderowanej wszelkie nadsyłane do rozpowszechnienia wiadomości są wpierw czytane przez osobę kontrolującą przebieg dyskusji. Od jej uznania zależy czy wiadomość nadesłana zostanie upowszechniona. Chodzi przede wszystkim o zapewnienie, aby rozpowszechniane wiadomości dotyczyły tematyki, którą zajmuje się dana grupa dyskusyjna. Dzięki moderowaniu unika się też publikowania treści kontrowersyjnych, obraźliwych, wulgarnych. Niecenzurowane treści pojawiają się w grupach niemoderowanych. Często jednak agresywne artykuły zawierające obraźliwe uwagi mogą prowadzić do wojny na tzw. bluzgi, czyli wymiany listów o małej zawartości merytorycznej, ale o dużym ładunku emocjonalnym.
Warto zajrzeć na stronę www.tile.net, gdzie znajdują się zebrane
wiadomości o listach adresowych w Internecie oraz grupach
dyskusyjnych. Znaleźć tam można informacje o listach pogrupowane
według nazw i tematów wraz z krótkimi opisami. Dostęp do polskich grup
dyskusyjnych jest możliwy np. poprzez serwis onet.pl (niusy.onet.pl).
Ponieważ Usenet istnieje już około 20 lat, więc nic dziwnego, że doszło do powstania swoistego savoir-vivre'u, który obowiązuje uczestników grup dyskusyjnych. Zaleca się zatem, aby nowicjusze zapoznali się z zasadami netykiety, by potrafili właściwie się zachować i uniknęli niepotrzebnych połajanek. Oto lista najważniejszych i - raczej dość oczywistych - zaleceń:
Wymianie listów towarzyszy częste stosowanie typowych zwrotów, więc w celu ułatwienia pisania wprowadzono szereg kilkuliterowych skrótów, z których najważniejsze zebrano poniżej:
| AFAIK | As far as I know | O ile wiem |
| AFK | Away from keyboard | Z dala od klawiatury |
| BCNU | Be seeing you | Na razie |
| BRB | Be right back | Zaraz wracam |
| BTW | By the way | A propos |
| CUL | See you later | Pogadamy później |
| FAQ | Frequently asked questions | Często zadawane pytania |
| IMO | In my opinion | Moim zdaniem |
| IMHO | In my humble opinion | Moim skromnym zdaniem |
| LOL | Laughing out loud | Boki zrywać |
| MORF? | Male or female? | Mężczyzna czy kobieta? |
| OAO | Over and out | Bez odbioru |
| OIC | Oh I see | Ach tak |
| ROFL | Rolling on the floor laughing | Tarzam się ze śmiechu |
| RUOK | Are you OK? | Wszystko w porządku? |
| THX | Thanks | Dzięki |
| TIA | Thank you in advance | Z góry dziękuję |
| WYSIWYG | What you see is what you get | Dostajesz to, co widzisz |
Wśród użytkowników Internetu ustalił się zwyczaj uzupełniania pisanej informacji o nastrój lub odczucia poprzez umieszczanie w tekście specjalnych znaków symboli w postaci tzw. ,,twarzyczek". Oto lista najczęściej spotykanych znaków wraz z objaśnieniem ich znaczenia:
| :-) | wesoły | \-O | ziewanie |
| :-)) | bardzo wesoły | :-| | hmmm! |
| ;-) | perskie oko | :-|| | zły |
| :-7 | wymuszony uśmiech | %-) | zakłopotany |
| :-D | głośny śmiech | :-X | milczenie |
| :-p | kpina | :-& | oniemiały |
| :-* | pocałunek | :-/ | niezdecydowany |
| :-( | smutny | :- | wrzask |
| :-(( | bardzo smutny | :-V | krzyk |
| :'-( | płacz | :-O | szok |
Komunikacja w sieci Internet odbywa się przy wykorzystaniu łączy komunikacyjnych, które nie gwarantują poufności przesyłania danych. Oprócz tego wszelka korespondencja jest składowana na serwerach poczty elektronicznej, więc do listów mają nieskrępowany dostęp administratorzy tych serwerów. Jeśli chcemy zapewnić, by niepowołane osoby nie miały dostępu do przesyłanych wiadomości, to koniecznie trzeba je przed wysłaniem zaszyfrować. Oznacza to jednak, że odbiorca zaszyfrowanej wiadomości musi posiadać klucz do jej rozszyfrowania. W jaki jednak spoób bezpiecznie przekazać klucz kanałami narażonymi na podsłuch? Można to oczywiście zrobić przekazując klucz osobiście, ale w przypadku komunikacji w Internecie nie jest to rozwiązanie praktyczne. Poza tym w jaki sposób rozwiązać sprawę przekazywania w bezpieczny hasła serwerowi, na który chcemy się zalogować? Jak przekazać w poufny sposób numer karty kredytowej przy zapłacie za towary kupione w sklepie internetowym lub jak dokonywać zdalnych operacji na własnym koncie bankowym?
Okazuje się, że można te problemy rozwiązać stosując szyfrowanie z kluczem symetrycznym, który jest przekazywany poprzez sieć przy wykorzystaniu szyfrowania opartego na parze kluczy. Jeśli Ek i Dk oznaczają odpowiednio algorytmy szyfrowania i deszyfrowania z kluczem k, to wówczas algorytm szyfrowania musi mieć następujące własności dla każdego komunikatu m:
Np. RC4 jest szeroko stosowanym algorytmem szyfrowania z kluczem symetrycznym opracowanym przez firmę RSA Data Security Inc. Algorytm ten wykorzystuje jeden klucz do szyfrowania i deszyfrowania wiadomości i wymaga względnie niewielkiego narzutu obliczeniowego. Wedle tego schematu działa także Standard Szyfrowania Danych (DES - Data Encription Standard) używany często do kodowania haseł użytkowników w systemach uniksowych.
W celu bezpiecznego przekazywania klucza stosuje się algorytm szyfrowania oparty na parze kluczy: prywatnym i publicznym. Najpopularniejszy z tych schematów jest oparty na trudności w rozkładzie liczby naturalnej na iloczyn dwóch liczb pierwszych i został zaproponowany przez Rivesta, Shamira i Adlemana i zwany jest algorytmem RSA. Klucz publicznego szyfrowania stanowi para (e,n); klucz prywatny jest parą (d,n), przy czym e, d i n są dodatnimi liczbami całkowitymi. Każdy komunikat jest reprezentowany jako liczba całkowita z przedziału [0,n-1] (dłuży komunikat tnie się na krótsze kawałki). Funkcje E i D są zdefiniowane następująco:
|
|
Liczba całkowita n jest obliczana jako iloczyn dwu wielkich (100 i więcej cyfrowych) liczb pierwszych i chociaż jest powszechnie znana, to trudność złamania tego schematu szyfrowania bierze się z trudności w odgadnięciu liczb pierwszych. Stosowanie tej techniki szyfrowania w połaczeniu z właściwiściami funkcji mieszającej (dzięki której można dokonywać skrótu wiadomości) pozwala nie tylko na bezpieczne przesyłanie danych, ale także na stosowanie elektronicznych podpisów do uwierzytelniania dokumentów oraz kontroli integralności danych w czasie ich przesyłania przez Internet. Wyjaśnia to poniższa tabela:
| nadawca A | odbiorca B | typ |
| (kSA, kPA) | (kSB, kPB) | komunikacji |
| EkPB(m) = c | DkSB(c) = m | poufna |
| EkSA(m) = c | DkPA(c) = m | uwierzytelniona |
| h(m) = N | ||
| EkSA(N) = cN | ||
| EkPB(m+cN) = c | DkSB(c) = m+cN | poufna |
| DkPA(cN) = N | uwierzytelniona | |
| h(m) = N | niezmieniona | |
| kSi - klucz prywatny (sekretny) i | ||
| kPi - klucz publiczny (ogólnie dostępny) i | ||
| h - funkcja mieszająca | ||
Ten schemat kodowania stosowany z odpowiednio długim kluczem jest
praktycznie nie do złamania. Problemem pozostaje bezpieczne
przekazywanie kluczy publicznych i ich uwierzytelnianie. Zajmują się
tym niezależne firmy i organizacje takie jak np. GlobalSign
(www.globalsign.net) lub Verisign (www.verisign.com)12.
SSL (Secure Sockets Layer), tj. warstwa bezpiecznych gniazdek, jest standardem zabezpieczeń internetowych zaproponowanym przez firmę Netscape Communications. Standard SSL jest niezależny od aplikacji i współpracuje z wszelkimi narzędziami internetowymi, gdyż SSL działa w warstwie sieci, a nie w warstwie aplikacji. Aplikacje korzystające z SSL stosują algorytm szyfrowania RSA z kluczem publicznym, certyfikaty RSA i podpisy cyfrowe do identyfikowania stron biorących udział w transakcji. Po nawiązaniu połączenia następuje wymiana kluczy, po czym do zabezpieczenia transakcji stosuje się algorytm szyfrowania z kluczem symetrycznym RC4. Zastosowanie w przeglądarce Netscape Navigator 128-bitowego klucza sprawia, że dekodowanie zaszyfrowanych wiadomości przekracza (praktycznie) możliwości obliczeniowe. Eksportowa wersja tej przeglądarki korzystała jeszcze do niedawna tylko z 40-bitowego klucza i dlatego nie nadawała się przeprowadzania transakcji handlowych w Internecie. Ograniczenie to już nie obowiązuje, gdyż w połowie 2000 rząd USA zniósł ograniczenia eksportowe na oprogramowanie szyfrujące bazujące na długim kluczu. Do zapewnienia najbezpieczniejszego połączenia przeglądarki z serwerem stron WWW jest także od niedawna używany protokół TLS (Transport Layer Security).
Jeśli przeglądarka dociera do zabezpieczonej strony, to zmianie ulega ikona kłódki znajdująca się na przeglądarce. Klikając na tę kłódkę można uzyskać informacje o poziomie zabezpieczeń stosowanych na odwiedzanej stronie. Niektóre przeglądarki pozwalają na taką ich konfigurację, aby możliwe było tylko otwieranie stron chronionych kluczem 128. bitowym.
Uwierzytelnianie odwiedzanych stron jest możliwe dzięki ich certyfikatom. Są one poświadczane przez odpowiednie urzędy lub firmy certyfikacyjne, których lista jest zwykle dołączana do przeglądarki i może być w razie potrzeby zmieniona. Jeśli zachodzi potrzeba uwierzytelnienia użytkownika przeglądarki przed serwerem, to musi on najpierw uzyskać swój osobisty certyfikat, a potem dodać go do przeglądarki. Przeglądarki pozwalają na zarządzanie certyfikatami osobistymi, ceryfikatami serwerów WWW oraz organizacji certyfikujących.
SET (Secure Electronic Transaction) jest nowym standardem gwarantującym bezpieczne posługiwanie się kartami płatniczymi w Internecie. Dokonywanie zakupów przy pomocy tego systemu wymaga od banku wydającego kartę płatniczą wystawienia także certyfikatu potwierdzającego prawo do posługiwania się konkretną kartą płatniczą. Certyfikat ten w postaci zaszyfrowanej i zabezpieczonej hasłem jest umieszczany na dysku komputera. Po wybraniu towarów w wirtualnym sklepie następuje sprawdzenie, czy firma wystawiająca rachunek za towary ma prawo przyjmować zapłatę kartami płatniczymi. Jeśli tak, to po podaniu hasła pobierane są dane z certyfikatu karty płatniczej i następuje podpisanie rachunku. W ten sposób sklep (ani nikt inny) nie wchodzi w posiadanie informacji zawartej na karcie płatniczej. Równocześnie sklep uzyskuje pewność, że klient jest uprawniony do posługiwania się kartą płatniczą w transakcjach handlowych w Internecie. Podpisane zamówienie jest kierowane do centrum rozliczeniowego, z którym współpracuje sprzedawca.
Skoro adres Jana Kowalskiego jest publicznie znany, to jak zabezpieczyć się przed dostępem do jego skrzynki pocztowej innych, niepowołanych osób? Jak zapewnić poufność listów elektronicznych?
Korzystanie z serwera pocztowego wymaga nie tylko znajomości (ogólnodostępnego) identyfikatora użytkownika, ale także jego tajnego hasła, czyli ciągu znaków, które zna jedynie sam użytkownik i serwer pocztowy. Przy każdej próbie kontaktu z serwerem pocztowym w celu pobrania listu serwer sprawdza, czy użytkownik przedstawiający się jako np. jan, jest nim w istocie żądając podania hasła związanego z tym identyfikatorem. Tylko wówczas, kiedy sprawdzenie tożsamości wypadnie pomyślnie serwer podejmuje dialog z użytkownikiem, a dokładniej z programem do obsługi poczty elektronicznej zainstalowanym na jego komputerze, i pozwala na pobranie listów ze skrzynki. Dlatego też korzystanie z programu do obsługi poczty elektronicznej wymaga uprzedniej konfiguracji tego programu w celu podania adresu serwera pocztowego, na którym znajduje się skrzynka pocztowa, identyfikatora użytkownika i ewentualnie jego hasła (przy braku hasła użytkownik będzie musiał je podawać przy każdej próbie pobierania poczty).
Trzeba pamiętać, że samo hasło nie zapewnia całkowitej poufności korespondencji elektronicznej. Jeśli jest ono starannie dobrane, to jedynie utrudnia niepowołanym osobom (intruzom komputerowym) dotarcie do cudzej skrzynki pocztowej, ale nie eliminuje całkowicie takiej możliwości. Do skrytki pocztowej na serwerze ma bowiem zawsze dostęp jego administrator, czyli osoba upoważniona i odpowiedzialna za jego poprawną pracę. Poza tym listy przesyłane z komputera osobistego do serwera (i z powrotem) są przekazywane łączami otwartymi, które mogą być narażone na podsłuch. Dlatego pełną poufność można uzyskać jedynie szyfrując przekazywane wiadomości i dane.
Firma RSA wprowadziła standard S/MIME (Secure Multi-Purpose Internet Messenger Extensions), który jest rozszerzeniem standardu MIME o możliwości bezpiecznego przesyłania poczty w oparciu o szyfrowanie według algorytmu RSA. To rozwiązanie stosowane jest przez takie programy do obsługi poczty elektronicznej jak Outlook Express oraz Netscape Messenger. S/MIME umożliwia zachowanie poufności korespondencji, dołączanie do listów cyfrowych podpisów oraz sygnalizację wszelkich prób zmiany zawartości listu. Ponieważ S/MIME jest standardem otwartym możliwa jest łatwa współpraca produktów (urządzeń i oprogramowania) różnych producentów.
Do wymiany szyfrowanych lub/i podpisanych elektronicznie listów i dokumentów można wykorzystać publicznie dostępny program gpg (GNU Privacy Guard), który jest dostępny dla systemu Windows oraz Unix/Linux (patrz www.gnupg.org). Jest to program do szyfrowania/deszyfrowania wiadomości oraz tworzenia podpisów cyfrowych, który jest zgodny z proponowanym standardem OpnePGP. Zawiera on także narzędzia do manipulowania generowanymi kluczami. Z tego programu można bezpośrednio korzystać w ramach programu pocztowego mutt/pine do szyfrowania listów lub/i wysyłania listów z elektronicznym podpisem.
Program telnet służący do pracy na odległym serwerze jest coraz częściej zastępowany jego bezpieczniejszą wersją, mianowicie programem ssh, który zapewnia poufność w przekazywaniu hasła oraz szyfruje całą komunikację między komputerem-klientem i serwerem. Program ten także pracuje w oparciu o system szyfrowania przy pomocy pary kluczy.13
W Uzupełnieniu znajdują się adresy stron www, gdzie można znaleźć więcej informacji na temat kryptografii i bezpieczeństwa w sieci.
System operacyjny Unix jest obok systemu MS-DOS i Windows jednym z najpopularniejszych obecnie systemów operacyjnych. Jest to system, który został napisany przez Kena Thompsona (a także Dennisa Ritchi'ego) w roku 1969 w AT&T Bell Laboratories i który po dotarciu na amerykańskie uniwersytety około roku 1974 był bardzo intensywnie rozwijany na wydziałach nauk komputerowych. W chwili obecnej występuje w bardzo wielu odmianach rozwijanych głównie przez producentów sprzętu komputerowego. I tak firma Sun Microsystem Ltd. sprzedaje swoją wersję Unixa pod nazwą Solaris (dawniej Sun OS), IBM - AIX, Silicon Graphics - IRIX, Digital Equipmant Corporation - Ultrix, Compaq - Tru64Unix. Istnieją także ogólnie dostępne (darmowe) wersje Unixa takie jak BSD Unix czy GNU/Linux. BSD Unix, to Unix rozwijany na Uniwersytecie Kalifornijskim w Berkeley i rozprowadzany w pakiecie o nazwie Berkeley System Distribution (w tym jego wersję na platformę 8086 o nazwie FreeBSD). Jądro systemu GNU/Linux napisał Linus Torvalds w 1991 r. i od tamtego czasu system jest stale intensywnie rozwijany przez ogromną rzeszę entuzjastów z całego świata. Poprzez sieć Internet oraz na płytach CD-ROM rozpowszechnianych jest wiele tzw. dystrybucji Linuxa (RedHat, SuSE, Caldera, Debian, itd.), czyli zestawów oprogramowania, na które składają się system operacyjny Linux oraz programy ułatwiające instalację oraz konfigurację systemu, a także cała gama programów użytkowych i narzędziowych.
W przeciwieństwie do systemu MS-DOS system Unix (a także Linux) został pomyślany i zaprojektowany jako system wielozadaniowy, wieloużytkownikowy i interaktywny. Oznacza to, że jeden bądź wielu użytkowników może równocześnie zlecać systemowi wykonanie szeregu oddzielnych zadań. W istocie system komputerowy (wyposażony w jeden procesor) nie obsługuje zleceń wszystkich użytkowników w tej samej chwili, czyli nie wykonuje wszystkich zadań naprawdę równocześnie, jak czyni to system wieloprocesorowy, lecz tylko sprawia takie wrażenie. System Unix jest bowiem systemem z podziałem czasu, w którym czas jednostki centralnej jest kolejno równo dzielony pomiędzy poszczególne zadania. Ponieważ jednostka centralna działa bardzo szybko każdy użytkownik odnosi wrażenie, że system obsługuje tylko jego zlecenia (oczywiście przy bardzo obciążonym systemie komputerowym to wrażenie znika). Zatem w każdej chwili czasu, a ściślej w trakcie ustalonego kwantu czasu, system operacyjny zajmuje się tylko jednym procesem (wykonującym się programem) pojedynczego użytkownika. Architektura systemu oraz sprzęt, który ją wspiera zapewniają ochronę integralności zasobów użytkowników oraz oddzielnych zadań, dzięki czemu setki różnorodnych procesów może się wykonywać równocześnie wzajemnie sobie nie przeszkadzając.
W jaki sposób system operacyjny rozróżnia poszczególnych użytkowników od siebie? Do tego celu służą identyfikatory i hasła użytkowników. Każdy z nich posiada swój jednoznaczny identyfikator (nazwę), który służy do zarejestrowania się w systemie, tzn. jest podawany w odpowiedzi na zapytanie login: (dlatego ten proces rejestrowania zwie się logowaniem). Identyfikatory użytkowników są jednak powszechnie znane, więc nie mogą być podstawą określania tożsamości użytkowników, gdyż każdy mógłby w czasie rejestrowania się podać cudzy identyfikator. Dlatego proces rejestracji wymaga także podania po zapytaniu passwd: tajnego hasła, czyli ciągu znaków znanych tylko właściwemu użytkownikowi. W ten sposób system operacyjny sprawdza autentyczność logującego się użytkownika i - jeśli sprawdzian wypada pozytywnie - udostępnia zasoby systemu, w tym prywatne dane użytkownika, takie jak jego skrzynkę pocztową oraz przypisany użytkownikowi katalog domowy (home directory).
Z uwagi na taki sposób sprawdzania autentyczności ogromnego znaczenia nabiera sprawa jakości hasła. Dlatego przy jego wyborze należy stosować się do poniższych zaleceń. Tworząc hasło nie należy używać:
Zaleca się natomiast stosowanie:
Do zmiany hasła służy komenda passwd.
Chcąc mieć pewność, że nikt postronny nie korzysta z naszego konta trzeba zwracać pilną uwagę na komunikaty pojawiające się w trakcie logowania. Przy każdym rejestrowaniu się system wypisuje datę ostatniego logowania oraz nazwę komputera, z którego ono nastąpiło. O wszelkich podejrzanych komunikatach należy niezwłocznie powiadomić administratora systemu i - oczywiście - zmienić natychmiast hasło.
Podobnie jak wiele nowoczesnych systemów operacyjnych system Unix wykorzystuje hierarchiczną (drzewiastą) strukturę plików, dzięki możliwości tworzenia katalogów i podkatalogów. W Unixie nie obowiązuje jednak ograniczenie 8.3 na format nazwy pliku (także katalogu), tzn. że nazwa pliku nie musi być co najwyżej ośmioznakowa i posiadać co najwyżej trójznakowe rozszerzenie. Przeciwnie, nazwy mogą się składać aż z 255 znaków i mogą zawierać więcej niż jedną kropkę. (Począwszy od systemu Windows w wersji 95 nazwy mogą być dłuższe i zawierać polskie znaki.) Warto pamiętać, że plik oznaczony pojedynczą kropką (.) oznacza bieżący (pod)katalog, a plik oznaczony dwiema kropkami (..) jego katalog macierzysty. W przeciwieństwie do systemu MS-DOS nazwy (pod)katalogów oddzielane są od siebie nie lewym (odwrotnym) ukośnikiem (\), lecz ukośnikiem prawym (/) (slaszem).
O nazwie bieżącego katalogu można się dowiedzieć przy pomocy komendy pwd (present working directory), a jego zawartość sprawdzić komendą ls. Chcąc uzyskać informację o wszystkich plikach oraz ich właściwościach trzeba użyć komendy ls -la. Oto przykład zastosowania takiej komendy:
drwxr-xr-x 31 note kmk 3072 Feb 4 12:31 .
drwxr-xr-x 10 root kmk 1024 Mar 19 1998 ..
-rwxr-xr-x 1 note kmk 2085 Nov 23 09:01 .Xclients
-rw-r--r-- 1 note kmk 1133 Jan 22 09:46 .Xresources
-rw-r--r-- 1 note kmk 5394 Feb 4 12:31 .calendar
-rw-r--r-- 1 note kmk 5664 Jan 15 1998 .emacs
-rw-r--r-- 1 note kmk 25010 Nov 25 18:30 .fvwm2rc
-rw-r--r-- 1 note kmk 977 Jan 27 18:07 .history
-rw-rw-r-- 1 note kmk 625 Dec 15 1997 .login
-rw-rw-r-- 1 note kmk 51 Nov 17 1997 .logout
-rw-rw-r-- 1 note kmk 1410 Feb 13 1998 .tcshrc
-rw-rw-r-- 1 note kmk 5320 Jan 18 17:06 .tcshrc-my
drwxr-xr-x 7 note kmk 1024 Jan 5 21:06 2dhf_dist
drwx------ 2 note kmk 1024 Mar 20 1998 Messenger
-rw-r--r-- 1 note kmk 79444 Jul 2 1998 xfon
Widać, że oprócz wspomnianych wyżej plików . oraz .. badany katalog domowy zawiera szereg innych plików, których nazwy rozpoczynają się od kropki. Są to pliki ukryte (komenda ls bez parametrów ich nie ujawnia), które zwykle zawierają dane potrzebne do konfiguracji rozmaitych programów użytkownika. Np. plik .login jest wykonywany przez powłokę w czasie logowania i zawiera definicje zmiennych, funkcji oraz pozwala na wykonanie pewnych komend (jego rola jest podobna do tej jaką pełni plik autoexec.bat w DOS-e). Analogicznie plik .logout jest wykonywany w czasie wylogowywania się, czyli po podaniu komendy logout, która kończy sesję terminalową powodując wyrejestrowanie użytkownika z systemu.
Każdy plik/katalog ma swojego właściciela, którego identyfikator znajduje się w kolumnie trzeciej oraz tzw. grupowego właściciela z identyfikatorem w kolumnie czwartej. Pierwsza kolumna zawiera natomiast informacje o typie pliku (- to zwykły plik, d - to katalog) oraz prawach dostępu do pliku dla jego właściciela (pierwsza trójka znaków), grupowego właściciela (druga trójka znaków) oraz wszystkich pozostałych użytkowników systemu. r oznacza prawo czytania pliku (od angielskiego read), w - prawo tworzenia i pisania do pliku (od write) oraz x - prawo wykonywania pliku (od execute). Jeśli plik jest komendą, programem, skryptem (plikiem zawierającym komendy) i został oznaczony jako plik do wykonania, to wówczas do jego uruchomienia wystarczy podać jego nazwę. Jeśli prawa dostępu dotyczą kartoteki, to w oznacza prawo tworzenia w niej plików, r - prawo przeglądania jej zawartości, a x - prawo uruchamiania znajdujących się w niej komend (programów i skryptów).
Komenda ls -a wypisuje wszystkie pliki z bieżącego katalogu wraz z plikami ukrytymi; ls -al wypisuje pliki w długim formacie, czyli wraz z właściwościami poszczególnych plików; ls -t daje listę plików uporządkowanych według czasu ostatniej modyfikacji; ls xx* wyświetla pliki rozpoczynające się na xx.
Podobnie jak MS-DOS system Unix zawiera szereg poleceń pozwalających na tworzenie i usuwanie katalogów, kopiowanie i przenoszenie plików między katalogami oraz na usuwanie plików. I tak komenda mkdir <katalog> (make directory) pozwala utworzyć nowy katalog o wskazanej nazwie, a komenda cd <katalog> przejść do niego, tj. uczynić go katalogiem bieżącym. Powrót do katalogu macierzystego odbywa się poprzez użycie komendy cd .. (dwie kropki). Komenda rmdir <katalog> usuwa katalog o podanej nazwie. Komenda cp <nazwa-stara> <nazwa-nowa> tworzy kopię pliku <nazwa-stara> pod nazwą <nazwa-nowa>. Natomiast komenda mv <nazwa-stara> <nazwa-nowa> zmienia nazwę pliku lub katalogu z <nazwa-stara> na <nazwa-nowa>.
Dla wygody użytkownika stworzono narzędzia takie np. jak Midnight Commander, który jest unixową wersją Norton Commandera. Pracując przy końcówce graficznej można korzystać z któregoś z menadżerów plików, które pozwalają na przeprowadzanie wszelkich operacji na katalogach i plikach bez znajomości składni odpowiednich poleceń systemowych.
W celu obejrzenia zawartości pliku tekstowego (zawierającego znaki ASCII) można użyć albo komendy cat <plik>, jeśli plik nie jest zbyt długi, albo komend less lub more w celu przeglądania zawartość strona po stronie (oczywiście po nazwie komendy powinna pojawić się nazwa pliku, którą chcemy obejrzeć).
Do edycji plików służą edytory takie jak joe, emacs, vi (vim).
W systemie Unix, analogicznie jak w systemie MS-DOS, użytkownik kontaktuje się z systemem operacyjnym poprzez specjalny program, który zajmuje się interpretacją wpisywanych po znaku zachęty poleceń. W systemie Unix program taki nazywa się powłoką (shell ). Jest on uruchamiany bezpośrednio po zarejestrowaniu się użytkownika w systemie. Istnieje kilka powłok do wyboru: sh - powłoka Bourne'a oraz bash - jej unowocześniona wersja (Bourne again shell), która stanowi domyślną powłokę systemu Linux, csh - powłoka C oraz jej rozszerzona (i bardzo popularna) wersja o nazwie tcsh.
W celu ułatwienia pracy w systemie Unix w pliku .tcshrc konfigurującym powłokę tcsh można dokonać utożsamienia niektórych, szczególnie rozbudowanych, bądź często używanych komend unixowych z ich wygodnymi skrótami. Np. Jeśli chcemy posługiwać się nazwą dir zamiast ls wystarczy w pliku .tcshrc umieścić następujący wiersz: alias dir ls. Podobnie można posługiwać się zamiennie nazwami mv oraz ren po zastosowaniu przypisania alias ren mv. Można także utworzyć sobie wygodne skróty do innych często używanych komend, np. wpis alias lt ls -lta sprawi, że komenda lt będzie powodowała wypisanie wszystkich plików w bieżącym katalogu z ich pełnym opisem uszeregowanych według czasu ich utworzenia (można także użyć wygodniejszego wariantu komendy, mianowicie, alias lt 'ls -lta \!* | more'). Po każdorazowej zmianie zawartości pliku .tcshrc trzeba wprowadzone zmiany uczynić widocznymi dla powłoki pisząc source ~ /.tcshrc (znak ~ oznacza domowy katalog użytkownika). Plik .tcshrc jest wykonywany przez powłokę przy każdym jej wywołaniu. Przykładowy plik konfigurujący powłokę tcsh znajduje się w Uzupełnieniu.
Powłoka tcsh jest wyposażona w mechanizm historii, który sprawia, że ostatnie wykonywane komendy są pamiętane (dokładna ich liczba zależy od wartości zmiennej history). Dzięki temu można je obejrzeć przy pomocy polecenia history i przywoływać przy pomocy klawiszy-strzałek oraz edytować używając tych klawiszy, klawisza cofania kursora (backspace), Ctrl-a, Ctrl-e, Ctrl-d, Esc-d.
Niektóre pliki mogą mieć trudne bądź długie nazwy. W celu ułatwienia pracy z takimi nazwami można korzystać z funkcji kończenia nazw, która jest dostępna w ramach powłoki tcsh. Niech np. katalogu znajduje się plik o nazwie pracownia.fizyczna. Chcąc zobaczyć atrybuty tego pliku wystarczy napisać: ls -la prac i nacisnąc klawisz tabulacji, żeby pojawiła się pełna postać polecenia, tj. ls -la pracownia.fizyczna.
Powłoki pozwalają także na zmianę domyślnych urządzeń wejścia/wyjścia dla komend i programów. Np. chcąc zapisać w pliku wynik działania komendy ls *.f wystarczy napisać ls *.f > <plik>. Znak < pozwala na pobieranie danych wejściowych do programu z pliku, a >> powoduje dopisanie danych wyjściowych jednego programu (procesu) do istniejącego pliku. Można także łatwo łączyć wyjście jednego z programów z wejściem innego, czyli tworzyć potoki (pipelining), np. cat <plik> | more.
Powłoka dostarcza również mechanizmu pozwalającego na wykonywanie komend (programów) na pierwszym planie (foreground) bądź w tle (background). Jeśli polecenie dla powłoki zostanie zakończone znakiem &, to do czasu zakończenia będzie się ono wykonywało bez jednoczesnego blokowania klawiatury, jak ma to miejsce w przypadku komend uruchamianych na pierwszym planie. Komendę, która wykonuje się na pierwszym planie można umieścić w tle. Wystarczy najpierw ją zatrzymać (naciskając Ctrl-z), a następnie umieścić w tle przy pomocy komendy bg. Przywołanie komendy z tła na plan pierwszy następuje w wyniku zastosowania polecenia fg. Polecenie jobs pozwala obejrzeć wszystkie (ponumerowane) procesy działające w tle. kill %n usuwa proces o numerze n, a fg %n powoduje przywołanie z tła na plan pierwszy procesu o wskazanym numerze.
Komenda exit pozwala na opuszczenie aktualnej kopii interpretera poleceń (powłoki).
Warto pamiętać, że pełną informację na temat powyższych i innych komend używanej wersji systemu Unix można uzyskać pisząc po znaku zachęty man <komenda> (man -k <słowo-kluczowe>) lub apropos <słowo-kluczowe>. Komenda man (skrót od manual) powoduje wyświetlenie odpowiednich stron podręcznika, który zawiera opis wszelkich dostępnych poleceń systemowych. Polecenie apropos, zgodnie ze swoją nazwą, ma nieco ogólniejszy charakter i powoduje wyświetlenie tych wierszy dokumentacji systemowej, w których podane słowo kluczowe się pojawia.
Oto alfabetyczna lista podstawowych poleceń (komend) Unixa.
W Sieci istnieje wiele słowników o tematyce komputerowej i internetowej, m.in.:
Warto do nich zajrzeć w poszukiwaniu wyjaśnień terminów, które nie znalazły się poniżej.
Wg nowej encyklopedii powszechnej PWN
INTERNET [ang. International net], inform. globalna sieć komputerowa oparta na tzw. protokole komunikacyjnym TCP/ IP (angielskie Transfer Control Protocol/ Internet Protocol); największa sieć komputerowa na świecie, składa się z wielu tysięcy mniejszych sieci; powstała w USA z uruchomionej 1969 sieci ARPANET (przeznaczonej do celów militarnych) oraz z utworzonej 1984 sieci NSFNET (pierwotnie przeznaczonej dla ośrodków naukowych i szkolnictwa wyższego); ob. powszechnie wykorzystywana przez użytkowników komputerów, zwł. do wyszukiwania i pozyskiwania informacji i programów z zasobów dostępnych w sieci, do przesyłania poczty elektronicznej i in.; informacje tekstowe w Internecie są zwykle prezentowane w postaci hipertekstu (WWW); do ich wyszukiwania służą specjalne programy zw. przeglądarkami; Internet jest coraz częściej wykorzystywany także do przesyłania przedstawionych w postaci cyfrowej obrazów, sekwencji filmowych i zapisów dźwięku; wszelkiego rodzaju pliki mogą być w Internecie przekazywane za pomocą tzw. usługi FTP (angielskie File Transfer Protocol); korzystanie z Internetu wymaga uzyskania tzw. konta internetowego, tj. własnego adresu w sieci; liczba użytkowników Internetu bardzo szybko rośnie.
| CCITT | |
| V.22 | 1200b/s (600 bodów) |
| V.22bis ( ť 1985) | 2400b/s (600 bodów) |
| V.32 (1987) | 9600b/s (2400 bodów) |
| V.32bis (1992) | 14,4kb/s, także 12kb/s, 9600, 7200, 4800 b/s |
| V.34 (1994) | 28,8-33,6kb/s i zgodność z V.32 i V.32bis |
| V.34bis | 33,6kb/s lub szybkości V.34 |
| V.42 (1988) | V.32 oraz korekcja błędów (=MNP 4) |
| V.42bis | V.42 plus kompresja danych (=MNP 5) |
| V.90 | szybkość do 56kb/s |
| ISDN | szybkość 128kb/s, 1920kb/s |
| DSL | szybkość 6.1 Mb/s |
| MNP | |
| MNP 2 | korekcja błędów |
| MNP 4 | korekcja błędów oraz poprawiona szybkość transmisji |
| MNP 5 | korekcja błędów oraz podstawowa kompresja danych |
Oto przykładowy zapis sesji SMTP.
telnet tor 25
Trying 158.75.5.35...
Connected to tor.
Escape character is '^]'.
220 phys.uni.torun.pl ESMTP Sendmail 8.9.3/8.9.3/rchk1.20; \
Tue, 11 Jan 2000 11:31:04 +0100 (MET)
HELP
214-This is Sendmail version 8.9.3
214-Topics:
214- HELO EHLO MAIL RCPT DATA
214- RSET NOOP QUIT HELP VRFY
214- EXPN VERB ETRN DSN
214-For more info use "HELP <topic>".
214-To report bugs in the implementation send email to
214- sendmail-bugs@sendmail.org.
214-For local information send email to Postmaster at your site.
214 End of HELP info
HELO tal.phys.uni.torun.pl
250 phys.uni.torun.pl Hello IDENT:jkob@tal [158.75.5.51], pleased
to meet you
MAIL FROM: jkob@tal.phys.uni.torun.pl
250 jkob@tal.phys.uni.torun.pl... Sender ok
RCPT TO: jkob@phys.uni.torun.pl
250 jkob@phys.uni.torun.pl... Recipient ok
DATA
354 Enter mail, end with "." on a line by itself
Oto list wyslany przy uzyciu komendy telnet.
Moze go wyslac ktokolwiek podajac sie za kogokolwiek.
.
250 LAA21258 Message accepted for delivery
QUIT
221 phys.uni.torun.pl closing connection
Connection closed by foreign host.
Oto jak wygląda ten list po dostarczeniu do adresata:
Received: from tal (IDENT:jkob@tal [158.75.5.51]) by
phys.uni.torun.pl (8.9.3/8.9.3/rchk1.20) with SMTP id
LAA21258 for jkob@phys.uni.torun.pl;
Tue, 11 Jan 2000 11:34:05 +0100 (MET)
Date: Tue, 11 Jan 2000 11:34:05 +0100 (MET)
From: jkob@tal.phys.uni.torun.pl
Message-ID: <200001111034.LAA21258@phys.uni.torun.pl>
Content-Type: text
X-Mozilla-Status: 0000
X-Mozilla-Status2: 00000000
X-UIDL: 38c18386a7e1c113966c5287adf3de22
Oto list wyslany przy uzyciu komendy telnet.
Moze go wyslac ktokolwiek podajac sie za kogokolwiek.
Jeśli list jest tworzony przy pomocy któregokolwiek z klientów poczty elektronicznej, to nagłówek listu będzie nieco bardziej rozbudowany. Oto przykład listu wysłanego przy pomocy programu Netscape Messenger:
Received:from phys.uni.torun.pl (IDENT:jkob@tal[158.75.5.51]) by
phys.uni.torun.pl (8.9.3/8.9.3/rchk1.20) with ESMTP
id OAA12207 for <jkob@phys.uni.torun.pl>;
Tue, 11 Jan 2000 14:41:35+0100 (MET)
Sender:jkob
Message-ID:<387B3301.1293959E@phys.uni.torun.pl>
Date:Tue, 11 Jan 2000 13:41:21 +0000
From:Jacek Kobus <jkob@phys.uni.torun.pl>
Organization:Instytut Fizyki UMK
X-Mailer:Mozilla 4.51 [en] (X11; I; Linux 2.2.12-20 i586)
X-Accept-Language:en
MIME-Version:1.0
To:"Kobus, Jacek" <jkob@phys.uni.torun.pl>
Subject:format naglowka listu
Content-Transfer-Encoding:7bit
Content-Type:text/plain; charset=iso-8859-2
X-Mozilla-Status:0000
X-Mozilla-Status2:00000000
X-UIDL:bc9e3d410b2b6e390967341552c5c870
tresc listu ...
Oto przykładowa postać listu z załącznikiem.
Received: from phys.uni.torun.pl (IDENT:jkob@tal [158.75.5.51])
by phys.uni.torun.pl (8.9.3/8.9.3/rchk1.20) with ESMTP id OAA12903
for <jkob@phys.uni.torun.pl>; Tue, 11 Jan 2000 14:47:56 +0100 (MET)
Sender: jkob
Message-ID: <387B347F.BB4A85B1@phys.uni.torun.pl>
Date: Tue, 11 Jan 2000 13:47:43 +0000
From: Jacek Kobus <jkob@phys.uni.torun.pl>
Organization: Instytut Fizyki UMK
X-Mailer: Mozilla 4.51 [en] (X11; I; Linux 2.2.12-20 i586)
X-Accept-Language: en
MIME-Version: 1.0
To: "Kobus, Jacek" <jkob@phys.uni.torun.pl>
Subject: list z zalacznikiem
Content-Type: multipart/mixed;
boundary="------------5F92FBE731E3A2EFF6427EEA"
X-Mozilla-Status: 8001
X-Mozilla-Status2: 00000000
X-UIDL: 7b3ff7040d7ecfddb2f1821b2ba24abc
This is a multi-part message in MIME format.
--------------5F92FBE731E3A2EFF6427EEA
Content-Type: text/plain; charset=iso-8859-2
Content-Transfer-Encoding: 7bit
tresc listu ....
--------------5F92FBE731E3A2EFF6427EEA
Content-Type: application/msword; name="badumo.doc"
Content-Transfer-Encoding: base64
Content-Disposition: inline; filename="badumo.doc"
26UtADFAFQQAAAAALQAAAAAAAAAAAAAAgAEAALgkAADzMwAAAAAAAAAAAAAAAAAAAAAAADQj
AAAAAAAAAgAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAwAABqAAAwAABqAGowAAAAAGow
AAAAAGowAAAAAGowAAAAAGowAAAOAHgwAABYANAwAAAAANAwAAAAANAwAAAAANAwAAAIANgw
....
AYABAHwNAAB8DQAACgAAgACAfA0AAAAAAAAAAAAAIgACAAMDjAAAAMQCAACpAQAAAABryxgm
a8sYJgAAAAACADoAAACWAwAAbiIAAAYAAAAAACkAAAAAAAAAC0phY2VrIE1henVyC0phY2Vr
IE1henVyAAAAAAAAAAAA
--------------5F92FBE731E3A2EFF6427EEA--
Oto kilka adresów stron WWW poświęconych problemom bezpiecznej wymiany informacji w Sieci:
Przykładowa zawartość pliku konfiguracyjnego dla powłoki tcsh
alias m less
alias l 'ls -lF \!* | grep -v \\~$ | more'
alias lh 'ls -tlF \!* | grep -v \\~$ | head'
alias lt 'ls -lta \!* |more'
alias E emacs -nw
alias c clear
alias cl "*.dvi *~ .*~ *.log *.aux *.bbl *.blg .*.~*~ .#* #*# >& /dev/null"
alias gz gzip
alias guz gunzip
alias mfl 'mount /mnt/floppy'
alias ufl 'umount /mnt/floppy'
alias mcd 'mount /mnt/cdrom'
alias ucd 'umount /mnt/cdrom'
alias ex exit
alias ff 'find . -name \!* -print'
alias lk 'look'
alias x logout
alias addtopath 'set path=($path \!*)'
alias prefixpath 'set path=(\!* $path)'
alias psf 'ps aux |grep \!* | more '
alias s 'source ~/.tcshrc'
alias r su - root
alias dk 'df -k | head'
alias f finger
alias h history
alias sfm ssh ferm.phys.uni.torun.pl
alias mcp 'mcopy -no'
alias oo '/home/jkob/OpenOffice.org1.0/soffice &'
alias Xrdb "xrdb ~/.Xresources"
alias e "emacs -geometry 90x44+0-0 -bg 'White' \
-fn '-misc-fixed-medium-r-*-*-15-*-*-*-*-*-iso8859-2' &"
alias kbdr 'kbdrate -s -r 30 -d 250'
alias snb ssh jkob@nobel
alias snbx "ssh -l jkob -f nobel xterm -geometry 80x59+5+1 -bg 'LightGrey' \
-fn -adobe-courier-medium-r-normal--13-100-100-100-m-90-iso8859-2 "
alias x16 "xterm -sb -sl 500 \
-fn '-adobe-courier-*-r-*-*-16-*-*-*-*-*-iso8859-2' &"
alias fm 'fetchmail --keep --protocol POP3 158.75.5.90'
alias nstat 'netstat -nr'
addtopath ~/bin
setenv EDITOR "emacs -nw"
setenv LANG "pl_PL"
setenv LC_AL "pl_PL"
setenv LINGUAS "pl_PL"
if (-e ~/.tcshrc2) source ~/.tcshrc2
W niniejszym opracowaniu wykorzystano m.in. następujące źródła:
1 Opis projektu PIONIER: Polski Internet Optyczny - Zaawansowane Aplikacje, Usługi i Technologie dla Społeczeństwa Informacyjnego można znaleźć na stronie www.kbn.gov.pl/analizy/pionier/new/index.html a mapkę ukazującą schemat tej sieci pod adresem www.kbn.gov.pl/analizy/pionier/new/4_2.html.pionier.pl.
2 Modelowy schemat komunikacji komputer-komputer opiera się na tzw. modelu odniesienia OSI (Open System Interconnection) opracowanym przez ISO, w którym funkcje sieci dzieli się na siedem powiązanych ze sobą warstw, w taki sposób, że działanie warstwy wyższej opiera sie na usługach dostarczanych przez warstwy znajdujące się pod nią.
3 W systemie Windows ten adres można odczytać uruchamiając komendę winipcfg (Windows 98) lub ipconfig /all (Windows 2000/NT/XP). W systemach Unix/Linux służy do tego komenda ifconfig -a.
4 Zwykle są to fax-modemy, czyli urządzenia pozwalające używać komputera jako urządzenia do wysyłania i odbierania faksów.
5 W zależności od zastosowanej techniki transmisji sygnału cyfrowego wyróżnia się asymetryczne cyfrowe linie abonenckie (ADSL asymmetric DSL), cyfrowe linie abonenckie o szybkiej transmisji danych (HDSL high-bit-rate DSL) lub cyfrowe linie abonenckie o adaptacyjnej szybkości transmisji (RADSL rate adaptive DSL).
6 W Polsce organizacje edukacyjne oznacza się także skrótem edu.
7 Pierwsze pozycje w wynikach wyszukiwania zajmują więc strony z największą liczbą prowadzących do nich odniesień. Przy czym waga odsyłaczy zależy od popularności serwisów, z których pochodzą.
8 Nie ma więc znaczenia, czy wyraz wpisujemy jako "zolc" lub "żółć", bo i tak zostaną odnalezione strony, na których wyraz "żółć" znajduje się we wszelkich możliwych sposobach kodowanie polskich liter.
9 Aby sprawdzić, ile zewnętrznych linków wskazuje na serwer uniwersytecki można napisać +link:www.umk.torun.pl -url:www.umk.torun.pl.
10 Istnieje szereg programów do przeglądania i rozpakowywania plików, np. WinZip (dostępny pod adresem www.winzip.com) czy też Stuffit Expander (darmowy, dostępny pod adresem windows95/98.com).
11 Czasami plik z rozszerzeniem exe kryje w sobie szereg innych plików w postaci odpowiednio upakowanej. Jest to tzw. plik samorozpakowujący się. Po jego uruchomieniu zawartość ulega rozpakowaniu i umieszczeniu na dysku w bieżącym katalogu. Dlatego zaleca się przeprowadzać manipulację z tego typu plikami w osobnych katalogach.
12 W Polsce, zgodnie z ustawą o podpisie elektronicznym właściwy minister będzie odpowiedzialny za prowadzenie rejestru firm uprawnionych do prowadzenia usług certyfikacyjnych.
13 Dla systemu Windows dostępny jest publicznie pakiet putty do realizacji bezpiecznych logowań oraz pscp do bezpiecznego kopiowania plików między hostami.