L’ACCESSO AL WEB 3 Il World Wide Web Il WWW è una rete mondiale che utilizza i server e i client collegati in Internet per consentire la condivisione di ipertesti. Un è un documento di testo che contiene dei collegamenti ipertestuali (link). Un è una parola, una frase, un’immagine ecc. che, se cliccata, rimanda ad altri documenti, ipertesti, immagini, audio, video ecc. (▶ unità 8). ipertesto link Una è un ipertesto ricco di contenuti, perché può includere anche immagini o altri elementi multimediali. pagina ▶ web Un è un insieme di pagine web residenti su un computer (server), al quale altri computer (client) possono collegarsi attraverso un software, chiamato . Il browser fa una richiesta al software presente sul server ( ) utilizzando l’URL della risorsa cui vuole accedere. sito web browser server web Ogni (documento, immagine, video, pagina web) viene identificata da un indirizzo Internet univoco detto ( ), formato da: risorsa URL ▶ Uniform Resource Locator nome del protocollo; due punti e doppia ; ▶ barra indirizzo simbolico; e opzionalmente da: barra separatrice; percorso per raggiungere la pagina del sito (o la risorsa). / web ragnatela / uniform resource locator localizzatore universale di risorse / barra slash Il protocollo standard utilizzato per la trasmissione degli ipertesti è l’ ( ), ma esiste anche l’ . Nel primo tutte le comunicazioni avvengono “in chiaro”, senza alcun genere di sicurezza; nell’HTTPS, invece, viene creato un canale di comunicazione crittato, per garantire la riservatezza dei dati. Quando è richiesto un certo grado di sicurezza come per gli acquisti online o la lettura dei messaggi di posta elettronica, si utilizza il secondo. HTTP Hyper Text Transfer Protocol HTTPS Muoversi da un server all’altro o da una pagina all’altra su Internet utilizzando link ipertestuali o URL prende il nome di . navigazione web attenzione Anche ai link viene sempre associato un URL. >> pagina 296 Il browser Il browser è il programma eseguito sul client che visualizza le pagine web in modalità grafica. Il browser può essere usato anche offline per la consultazione di documenti in formato html (▶ unità 10) salvati su disco. I browser più diffusi sono: Google Chrome, Mozilla Firefox, Microsoft Edge, Apple Safari (per Mac o per Windows) e Opera. Per rendere la navigazione più veloce, il browser salva sul disco del client le pagine web visitate durante la navigazione e le immagini in esse contenute. L’area di disco utilizzata si chiama ed è una zona in cui le informazioni vengono memorizzate “temporaneamente”. L’utente può impostarne la dimensione e il browser, quando la cache è piena, cancella le informazioni più vecchie (o quelle usate meno frequentemente, in base all’algoritmo utilizzato) e le sostituisce con quelle più recenti. Per può essere utile i file temporanei contenuti nella . cache liberare spazio su disco cancellare periodicamente cache Alcuni siti web memorizzano informazioni sull’utente o sulle modalità di consultazione delle pagine, in modo da poter personalizzare la visualizzazione delle pagine del sito web alla visita successiva. Queste informazioni vengono salvate in un file di testo di piccole dimensioni, detto , direttamente nell’hard disk del computer dell’utente. I salvati nel computer che li ha . Dato che i cookie potrebbero accedere a informazioni personali senza il consenso dell’utente, è possibile bloccarli totalmente o in parte, oppure cancellarli. ▶ cookie cookie possono essere letti solo dal sito web creati I sono finestre (o riquadri) che compaiono automaticamente durante l’uso di un’applicazione (per esempio messaggi di errore o di notifica), di solito per attirare l’attenzione dell’utente. Esistono anche sui browser, ma oggi il loro utilizzo è spesso più irritante o dannoso che utile. Spesso contengono pubblicità o pagine di siti web non richiesti. Si sovrappongono alla pagina web consultata complicandone la lettura e, talvolta, sono addirittura rischiosi perché aprono pagine web di siti potenzialmente malevoli. L’utente ha quindi facoltà di disattivare la loro apertura ed, eventualmente, di indicare da quali siti web ricevere pop-up. pop-up / cookie biscotto attenzione La cache del browser è un insieme di file salvati sulla memoria di massa. La cache memory è un hardware che si trova all’interno della CPU. Il motore di ricerca Un motore di ricerca è un sito Internet che ha la funzione di aiutare gli utenti a trovare le informazioni di loro interesse (normalmente contenute in altri siti). I motori di ricerca più utilizzati sono Google, Bing, Yahoo e Ask. Generalmente un motore di ricerca contiene una , all’interno della quale l’utente inserisce le (cioè parole ritenute significative per il determinato argomento) e un , per mezzo del quale viene avviata la ricerca. casella di ricerca parole chiave pulsante Cerca I motori di ricerca effettuano un lavoro strutturato in tre fasi: : di solito viene eseguita in modo automatico da un software chiamato (o ), che “si aggira” periodicamente nel web per “scovare” siti nuovi o modificati dalla sua ultima visita; 1. analisi dei contenuti della rete ▶ spider crawler : il contenuto dei siti trovati dallo spider viene analizzato, elaborato e memorizzato nei database del motore di ricerca con che variano per ogni motore di ricerca ( del sito web). Se il sito non è ancora stato individuato automaticamente, gli sviluppatori possono velocizzare il processo di indicizzazione ai motori di ricerca l’esistenza del sito web; 2. catalogazione del materiale ottenuto criteri indicizzazione notificando manualmente : le pagine che contengono i risultati dei motori di ricerca si chiamano ( ). Al loro interno il motore di ricerca elenca i siti trovati, in rispetto alla richiesta ricevuta. Innanzitutto il sito deve contenere le inserite dall’utente, poi ciascun motore di ricerca utilizza degli per classificare le pagine web, per esempio: 3. risposta alle richieste dell’utente SERP Search Engine Result Pages ordine di rilevanza parole chiave algoritmi quante volte viene ripetuta la parola chiave nel sito; in quali punti della pagina sono inserite le parole chiave; quanti link contiene quel documento, verso altri siti; quanti altri siti contengono link verso quella pagina; quante volte gli utenti visitano quel sito dopo una ricerca; quanto frequentemente viene aggiornato il sito. Il di un sito web fa riferimento alla sua ubicazione nella SERP. posizionamento Qualunque sito può essere catalogato dai motori di ricerca in modo gratuito ( ). Questo però non garantisce che il sito compaia fra i primi risultati nella SERP ( ). indicizzazione posizionamento Normalmente i siti effettivamente visitati dagli utenti sono quelli all’inizio della SERP ed è per questo che esiste la possibilità di migliorare il posizionamento attraverso: ( ): attività di ottimizzazione del sito web intraprese dagli sviluppatori; SEO Search Engine Optimization : servizi a pagamento offerti dai motori di ricerca. annunci I moderni algoritmi utilizzati dai motori di ricerca iniziano a basare il loro funzionamento sul : per esempio sono in grado di distinguere la parola “pesca” in base al contesto in cui è utilizzata, per capire se si tratta del frutto o della disciplina sportiva. significato delle parole Approfondimento – Inibire l'indicizzazione dei siti / spider ragno Lo sapevi che Il pulsante Mi sento fortunato di Google apre il primo sito trovato durante la ricerca. Facendo invece clic sull’icona del microfono è possibile attivare l’ Assistente Google per eseguire ricerche vocali. prova tu Durante la fase di analisi del motore di ricerca un software chiamato: spider si aggira nella rete alla ricerca di siti nuovi. crawler indicizza i siti web caricati in Internet. crawler ricerca i siti richiesti con le parole chiave.