11 KiB
HTTP
Introduzione
HTTP
sta per Hypertext Transfer Protocol ed è il protocollo incaricato di gestire lo scambio di richieste e risposte http in un'architettura client-server. Questo protocollo è utilizzato per lo scambio di pagine web e altri contenuti multimediali. HTTP è associato alla well-known port 80, mentre HTTPS
(la versione sicura di HTTP) utilizza la porta 443. Ciò significa che il processo sul server relativo a questi servizi è tipicamente legato a queste porte.
In quanto protocollo dell'application layer, HTTP si appoggia al TCP del transport layer per garantire una comunicazione affidabile e robusta. Prima che avvenga lo scambio dei veri e propri messaggi, è necessario stabilire una connessione TCP tra il client e il server.
Tipologie di connessione HTTP
- Connessione non persistente: un metodo tradizionale in cui per ogni richiesta HTTP viene instaurata una sessione TCP separata. Questo approccio, essendo meno efficiente, può comportare un uso eccessivo di risorse, in particolare quando vengono richieste numerose risorse in rapida successione
- Connessione persistente: con questo metodo, una volta stabilita la connessione TCP tra il client e il server, tutte le risorse vengono scambiate utilizzando la stessa connessione. Solo al termine dello scambio della totalità delle risorse la connessione viene chiusa. Questo approccio è molto più efficiente, poiché riduce il sovraccarico derivante dall'instaurazione ripetuta di nuove connessioni TCP
HTTP Request
Una richiesta HTTP è strutturata in quattro macrosezioni:
Riga di richiesta
: contiene il metodo HTTP (ad esempio, GET, POST, PUT, DELETE, ecc.) e la versione di HTTP utilizzata, solitamente la versione 2Intestazione
oHeader
: ena serie di coppie chiave-valore che forniscono al server ulteriori informazioni, come ad esempio il tipo di contenuto, le informazioni sul client, le preferenze sulla codifica, e altro ancoraRiga vuota
: Separa le intestazioni dal corpo della richiestaCorpo della richiesta
oBody
(Opzionale): contiene i dati da inviare al server
Intestazione della Richiesta HTTP
Gli header di una richiesta HTTP vengono utilizzati dal client per fornire al server informazioni utili all'elaborazione della risposta. Alcuni dei principali campi utilizzati:
User-Agent
: specifica il tipo di client utilizzato per la richiesta, ad esempio il browser o l'applicazioneAccept
: indica quali tipi di contenuti il client è in grado di gestire. Ad esempio, l'headerAccept-Language
comunica le preferenze linguistiche del browser, permettendo al server di restituire contenuti nella lingua preferitaConnection
: Determina se la connessione TCP deve rimanere aperta o essere chiusa subito dopo la risposta. Il valorekeep-alive
serve a mantenere attiva la connessioneHost
: specifica l'host e la porta di destinazione della richiestaReferrer
: indica il percorso o path da cui è partita la richiestaCookie
: invio dei cookie associati alla sessione o ad altre informazioni di identificazione, utili per mantenere lo stato della sessione utente e per personalizzare l'esperienzaContent-Type
: Specifica il tipo di contenuto che il client sta inviando nel corpo della richiesta, ad esempioapplication/json
otext/html
Content-Length
: indica la dimensione, in byte, del contenuto presente nel corpo della richiestaIf-Modified-Since
: questo campo contiene un timestamp che indica l'ultima modifica nota al client. Il server utilizza questo dato per decidere se inviare il contenuto richiesto o restituire un codice 304 (Not Modified) se il contenuto non è stato aggiornato successivamente alla data specificata
HTTP Response
Una risposta HTTP è il messaggio che un server invia a un client (come un browser o un'applicazione) dopo aver ricevuto e processato una richiesta HTTP. La struttura di una risposta HTTP è composta da quattro elementi principali:
Riga di stato
, la prima riga della risposta che include la versione del protocollo HTTP, il codice di stato e la frase di stato descrittiva (ad esempio, OK)Headers
: le righe successive contengono le intestazioni, organizzate come coppie chiave-valore. Queste intestazioni forniscono informazioni supplementari sulla risposta, quali il tipo di contenuto, la lunghezza del contenuto e altri metadatiRiga vuota
che separa le intestazioni dal corpo della risposta.Body
: il corpo del messaggio, che contiene i dati effettivi della risposta
Codici di stato
I codici di stato HTTP sono numeri a tre cifre che il server invia al client per indicare l'esito di una richiesta. Si suddividono in cinque categorie principali, identificate dalla prima cifra:
1XX
- Informativi: indicano che la richiesta del client è stata ricevuta e il server sta proseguendo con l'elaborazione (es. 100 Continue)2XX
- Successo: la richiesta è stata compresa e accettata correttamente dal server (es. 200 OK)3XX
- Redirect: la richiesta richiede ulteriori azioni per essere completata, solitamente tramite un reindirizzamento a un nuovo URL. (es. 301 Permanently Redirect)4XX
- Errori del client: indicano che la richiesta contiene errori, ad esempio di sintassi o perché la risorsa richiesta non è stata trovata (es. 400 Bad Request, 404 Not Found)5XX
- Errori del server: il server ha incontrato un errore o una condizione impossibile da gestire che ha impedito la soddisfazione della richiesta (es. 500 Internal Server Error, 503 Service Unavailable)
Intestazione della Risposta HTTP
Le intestazioni di risposta permettono al server di fornire al client (tipicamente un browser) informazioni aggiuntive sul messaggio restituito. Tra le più importanti:
Content-Type
: specifica il tipo di contenuto della risposta, ad esempiotext/html
,application/json
, ecc.Content-Length
: indica la lunghezza del corpo della risposta, espressa in byteDate
: riporta la data e l’ora (timestamp) in cui il messaggio è stato generato dal serverServer
: indica il software (e talvolta la versione) in uso sul server HTTPSet-Cookie
: invia uno o più cookie al client, che potrà conservarli e ritrasmetterli nelle richieste successive per gestire sessioni, preferenze o tracciamento dell’utente.Cache-Control
: fornisce direttive su come il client (o eventuali proxy intermedi) deve memorizzare nella cache la rispostaExpires
: definisce una data/ora oltre la quale la risposta è considerata scaduta e non più valida in cacheLast-Modified
: specifica il timestamp dell’ultima modifica della risorsa richiestaETag
: un identificatore univoco (e solitamente in forma di hash) della versione corrente della risorsa. Consente al client di effettuare richieste condizionali (If-None-Match
) per verificare se la risorsa è cambiataLocation
: utilizzata nei codici di stato 3xx per indicare al client l’URL di destinazione a cui effettuare il reindirizzamentoAllow
: elenca i metodi HTTP che il server supporta per la risorsa richiesta
Metodi HTTP
I metodi HTTP indicano al server l'azione da eseguire su una risorsa. I principali metodi:
GET
: il metodo più comune, serve per richiedere una risorsa presente sul server. Non utilizza il corpo (body) della richiesta; eventuali parametri vengono passati direttamente nell'URL, dopo il carattere?
e separati tramite il carattere&
. Ad esempio:https://miosito.com/?filtro=1&rilasciato=false
POST
: utilizzato per inviare dati al server, ad esempio i dati di un modulo di login. In questo caso, le informazioni vengono trasmesse tramite il corpo della richiestaHEAD
: serve per richiedere informazioni (metadata) su una risorsa, senza scaricarne l'intero contenuto. Questo metodo è utile per verificare ad esempio l'esistenza della risorsaPUT
: utilizzato per creare o aggiornare una risorsa sul server. Questo metodo, tuttavia, è spesso disabilitato per motivi di sicurezzaTRACE
: impiegato a fini diagnostici e di debugging, aiutando a identificare eventuali problemi lungo il percorso della richiestaDELETE
: consente di eliminare una risorsa sul server. Anche questo metodo, per ragioni di sicurezza, è spesso disabilitato di defaultOPTIONS
: utilizzato per verificare quali metodi HTTP sono supportati dal server, consentendo così al client di conoscere le possibili azioni disponibili
Cookie e sessioni
Il protocollo HTTP è progettato per il trasferimento di pagine web attraverso richieste e risposte. Tuttavia, il protocollo HTTP è intrinsecamente stateless
, ovvero privo di memoria. Ciò significa che non può memorizzare le preferenze o lo stato di un utente tra una richiesta e l'altra.
Per ovviare a questa limitazione, sono stati introdotti i cookie e le sessioni, che rendono HTTP stateful
, un meccanismo con memoria che può tenere traccia dell'utente.
I cookie
sono piccoli file di testo che il server invia al browser dell'utente, che li memorizza. Quando l'utente effettua una nuova richiesta, il browser invia nuovamente i cookie al server, permettendogli di riconoscere l'utente e mantenere le sue preferenze.
Le caratteristiche principali dei cookie sono:
- Persistenza: possono essere di sessione (temporanei, eliminati alla chiusura del browser) o persistenti (con una data di scadenza e memorizzati sul disco)
- Sicurezza: possono essere marcati come
secure
, obbligando lo scambio solo tramite HTTPS, eHttpOnly
, impedendo a di accedere al valore del cookie tramite JavaScript (i cookie permettono di bypassare tutti i meccanismi di autenticazione) - Scope: definiscono il percorso (path) e il dominio (domain) per cui il cookie è valido
Hanno una dimensione limitata a 4 KB e possono essere bloccati dal browser o dai suoi plugin per motivi di privacy.
Le sessioni
, invece, sono gestite lato server e identificano il client attraverso un ID di sessione. Spesso, i cookie vengono utilizzati per memorizzare solo l'ID di sessione, mentre i dati dell'utente sono conservati sul server.
URI, URL e URN
Un URI
(Uniform Resource Identifier) è un meccanismo per identificare in modo univoco una risorsa generica. Esistono due specializzazioni principali:
URL
(Uniform Resource Locator): è comunemente utilizzato nel web e specifica il percorso dove la risorsa può essere raggiunta. Segue il formato:protocollo://{hostname o nome dominio/ip}[:porta]/percorso/?parametro1=valore1¶metro2=valore2...
URN
(Uniform Resource Name): rappresenta il contesto o namespace in cui è inserita la risorsa, senza indicarne il percorso di accesso. Un URN consente, ad esempio, di classificare un libro in base al suo genere, indipendentemente dalla sua ubicazione specifica