7.6 KiB
HTTP
Introduzione
HTTP
sta per Hypertext Transfer Protocol ed è il protocollo incaricato di gestire lo scambio di richieste e risposte http in un'architettura client-server. Questo protocollo è utilizzato per lo scambio di pagine web e altri contenuti multimediali. HTTP è associato alla well-known port 80, mentre HTTPS
(la versione sicura di HTTP) utilizza la porta 443. Ciò significa che il processo sul server relativo a questi servizi è tipicamente legato a queste porte.
In quanto protocollo dell'application layer, HTTP si appoggia al TCP del transport layer per garantire una comunicazione affidabile e robusta. Prima che avvenga lo scambio dei veri e propri messaggi, è necessario stabilire una connessione TCP tra il client e il server.
Tipologie di connessione HTTP
- Connessione non persistente: un metodo tradizionale in cui per ogni richiesta HTTP viene instaurata una sessione TCP separata. Questo approccio, essendo meno efficiente, può comportare un uso eccessivo di risorse, in particolare quando vengono richieste numerose risorse in rapida successione
- Connessione persistente: con questo metodo, una volta stabilita la connessione TCP tra il client e il server, tutte le risorse vengono scambiate utilizzando la stessa connessione. Solo al termine dello scambio della totalità delle risorse la connessione viene chiusa. Questo approccio è molto più efficiente, poiché riduce il sovraccarico derivante dall'instaurazione ripetuta di nuove connessioni TCP
HTTP Request
Una richiesta HTTP è strutturata in quattro macrosezioni:
Riga di richiesta
: contiene il metodo HTTP (ad esempio, GET, POST, PUT, DELETE, ecc.) e la versione di HTTP utilizzata, solitamente la versione 2Intestazione
oHeader
: ena serie di coppie chiave-valore che forniscono al server ulteriori informazioni, come ad esempio il tipo di contenuto, le informazioni sul client, le preferenze sulla codifica, e altro ancoraRiga vuota
: Separa le intestazioni dal corpo della richiestaCorpo della richiesta
oBody
(Opzionale): contiene i dati da inviare al server
Intestazione della Richiesta HTTP
Gli header di una richiesta HTTP vengono utilizzati dal client per fornire al server informazioni utili all'elaborazione della risposta. Alcuni dei principali campi utilizzati:
User-Agent
: specifica il tipo di client utilizzato per la richiesta, ad esempio il browser o l'applicazioneAccept
: indica quali tipi di contenuti il client è in grado di gestire. Ad esempio, l'headerAccept-Language
comunica le preferenze linguistiche del browser, permettendo al server di restituire contenuti nella lingua preferitaConnection
: Determina se la connessione TCP deve rimanere aperta o essere chiusa subito dopo la risposta. Il valorekeep-alive
serve a mantenere attiva la connessioneHost
: specifica l'host e la porta di destinazione della richiestaReferrer
: indica il percorso o path da cui è partita la richiestaCookie
: invio dei cookie associati alla sessione o ad altre informazioni di identificazione, utili per mantenere lo stato della sessione utente e per personalizzare l'esperienzaContent-Type
: Specifica il tipo di contenuto che il client sta inviando nel corpo della richiesta, ad esempioapplication/json
otext/html
Content-Length
: indica la dimensione, in byte, del contenuto presente nel corpo della richiestaIf-Modified-Since
: questo campo contiene un timestamp che indica l'ultima modifica nota al client. Il server utilizza questo dato per decidere se inviare il contenuto richiesto o restituire un codice 304 (Not Modified) se il contenuto non è stato aggiornato successivamente alla data specificata
HTTP Response
Una risposta HTTP è il messaggio che un server invia a un client (come un browser o un'applicazione) dopo aver ricevuto e processato una richiesta HTTP. La struttura di una risposta HTTP è composta da quattro elementi principali:
Riga di stat
o, la prima riga della risposta che include la versione del protocollo HTTP, il codice di stato e la frase di stato descrittiva (ad esempio, OK)Headers
: le righe successive contengono le intestazioni, organizzate come coppie chiave-valore. Queste intestazioni forniscono informazioni supplementari sulla risposta, quali il tipo di contenuto, la lunghezza del contenuto e altri metadatiRiga vuota
che separa le intestazioni dal corpo della risposta.Body
: il corpo del messaggio, che contiene i dati effettivi della risposta
Codici di stato
I codici di stato HTTP sono numeri a tre cifre che il server invia al client per indicare l'esito di una richiesta. Si suddividono in cinque categorie principali, identificate dalla prima cifra:
1XX
- Informativi: indicano che la richiesta del client è stata ricevuta e il server sta proseguendo con l'elaborazione (es. 100 Continue)2XX
- Successo: la richiesta è stata compresa e accettata correttamente dal server (es. 200 OK)3XX
- Redirect: la richiesta richiede ulteriori azioni per essere completata, solitamente tramite un reindirizzamento a un nuovo URL. (es. 301 Permanently Redirect)4XX
- Errori del client: indicano che la richiesta contiene errori, ad esempio di sintassi o perché la risorsa richiesta non è stata trovata (es. 400 Bad Request, 404 Not Found)5XX
- Errori del server: il server ha incontrato un errore o una condizione impossibile da gestire che ha impedito la soddisfazione della richiesta (es. 500 Internal Server Error, 503 Service Unavailable)
Metodi HTTP
I metodi HTTP indicano al server l'azione da eseguire su una risorsa. I principali metodi:
GET
: il metodo più comune, serve per richiedere una risorsa presente sul server. Non utilizza il corpo (body) della richiesta; eventuali parametri vengono passati direttamente nell'URL, dopo il carattere?
e separati tramite il carattere&
. Ad esempio:https://miosito.com/?filtro=1&rilasciato=false
POST
: utilizzato per inviare dati al server, ad esempio i dati di un modulo di login. In questo caso, le informazioni vengono trasmesse tramite il corpo della richiestaHEAD
: serve per richiedere informazioni (metadata) su una risorsa, senza scaricarne l'intero contenuto. Questo metodo è utile per verificare ad esempio l'esistenza della risorsaPUT
: utilizzato per creare o aggiornare una risorsa sul server. Questo metodo, tuttavia, è spesso disabilitato per motivi di sicurezzaTRACE
: impiegato a fini diagnostici e di debugging, aiutando a identificare eventuali problemi lungo il percorso della richiestaDELETE
: consente di eliminare una risorsa sul server. Anche questo metodo, per ragioni di sicurezza, è spesso disabilitato di defaultOPTIONS
: utilizzato per verificare quali metodi HTTP sono supportati dal server, consentendo così al client di conoscere le possibili azioni disponibili
URI, URL e URN
Un URI
(Uniform Resource Identifier) è un meccanismo per identificare in modo univoco una risorsa generica. Esistono due specializzazioni principali:
URL
(Uniform Resource Locator): è comunemente utilizzato nel web e specifica il percorso dove la risorsa può essere raggiunta. Segue il formato:protocollo://{hostname o nome dominio/ip}[:porta]/percorso/?parametro1=valore1¶metro2=valore2...
URN
(Uniform Resource Name): rappresenta il contesto o namespace in cui è inserita la risorsa, senza indicarne il percorso di accesso. Un URN consente, ad esempio, di classificare un libro in base al suo genere, indipendentemente dalla sua ubicazione specifica