Sotto il 65%: quando la variabilità abbassa la soglia di efficienza del flusso

In un articolo precedente ho utilizzato la Teoria delle Code – e nello specifico la Legge di Little come caso particolare – per spiegare perché un sistema di flusso raggiunga la sua massima efficienza intorno al 65% del carico massimo teorico. Questo articolo si rivolge a chi vuole approfondire le basi matematiche di quel risultato e capire cosa succede quando le ipotesi semplificatrici del modello di partenza vengono rilassate.

Il modello sottostante, che ora possiamo nominare esplicitamente, si chiama M/M/1: una coda con un unico canale di servizio (1), arrivi casuali senza memoria secondo una distribuzione di Poisson (la prima M, da Markovian) e tempi di servizio con distribuzione esponenziale (la seconda M). In notazione estesa di Kendall si scriverebbe M/M/1/∞, dove ∞ indica che non c’è limite alla lunghezza della coda, ma per convenzione il quarto elemento si omette quando è infinito.

C’è però un’assunzione nascosta, che vale la pena portare in superficie: il modello M/M/1 fissa la variabilità del sistema a un valore preciso e implicito. Il 65% è corretto, ma solo per quel livello di variabilità. Se il sistema è più regolare, la soglia si alza. Se è più caotico, si abbassa.

La formula che permette di generalizzare questo risultato si chiama formula di Kingman, o equazione VUT. È il punto di arrivo naturale del ragionamento che abbiamo iniziato.

Cosa mancava nel modello precedente

Nel modello M/M/1, sia gli arrivi che i tempi di servizio seguono distribuzioni con una proprietà specifica: il loro coefficiente di variazione – il rapporto tra deviazione standard e media – è esattamente pari a 1.

Questo significa che stavamo implicitamente assumendo una variabilità “standard” sia per gli arrivi che per i tempi di lavorazione. Nella realtà queste assunzioni reggono raramente. Un sistema in cui gli elementi di lavoro (work item) arrivano a ondate – fine mese, fine sprint, richieste urgenti in cluster – ha una variabilità degli arrivi ben superiore a 1. Un sistema in cui alcuni task richiedono un’ora e altri una settimana ha una variabilità dei tempi di servizio anch’essa superiore a 1.

La domanda diventa: come cambia il Tempo di Ciclo quando la variabilità non è quella “standard” del modello M/M/1?

La formula di Kingman

La risposta la fornisce John Kingman, matematico britannico, con una formula che generalizza M/M/1 a sistemi con distribuzioni arbitrarie di arrivi e servizi. La formula calcola una approssimazione accettabile del tempo medio di attesa in coda (Wq), cioè il tempo che un work item trascorre in attesa prima di essere preso in carico:

  • Ca² = quadrato del coefficiente di variazione degli arrivi
  • Cs² = quadrato del coefficiente di variazione dei tempi di servizio
  • ρ = λ / μ = tasso di utilizzazione del sistema, dove λ è il tasso di arrivo dei work item e μ è la capacità produttiva
  • Te = tempo medio di servizio

La formula si legge come il prodotto di tre fattori distinti:

  1. Il fattore di variabilità: (Ca² + Cs²) / 2 – cresce all’aumentare dell’irregolarità del sistema
  2. Il fattore di utilizzazione: ρ / (1 − ρ) – esplode quando ci si avvicina al 100% di carico
  3. Il tempo di servizio base: Te – scala il risultato all’unità di misura del sistema

Il tempo totale di permanenza nel sistema – il Tempo di Ciclo che ci interessa (W) – si ottiene sommando il tempo di attesa in coda con il tempo di servizio: W = Wq + Te.

M/M/1 come caso particolare

Se sostituiamo nella formula di Kingman i valori propri del modello M/M/1, ovvero Ca² = 1 e Cs² = 1, otteniamo come tempo medio di attesa in coda (Wq):

Il tempo totale nel sistema (W), che include anche il tempo di servizio, diventa:

Sostituendo Te = 1/μ e ρ = λ/μ:

Che è esattamente la formula del Ws usata nell’articolo precedente. M/M/1 è dunque un caso particolare di Kingman, valido quando la variabilità di arrivi e servizi è esattamente pari a 1.

Per completezza vale la pena notare che le formule esatte per code con distribuzioni specifiche furono sviluppate da Agner Krarup Erlang già a inizio ‘900. Kingman generalizza quel lavoro a distribuzioni arbitrarie, al prezzo di un’approssimazione, sufficientemente accurata per le analisi che ci interessano. Più recentemente Donald Reinertsen in The Principles of Product Development Flow si riferisce alla formula di Allen-Cuneen, che esprime lo stesso risultato in termini di lunghezza media della coda (Lq) anziché di tempo di attesa (Wq) – le due formule sono equivalenti e collegate dalla Legge di Little: Lq = λ · Wq.

Cosa cambia con la variabilità

Il fattore (Ca² + Cs²) / 2 è il moltiplicatore che modifica il tempo di attesa in coda (Wq) rispetto al caso M/M/1. Se è uguale a 1, siamo nel caso precedente. Se è maggiore di 1, Wq cresce proporzionalmente. Se è minore di 1, il sistema regge meglio il carico. Il tempo totale W = Wq + Te cambia di conseguenza, ma in misura attenuata perché Te rimane fisso.

Riprendiamo il sistema dell’articolo precedente: capacità produttiva μ = 10 work item al giorno per ogni giornata lavorativa di 8 ore.

Carico (λ)Utilizzo (ρ)W – bassa variabilità (Ca²=Cs²=0,5)W – M/M/1 (Ca²=Cs²=1)W – alta variabilità (Ca²=Cs²=2)
550%1h 12min1h 36min2h 24min
660%1h 24min2h3h 12min
770%1h 44min2h 40min4h 32min
880%2h 24min4h7h 12min
990%4h 24min8h15h 12min

La struttura è la stessa: il Tempo di Ciclo esplode avvicinandosi al 100%. Ma la scala cambia in modo significativo. Con alta variabilità, già al 50% di carico il sistema impiega quasi due ore e mezza per evadere un singolo work item e al 70% di carico il sistema impiega quasi cinque ore, laddove con bassa variabilità lo stesso carico del 70% sarebbe invece ancora ampiamente gestibile.

Il 65% potrebbe essere ottimistico

Il risultato pratico è diretto: la soglia del 65% vale per il caso M/M/1, cioè per un sistema con variabilità “standard”. Nel lavoro di concetto (knowledge work) e nei servizi dove le richieste arrivano in modo irregolare e i tempi di lavorazione possono variare molto da un task all’altro, Ca² e Cs² sono tipicamente superiori a 1.

Questo significa che il 65% è, in molti contesti reali, una stima ottimistica. La soglia di efficienza reale si abbassa. Un sistema con alta variabilità può richiedere di operare al 50% o anche meno per mantenere Tempi di Ciclo accettabili.

Le leve per migliorare il flusso

“Festina lente” (Affrettati lentamente – Svetonio)

Reinertsen suggerisce e rende esplicite tre leve distinte per la gestione delle code, con efficacia e natura diverse. Vale la pena passarle in rassegna.

1. Ridurre il carico (ρ) – leva dominante

È la leva del limite al lavoro in corso (WIP limit): tenere il sistema al di sotto della soglia di saturazione. Il fattore di utilizzazione ρ/(1−ρ) cresce in modo superlineare, a ρ=0,9 vale 9, a ρ=0,95 vale 19. Agire su ρ produce effetti sproporzionatamente grandi rispetto all’entità dell’intervento.

2. Ridurre la variabilità (Ca² e Cs²) – leva incrementale

Il fattore di variabilità entra nella formula in modo lineare rispetto a Ca² e Cs²: raddoppiare la variabilità raddoppia Wq, nulla di più. Nel concreto significa regolarizzare il flusso degli arrivi e ridurre la dispersione dei tempi di lavorazione – standardizzazione, suddivisione dei task in unità più omogenee. Nel knowledge work tuttavia la variabilità è difficile da comprimere per ragioni strutturali: è nella natura del lavoro cognitivo. La riduzione della variabilità è un miglioramento incrementale sopra la leva dominante, non un’alternativa ad essa.

3. Gestire la sequenza della coda – leva compensativa

Quando la coda esiste, l’ordine con cui i work item vengono processati ha un valore economico misurabile. Nel manifatturiero, dove i job sono di solito omogenei per durata e costo del ritardo, FIFO (First-In-First-Out) è ottimale e non c’è nulla da ottimizzare nella sequenza. Nel lavoro di concetto i work item sono eterogenei per definizione, e una disciplina di gestione della coda (queueing discipline) esplicita crea valore. Le due euristiche di base: a parità di durata, prima il job con costo del ritardo più alto; a parità di costo del ritardo, prima il job più corto. Nel linguaggio Kanban, questa leva si traduce in classi di servizio e policy di replenishment.

Vale però sottolineare che la queueing discipline è uno strumento compensativo: serve perché siamo lontani dall’ottimo, non è una soluzione strutturale. L’obiettivo ideale è avere code così piccole da non richiedere discipline di priorità e ci si arriva agendo sulle prime due leve.

Un vantaggio comune alle leve 1 e 3

Limitare il WIP e gestire la sequenza della coda sono interventi su variabili soft: si attuano con una decisione di policy, sono immediati e reversibili. Aumentare la capacità produttiva (μ) è invece una variabile hard: assumere, formare, riorganizzare sono azioni lente e costose. Questa asimmetria pratica rafforza ulteriormente la priorità delle leve operative rispetto all’investimento in capacità.

Quanto costa non avere capacità in eccesso

Fino a qui abbiamo ragionato in termini di flusso. C’è però una formalizzazione economica del problema che vale la pena esplicitare, particolarmente utile quando si deve giustificare una scelta di capacity management a un imprenditore o un responsabile aziendale.

Il costo totale di un sistema in coda è la somma di due componenti che si muovono in direzioni opposte:

  • Cc = costo unitario della capacità (il costo di avere una persona in più, un server in più)
  • CD = costo unitario del ritardo (il valore economico del tempo perso in attesa)
  • Cc·μ = costo totale della capacità, che cresce linearmente con μ
  • CD·λ/(μ−λ) = costo totale del ritardo, che decresce all’aumentare di μ e diverge quando μ converge verso il valore di λ

Il minimo del costo totale si trova in:

La lettura è diretta: la capacità ottimale è sempre superiore al tasso di arrivo – operare al 100% non è mai ottimale economicamente. La distanza dall’ottimo dipende dal rapporto CD/Cc: quanto più il costo del ritardo è alto rispetto al costo della capacità, tanto più conviene investire in capacità in eccesso.

Per chi deve prendere queste decisioni, il ragionamento si traduce in una domanda concreta: quanto costa, nella mia organizzazione, un giorno di ritardo su un work item tipico? Se la risposta è “molto” – cliente che aspetta, opportunità che sfuma, deadline contrattuale a rischio – allora la capacità in eccesso non è uno spreco, è un investimento con un rendimento calcolabile. Operare “al risparmio” sulla capacità può essere la scelta economicamente peggiore.

Conclusione

La Legge di Little ci dice che WIP (L), tasso di arrivo (λ) e Tempo di Ciclo (W) sono legati. Il modello M/M/1 mostra come il Tempo di Ciclo esploda avvicinandosi alla saturazione. Kingman completa il quadro: l’esplosione è amplificata dalla variabilità, e variabilità e utilizzazione si moltiplicano, non si sommano.

Il 65% rimane un riferimento utile. Ma in un sistema ad alta variabilità, come può essere il knowledge work, è una soglia da cui partire verso il basso, non un obiettivo da raggiungere. Le leve per migliorare il flusso esistono, hanno efficacia diversa, e – cosa non trascurabile – le più potenti sono anche le più facili da azionare.

Bibliografia

  1. John F.C. Kingman, The single server queue in heavy traffic, Mathematical Proceedings of the Cambridge Philosophical Society, 1961
  2. Paul Newbold, Principles of Management Science, Prentice-Hall, 1986
  3. Donald G. Reinertsen, The Principles of Product Development Flow, Celeritas Publishing, 2009

Il traffico cognitivo: il vero spreco del lavoro intellettuale

C’è uno spreco silenzioso che consuma ogni giorno una parte significativa del tempo dei team. Non è la riunione inutile, non è il processo ridondante. È qualcosa di più sottile: il continuo interrompere i colleghi per trovare un’informazione, il messaggio su chat inviato alle quattro del pomeriggio per sapere a che punto è una attività, la risposta attesa che blocca il lavoro proprio mentre si aspetta.

Chiamiamolo traffico cognitivo: la comunicazione non pianificata, destrutturata, generata non da reale collaborazione ma da asimmetria informativa. Tutti sanno dove si trovano le macchine in una fabbrica. Nel lavoro intellettuale (knowledge work), invece, le informazioni vivono nelle teste delle persone e trovarle richiede di interromperle.

Non si tratta di una percezione soggettiva. Lo dicono le ricerche sul communication overhead nel knowledge work, ma lo sperimentiamo tutti in prima persona e lo possiamo misurare facilmente con un piccolo esperimento: basta segnarsi su un foglio, per qualche giorno, le volte che interrompiamo o veniamo interrotti.

La lezione di Toyota: avvicinare le informazioni, non solo le persone

Toyota ha risolto un problema analogo in fabbrica con le celle di lavorazione (work cells): invece di disporre le macchine per tipo – tutte le fresatrici insieme, tutti i torni insieme – le ha raggruppate attorno al flusso di lavoro del prodotto. Il risultato è che un operatore non deve continuare a spostarsi per trovare quello che gli serve: è già vicino. Questo principio fa parte del Toyota Production System (TPS), il sistema di produzione che ha ispirato il pensiero Lean e, a cascata, buona parte dei metodi di gestione del lavoro contemporanei.

Negli uffici e nei team di knowledge work, il problema non è fisico: le persone non si spostano tra i reparti. Il problema è temporale e informativo. “Ci si sposta” con le dita sulla tastiera, mandando messaggi, cercando aggiornamenti, chiedendo conferme. La distanza da colmare non è metri, ma minuti e contesti.

Il principio sottostante alla cella Toyota, però, vale anche qui: se si rendono le informazioni accessibili senza dover chiedere, si elimina il bisogno di interrompere.

Visual management: la cella di Toyota per le informazioni

Una prima risposta per colmare la distanza informativa è il visual management, ovvero rendere lo stato del lavoro visibile a tutti i membri del team senza dover chiedere. Nelle fabbriche Toyota, ogni macchina, ogni kanban card, ogni indicatore è progettato per essere leggibile a colpo d’occhio. Nei team intellettuali, l’equivalente è la Kanban board: una rappresentazione visiva del lavoro in corso, in attesa e completato, aggiornata in tempo reale.

La pratica generale ‘Visualizza’ del metodo Kanban si articola in più di quaranta pratiche specifiche su sei livelli di maturità, che permettono la realizzazione di un solido sistema Kanban. Un sistema Kanban ben progettato riduce il bisogno di aggiornamenti via chat semplicemente perché chi vuole sapere può guardare la Kanban board.

Visual management e cadenze lavorano insieme: la board rende visibile lo stato del lavoro in ogni momento, le cadenze creano i momenti in cui quello stato viene discusso e aggiornato collettivamente.

Le cadenze: avvicinare le persone alle informazioni nel tempo

Una delle risposte più efficaci al traffico cognitivo sono le cadenze di coordinamento: riunioni brevi, sistematiche e con una frequenza precisa, progettate per condividere lo stato del lavoro in modo strutturato e prevedibile.

La pratica generale ‘Implementa cicli di feedback’ del metodo Kanban prevede un sistema articolato di otto cadenze, ciascuna con scopo e frequenza diversi: il Team Kanban Meeting quotidiano per sincronizzare il flusso; il Replenishment Meeting per decidere cosa fare entrare nel sistema; il Delivery Planning Meeting per allinearsi sulle consegne; la Service Delivery Review per valutare la qualità del servizio erogato; la Service Request Review per analizzare la domanda di servizio; l’Operations Review per ottimizzare il sistema operativo; la Strategy Review per riallineare priorità e direzione, la Risk Review per la gestione del rischio a livello sistemico. Non sono riunioni generiche: ognuna ha un perimetro informativo preciso e una lista di partecipanti coerente con quello scopo.

Il meccanismo è elegante nella sua semplicità: se so che domani mattina alle 9:15 avrò tutte le informazioni che mi servono in un Team Kanban Meeting di quindici minuti, non mando il messaggio stasera alle 17:47. La cadenza assorbe il bisogno. La chat rimane silenziosa.

Definition of Ready: avere tutte le informazioni quando servono

In un buon sistema Kanban viene anche implementata la pratica di Definition of Ready (DoR), nota anche come criteri di accettazione della richiesta.

Rappresenta una politica esplicita che stabilisce i requisiti informativi necessari affinché un elemento di lavoro possa superare il punto di impegno (commitment point). Questa pratica assicura che le richieste in entrata siano complete, chiare, coerenti e verificabili, inclusi i criteri per sapere quando il risultato è accettabile. La visualizzazione di questi criteri facilita il processo decisionale durante i Replenishment Meeting, garantendo che il team e il cliente abbiano una comprensione condivisa di ciò che è pronto per essere lavorato.

In definitiva, la DoR riduce la distanza informativa a valle, proteggendo il sistema Kanban da traffico cognitivo e incertezze, garantendo un’erogazione del servizio più fluida e prevedibile.

Perché funziona: il costo del ritardo informativo

Dietro queste logiche c’è un concetto fondamentale: il costo del ritardo (cost of delay). Ogni volta che un’informazione non è disponibile nel momento in cui serve, qualcuno la va a cercare – interrompendo se stesso e gli altri. Questo costo è quasi invisibile perché distribuito: qualche minuto qui, qualche scambio lì. Ma sommato su un team di dieci persone lungo una settimana, diventa una quantità di tempo e attenzione considerevole.

Le cadenze e la DoR non eliminano la comunicazione: la concentrano. Trasformano un flusso continuo e imprevedibile di interruzioni in momenti attesi, circoscritti e produttivi. Il parallelo con il pensiero Lean è diretto: così come il just-in-time elimina le scorte in eccesso producendo solo ciò che serve quando serve, cadenze e DoR eliminano la comunicazione in eccesso producendo il coordinamento solo quando e dove serve.

C’è anche una dimensione psicologica. La prevedibilità riduce l’ansia informativa: sapere che le informazioni arriveranno – e quando – permette di lavorare con più concentrazione nel frattempo. Le cadenze creano le condizioni strutturali perché questo sia possibile.

Cosa cambia in pratica

Introdurre cadenze di coordinamento efficaci richiede tre ingredienti. Il primo è una frequenza calibrata sul tipo di lavoro: troppo rare, non riescono ad assorbire le urgenze; troppo frequenti, diventano esse stesse un’interruzione. Il secondo è un formato chiaro: ognuno sa cosa porta e cosa si porta via, e la riunione non degenera in un aggiornamento generico. Il terzo è un sistema visivo che renda lo stato del lavoro leggibile senza dover chiedere – la Kanban board, appunto.

Nel Kanban Maturity Model (KMM), lo strumento sviluppato per misurare la maturità organizzativa nell’adozione del metodo Kanban, la capacità di progettare e mantenere cadenze efficaci è considerata un indicatore di maturità non banale: richiede che l’organizzazione abbia già sviluppato una certa trasparenza sul lavoro e una cultura di fiducia tra i team.

Quando questi elementi sono presenti, qualcosa cambia nel clima del team. Le chat si fanno più silenziose. Non perché le persone comunichino meno, ma perché comunicano meglio: nel momento giusto, con le informazioni giuste, senza interrompere il flusso di chi sta pensando.

Conclusione

Il vero spreco del knowledge work non è il tempo passato in riunione. È il tempo perso nel mezzo del lavoro a cercare informazioni che dovrebbero già essere disponibili. Toyota lo ha capito per le fabbriche disegnando le celle di lavorazione: avvicina fisicamente ciò che deve collaborare. Per i team intellettuali, la risposta ha una forma diversa – cadenze, visual management e DoR – ma una logica identica: progettare il flusso delle informazioni prima ancora di progettare il lavoro.

Le cadenze di coordinamento non sono uno strumento di controllo né un’altra riunione da calendario. Sono un sistema di riduzione del rumore – in un’epoca in cui l’attenzione è la risorsa più scarsa, ridurre il rumore è forse l’intervento organizzativo con il miglior rapporto tra semplicità e impatto.

Oltre la produttività: come l’efficienza di flusso genera migliore qualità

Nel mondo dei servizi, la convinzione che il raggiungimento di efficienza e qualità siano obiettivi in contrasto è un sintomo rivelatore di un fondamentale equivoco. Tale percezione, che costringe a un perenne gioco di equilibri, nasce da una profonda incomprensione della fisica del lavoro intellettuale (knowledge work), dove si presume che per ottenere più qualità sia necessario sacrificare la velocità e, viceversa, che la ricerca dell’efficienza porti inevitabilmente a compromessi sul risultato.

Questo articolo intende spiegare perché tale percezione è errata, dimostrando che la vera efficienza operativa – definita come efficienza di flusso – non solo coesiste con la qualità, ma ne è il principale motore. Vedremo come il miglioramento dei tempi impiegati per l’attraversamento di un sistema e per la generazione del valore porti intrinsecamente a una maggiore prevedibilità, a risultati di qualità superiore e, di conseguenza, a una più profonda soddisfazione del cliente. La qualità non è un traguardo da raggiungere a discapito dell’efficienza, ma la sua naturale conseguenza.

Nel seguito, ridefiniremo il concetto di efficienza per svelarne il legame diretto con la qualità, dimostrando come un’organizzazione matura non debba mai scegliere tra fare le cose bene e farle velocemente.

Ridefinire l’efficienza: dal “tenere tutti occupati” al “far scorrere il lavoro

Adottare una corretta definizione di efficienza non è un mero esercizio stilistico, ma una decisione strategica che determina le performance di un’intera organizzazione. Ancora in molte realtà, il paradigma dominante è quello dell’efficienza delle risorse, un modello obsoleto che mira a massimizzare l’utilizzo del tempo delle persone. Questo approccio, che parte dal presupposto che un dipendente “occupato” sia un dipendente produttivo, è in netto contrasto con il più moderno ed efficace concetto di efficienza di flusso.

L’efficienza di flusso non misura quanto sono occupate le persone, ma la velocità con cui un qualunque elemento di lavoro richiesto dal cliente attraversa il nostro sistema. Questa metrica calcola la percentuale di tempo in cui un’attività viene elaborata attivamente rispetto al tempo totale che trascorre all’interno del processo, incluse le fasi di attesa, le code e i blocchi. Come insegna il Toyota Way, le principali fonti di inefficienza che ostacolano il flusso sono:

• Muri (sovraccarico): persone e sistemi sovraccaricati di lavoro.

• Mura (irregolarità): un flusso di lavoro incostante e imprevedibile.

• Muda (spreco): attività che non aggiungono valore.

Concentrarsi esclusivamente sull’efficienza delle persone e delle risorse ha un impatto profondamente negativo. La pressione per “tenere tutti occupati” genera un aumento del lavoro in corso (WIP – Work in Progress), incentiva il multitasking e frammenta l’attenzione. I team, costretti a passare continuamente da un’attività all’altra, perdono il focus, commettono più errori e accumulano ritardi. Invece di accelerare, il sistema rallenta, e la qualità del lavoro diminuisce drasticamente.

Una volta compresa la vera natura dell’efficienza come fluidità del flusso che crea valore, il suo legame indissolubile con la qualità diventa evidente e inevitabile.

Il legame indissolubile: come i flussi di lavoro efficienti migliorano la qualità

Le pratiche mirate a migliorare l’efficienza di flusso non sono semplici ottimizzazioni operative; hanno un impatto diretto, positivo e misurabile sulla qualità del prodotto finale e del servizio erogato. Quando un’organizzazione smette di concentrarsi sull’essere “occupata” e inizia a focalizzarsi sul far scorrere il lavoro, la qualità emerge come risultato naturale del processo.

Riduzione di rilavorazioni e failure demand

La failure demand è il lavoro generato da uno scarso servizio al cliente. Non si tratta solo di correzione di difetti, ma include anche rilavorazioni di specifiche o di progettazione dovute a comunicazione insufficiente, nonché lavoro abortito perché basato su requisiti errati. Queste attività sono pura inefficienza: consumano tempo e risorse senza produrre nuovo valore. Migliorare il flusso significa identificare ed eliminare sistematicamente le cause di questo spreco. Un processo efficiente riduce le rilavorazioni, assicurando che il lavoro venga eseguito correttamente la prima volta e liberando capacità per creare valore. Questo si traduce direttamente in un prodotto di qualità superiore per il cliente, che non subisce i costi e i ritardi derivanti da difetti o errori interni.

Prevedibilità che genera fiducia

Un flusso di lavoro regolare e prevedibile è il fondamento di un servizio affidabile. La fiducia del cliente non si costruisce con grandi risultati occasionali, ma con la certezza di piccoli buoni risultati costanti. La prevedibilità non significa essere perfetti, ma fare una promessa e mantenerla con costanza. Il meccanismo alla base di questo è la capacità di impegnarsi su un livello di servizio statisticamente valido, come l’85° percentile: promettere, ad esempio, che “l’85% delle richieste sarà completato entro 10 giorni“. Consegnare costantemente sei articoli su sette entro i termini promessi è una soglia psicologicamente accettata che trasforma l’affidabilità in fiducia, un attributo fondamentale della qualità percepita.

Limitare il lavoro in corso (WIP) per aumentare la focalizzazione

Una delle pratiche più efficaci per migliorare l’efficienza di flusso è limitare il WIP. L’impatto sulla qualità è immediato e meccanico: quando il limite al WIP non consente di avviare nuovo lavoro, i membri del team che sarebbero altrimenti inattivi sono incentivati a collaborare attivamente. Questo fenomeno, noto come swarming, li porta a convergere su attività bloccate o su quelle più complesse. La riduzione del multitasking e l’aumento della collaborazione consentono ai team di focalizzarsi, commettere meno errori, risolvere i problemi più rapidamente e produrre risultati di qualità superiore al primo tentativo.

Comprendere come queste dinamiche si intrecciano nel percorso di crescita di un’organizzazione è fondamentale. Il Kanban Maturity Model ci offre una mappa per osservare questa evoluzione nel concreto.

Un viaggio verso la qualità: l’evoluzione attraverso il Kanban Maturity Model (KMM)

Il Kanban Maturity Model (KMM) è un modello evolutivo che descrive il percorso di un’organizzazione verso una maggiore agilità, resilienza e performance. Il passaggio tra i suoi livelli di maturità illustra perfettamente come l’efficienza di flusso e la qualità si sviluppino in sinergia, l’una alimentando l’altra. L’evoluzione dal livello di maturità ML2 a ML3 rappresenta un punto di svolta cruciale in questo viaggio.

CaratteristicaLivello di maturità 2 (ML2) – Customer-DrivenLivello di maturità 3 (ML3) – Fit-for-Purpose
MottoMai lo stesso risultato due volteAdatto allo scopo” (Fit-for-Purpose)
RisultatiInconsistenti e imprevedibili per il cliente.Consistenti, affidabili e in linea con le aspettative del cliente.
Fonte del successoSforzi eroici di singoli manager che “spingono avanti” il lavoro.Processi stabili e un sistema resiliente che genera il valore.
Fiducia del clienteRiposta in individui specifici (i manager eroi), non nel sistema.Riposta nell’organizzazione e nei suoi processi prevedibili.
Stato del sistemaSpesso sovraccarico, con un bilanciamento inefficace tra domanda e capacità.Domanda e capacità sono bilanciate, generando un flusso di lavoro prevedibile.

La transizione da ML2 a ML3 segna il passaggio da un’organizzazione che prova a servire il cliente a una che ci riesce in modo sistematico. Questo salto qualitativo è reso possibile dall’adozione di pratiche di ML3 come la gestione sistematica dei blocchi, l’uso di metriche end-to-end come il lead time, per comprendere la reale performance, e il bilanciamento attivo tra domanda e capacità attraverso i Replenishment Meeting. È proprio questo focus sul rendere il flusso stabile e prevedibile che permette di raggiungere lo standard di qualità “fit-for-purpose”.

Questa evoluzione, tuttavia, non può reggersi solo sulle pratiche: richiede delle solide fondamenta culturali.

Le fondamenta culturali: i valori che supportano efficienza e qualità

Le pratiche, da sole, non sono sufficienti per garantire un miglioramento sostenibile. Dietro ogni sistema di lavoro efficiente e di alta qualità c’è una cultura organizzativa che promuove attivamente i comportamenti corretti. Senza i valori giusti, anche le migliori metodologie sono destinate a fallire.

Trasparenza

La trasparenza è il fondamento del miglioramento e della fiducia. Visualizzare il lavoro rende immediatamente evidenti colli di bottiglia, impedimenti e inefficienze, permettendo ai team di agire. Tuttavia, la trasparenza può incontrare forti resistenze, come dimostra l’aneddoto di un vice-presidente che una volta strappò una portfolio kanban board dal muro perché minava la sua capacità di controllare la narrazione. Questo valore è così cruciale da essere codificato in un filtro decisionale: preferire la condivisione delle informazioni e la democratizzazione del processo decisionale, al nascondere le informazioni e centralizzare il potere.

Collaborazione

Una cultura collaborativa, che abbatte i silos funzionali, è essenziale per ottimizzare il flusso. Quando i team lavorano insieme, sono in grado di risolvere i problemi che attraversano i confini organizzativi in modo molto più rapido ed efficace. La collaborazione ha anche un impatto diretto sulla qualità: la condivisione delle conoscenze previene gli errori, mentre la responsabilità collettiva sul risultato finale garantisce che ogni parte del processo sia curata con la massima attenzione.

Focalizzazione sul cliente

Infine, un autentico orientamento al cliente fornisce lo scopo e la direzione per ogni sforzo di miglioramento. A partire da ML2, l’organizzazione inizia a comprendere i cosiddetti fitness criteria: i criteri che i clienti usano per decidere se utilizzare un servizio. Questa comprensione permette di focalizzare gli sforzi di efficientamento solo su ciò che genera valore reale. L’efficienza non è fine a se stessa, ma è finalizzata a soddisfare meglio uno scopo. Comprendere questo scopo permette di eliminare gli sprechi e di concentrarsi su ciò che definisce la qualità agli occhi di chi riceve il servizio.

Conclusione: efficienza e qualità, due facce della stessa medaglia

L’idea che efficienza e qualità siano in conflitto è un mito che limita il potenziale di troppe organizzazioni. Come abbiamo visto, l’efficienza di flusso e l’alta qualità non sono obiettivi concorrenti, ma risultati interdipendenti di un sistema di lavoro maturo e ben gestito. Sono, in sostanza, due facce della stessa medaglia.

Una corretta definizione di efficienza, focalizzata sul far scorrere il lavoro e non sul tenere le persone occupate, è il primo passo. Le pratiche che ne derivano, come la limitazione del WIP e la riduzione della failure demand, hanno un impatto diretto e positivo sulla qualità, generando prevedibilità e costruendo la fiducia dei clienti. Infine, una cultura basata su trasparenza, collaborazione e focalizzazione sul cliente fornisce il terreno fertile su cui questo circolo virtuoso può crescere e prosperare.

Smettete di misurare l’utilizzo del tempo delle persone, un indicatore che premia l’inefficienza di flusso. Iniziate a gestire il lavoro come un asset che fluisce verso il cliente, non come un’agenda da riempire. Così facendo, sbloccherete livelli superiori non solo di efficienza, ma anche di quella qualità che vi renderà veramente leader nel vostro mercato.