KPI e Metriche

Business Intelligence self-service per PMI italiane 2022: tool e architettura

Gianluca Gentile 27 Aprile 2022 20 min lettura

In quasi tutte le PMI italiane esiste un file Excel con un nome rassicurante: vendite_2022_v17_DEFINITIVO_OK.xlsx. Vive su OneDrive, viene aperto da cinque persone in contemporanea, contiene tre macro che funzionano solo sul PC del controller, e ogni lunedì mattina genera la riunione operativa. Quando il commerciale Nord chiede “perché il mio fatturato non torna con quello del CFO?”, la risposta tipica è “guarda, c’è una pivot diversa, ti rimando il file aggiornato“. Risultato: tre versioni della verità, zero audit trail, decisioni su numeri che nessuno sa più ricostruire.

Il problema non è Excel, è che viene usato come piattaforma di Business Intelligence senza esserlo. Mancano versionamento, governance, controlli di accesso a livello di riga, e un livello semantico condiviso che dica “fatturato netto significa questo, punto“. Negli ultimi due anni il modern data stack ha reso accessibili a PMI da 20-200 dipendenti strumenti che fino al 2018 costavano centinaia di migliaia di euro: Power BI a 9,99 dollari per utente, Snowflake a consumo, dbt open source, Metabase self-hosted gratuito.

In questo articolo vediamo cos’è davvero la self-service BI, quale architettura ha senso per una PMI italiana nel 2022, quali tool valutare (Power BI, Tableau, Metabase, Looker, Apache Superset), quanto costa portarli a regime su tre anni con 25 utenti, e come strutturare un rollout di 90 giorni.

TL;DR — Verdetto per persona

CEO/Direttore Generale: parti da Power BI Pro (9,99 $/utente) se sei già su Microsoft 365, oppure Metabase self-host se hai un sistemista interno. Non comprare Tableau Creator a 70 $/utente prima di aver definito le metriche con il controller.

Responsabile IT / CTO: il problema non è scegliere il tool, è costruire il semantic layer. Investi su dbt + un data warehouse (Snowflake o BigQuery), poi il BI tool diventa quasi commodity. Hub-and-spoke batte la centralizzazione totale per PMI multi-divisione.

Controller / CFO: pretendi datasets certified, KPI definiti una sola volta in un repository versionato, row-level security e un processo di approvazione delle nuove metriche. La self-service BI senza governance produce dashboard che si contraddicono.

Cos’è la self-service BI e perché non è la BI tradizionale

Per quindici anni la BI in azienda ha funzionato così: il business chiede un report all’IT, l’IT mette in coda la richiesta, dopo tre-otto settimane consegna un report statico, il business scopre che la metrica era stata richiesta male, ritorna in coda. Strumenti come Cognos, Business Objects, MicroStrategy erano potenti ma richiedevano sviluppatori dedicati. La self-service BI ribalta lo schema: l’utente business prepara, modella, visualizza e condivide i dati direttamente, mentre l’IT gestisce l’infrastruttura sottostante, non i singoli report.

Nella BI tradizionale esistono un solo DWH, un solo strato di reportistica, un solo team che lo gestisce. Nella self-service BI esiste un layer comune di dati certificati sopra cui ogni area costruisce le proprie analisi senza chiedere permesso. Questo modello “hub-and-spoke” richiede governance forte: senza un semantic layer condiviso ogni reparto definirà “fatturato” a modo suo. Va detto chiaramente: self-service BI non significa dare a tutti accesso a tutto il database, significa offrire un ambiente in cui utenti formati interrogano dati certificati dentro un perimetro tecnico (RLS, RBAC) e culturale (data literacy) definito.

Le cinque capability core di una piattaforma self-service BI

Le funzionalità da osservare sono cinque: data preparation, data modeling, data visualization, sharing e governance.

La data preparation prende dati grezzi (CSV, API, tabelle SQL) e li porta in forma utilizzabile. Power BI ha Power Query, Tableau ha Tableau Prep, Metabase si appoggia al SQL. La domanda chiave: questa trasformazione vive nel singolo report o è centralizzata? Per una PMI che vuole scalare la risposta corretta è centralizzata, via dbt o Power BI Dataflow.

Il data modeling è la definizione delle relazioni tra tabelle e delle metriche calcolate. Power BI usa DAX, Tableau le calculated fields, Looker usa LookML versionato su Git. Qui si gioca la partita del semantic layer: una metrica “margine lordo” definita una sola volta, riutilizzata ovunque.

La data visualization è il livello più visibile ma meno differenziante: la differenza la fanno interattività (drill-down, cross-filter), velocità di esplorazione e qualità tipografica del default. Tableau è ancora il riferimento, ma il gap con Power BI si è ridotto molto.

Il sharing riguarda la distribuzione: link interni, embedding in app, export PDF, alerting via email o Slack/Teams. Una dashboard meravigliosa che nessuno apre vale zero.

La governance separa un’implementazione professionale da un esperimento: versionamento delle metriche, datasets certificati, row-level security, audit log, data lineage. Power BI ha datasets certified e sensitivity labels, Tableau le Data Roles, Looker ha LookML versionato. Su Metabase OSS e Superset la governance va costruita con processi.

Team di data scientist e analisti in riunione attorno a un tavolo con laptop e dashboard analytics

L’architettura del modern data stack per una PMI

Nel 2022 l’architettura di riferimento è il modern data stack, articolato su cinque livelli che comunicano via API standard.

Le sorgenti dati: gestionale ERP (SQL Server, MySQL, PostgreSQL), CRM (Salesforce, HubSpot, Pipedrive), e-commerce (Magento, WooCommerce, Shopify), marketing (Google Ads, Meta Ads, Mailchimp), file CSV o Google Sheet del controller.

La data integration porta i dati al data warehouse. Lo schema dominante è l’ELT: si caricano i dati grezzi nel DWH e si trasformano lì. Strumenti tipici: Fivetran (commerciale, oltre 200 connettori, pricing a Monthly Active Rows), Stitch (entry-level, Talend), Airbyte (open source, cresciuto molto nel 2021).

Il data warehouse è il cuore: Snowflake (separazione compute/storage, IPO 2020), Google BigQuery (serverless, pricing a TB scansionati), Amazon Redshift, Azure Synapse Analytics, Databricks Lakehouse. Per una PMI con volumi modesti (decine di GB, non TB) la differenza è di ecosistema: se sei su Azure, Synapse è naturale; se sei agnostico, Snowflake è il compromesso migliore.

La data transformation nel 2022 si fa sempre più con dbt: trasformazioni SQL versionate su Git, test automatici, documentazione generata, lineage. dbt Labs ha chiuso una Series C da 222 milioni di dollari a novembre 2021. dbt Core (OSS) è gratuito, basta CI/CD elementare su GitHub Actions.

Il BI tool: Power BI, Tableau, Metabase, Looker, Sigma Computing, Mode, ThoughtSpot, Apache Superset. La scelta dipende dal pubblico interno (SQL-friendly o no), dal budget, dall’ecosistema, dall’embedded analytics in app custom.

Trasversalmente sta il semantic layer, che può vivere nel BI tool (Power BI dataset, Tableau Data Source, LookML) o essere indipendente (Cube.js OSS, MetricFlow di Transform). “Customer churn rate trimestrale” va definita una volta e riutilizzata identica in qualunque dashboard.

Hub-and-spoke: il modello organizzativo giusto

Storicamente esistevano due estremi: BI centralizzata (team unico, controllo totale, backlog infinito) e decentralizzata (ogni reparto fa quello che vuole, zero coerenza). Nessuno dei due funziona in una PMI italiana media, con team dati di una-due persone e alta pressione del business.

Il modello che ha senso è l’hub-and-spoke: un hub centrale (1-2 analytics engineer) gestisce DWH, pipeline ELT, semantic layer e datasets certificati. Gli spoke (1-2 champion per area: vendite, marketing, operations, finance) costruiscono dashboard sopra ai datasets certificati ma non possono modificare le definizioni base senza passare dall’hub. I champion conoscono il dominio e si muovono veloci, il controller ha garanzia che il “fatturato” sul dashboard vendite sia lo stesso del cruscotto direzionale.

Sulla domanda “dove fare la trasformazione” — in Power Query, in Dataflow o in dbt — la risposta dipende dalla maturità. All’inizio Power Query è accettabile; con 5-6 dashboard conviene passare ai Dataflow; oltre dieci sorgenti e più destinatari (non solo BI) conviene spostare tutto su dbt. Pianifica di muoverti verso dbt entro 12-18 mesi, non saltare passaggi: forzarlo il primo giorno su un team che non sa cos’è Git è una ricetta per il fallimento.

Cinque tool self-service BI per PMI: deep-dive

1) Microsoft Power BI — la scelta naturale per chi ha Microsoft 365

Power BI è composto da Power BI Desktop (gratuito, Windows-only), Power BI Service (cloud) e diversi piani di licensing: Power BI Pro a 9,99 dollari/utente/mese (necessario per pubblicare e condividere), Power BI Premium Per User (PPU) a 20 dollari/utente/mese (introdotto ad aprile 2021, abilita dataset più grandi, refresh frequenti, AI integrata, paginated reports), Power BI Premium per capacity (da circa 5.000 dollari/mese per capacity P1, ha senso oltre i 250-500 utenti).

Per 25 utenti che tutti pubblicano e consumano, PPU è il punto dolce: niente capacity da gestire, costo prevedibile. Pro a 9,99 dollari basta se la maggioranza consuma soltanto. Connettività enorme (200+ connettori), DAX potente ma con curva di apprendimento ripida, integrazione nativa con Excel, Teams, SharePoint. Punto debole: modellazione su dataset grandi (oltre 10 GB con Pro), risolto da PPU.

2) Tableau — il riferimento sulla visualizzazione

Tableau (acquisita da Salesforce nel 2019) ha tre licenze principali: Creator a 70 dollari/utente/mese (può fare tutto), Explorer a 35 dollari/utente/mese (modifica dashboard esistenti), Viewer a 15 dollari/utente/mese (sola visualizzazione). Annuali, con minimo postazioni. Tableau Desktop è il client di authoring, Tableau Server è il backend on-premise, Tableau Cloud (ex Tableau Online) è il SaaS.

Punto di forza: qualità della visualizzazione, drag-and-drop fluido, default tipografici curati, interattività profonda. Punto debole: costo per utente, soprattutto se vuoi molti creatori di contenuto. Tableau ha senso quando la visualizzazione è centrale (presentazioni board, dashboard pubbliche) o quando il team ha già skill consolidate.

3) Metabase — il self-hosted gratuito per team SQL-friendly

Metabase è open source (AGPL), si auto-installa via Docker in pochi minuti, ha una versione Cloud da 85 dollari/mese per 5 utenti (con scaling) e una Enterprise da circa 15.000 dollari/anno con governance avanzata. La versione self-hosted è gratuita, illimitata, copre il 90% delle esigenze di una PMI media.

Punto di forza: usabilità. L’interfaccia “Ask a question” permette anche a utenti non tecnici di costruire query semplici cliccando, mentre il SQL editor copre i power user. Robusti collections, dashboard parametrizzate, alert via email/Slack. Punto debole: governance enterprise (row-level security solo in Enterprise) e modellazione semantica meno espressiva di Power BI o Looker. Per una PMI con sistemista interno e dati nel DWH è spesso l’opzione con il miglior rapporto qualità/prezzo.

4) Looker — il semantic layer enterprise post-Google Cloud

Looker (Google Cloud Looker dopo l’acquisizione del 2019) ha come tratto distintivo LookML, un linguaggio dichiarativo per modellare metriche e dimensioni, versionato su Git. Una volta scritto LookML, gli utenti business esplorano i dati senza scrivere SQL, dentro un perimetro semantico controllato dal team dati.

Il pricing non è pubblico: per una PMI italiana si parte da circa 60.000 euro/anno, fascia che lo rende difficilmente competitivo sotto i 100 utenti. Ha senso su organizzazioni multi-divisione con governance forte e semantic layer rigoroso. Per una PMI da 50 dipendenti è tipicamente overkill, ma può ripagare in scalabilità su orizzonti di 3-5 anni se la cultura del dato è centrale.

5) Apache Superset — l’alternativa open source enterprise-grade

Apache Superset è open source (Apache 2.0), nato in Airbnb, mantenuto dalla Apache Software Foundation. Sostenuto commercialmente da Preset (versione SaaS). Connettività SQL nativa su decine di database, visualizzazioni ricche, dashboard parametrizzate, gestione ruoli granulare, SQL Lab per esplorazione.

Punto di forza: maturità tecnica per team con competenze Python/Linux che possono ospitarlo. Zero costo di licenza, integrazione con LDAP, OAuth. Punto debole: usabilità per utenti non tecnici inferiore a Metabase, curva più ripida. Ha senso se hai skill DevOps interne e vuoi investire più in capabilities che in licenze.

Business analyst al lavoro su doppio monitor con grafici e KPI dashboard

Pricing su 3 anni per 25 utenti: il confronto reale

Orizzonte: 25 utenti totali (5 power user, 20 consumatori), tre anni, PMI italiana media. Power BI con mix Pro/PPU (20 Pro a 9,99 + 5 PPU a 20) ≈ 3.300 euro/anno, su tre anni 10.000 euro di licenze; aggiungi training (3-5.000 euro) e consulenza modello dati (8-15.000 euro): totale 22-30.000 euro. Tableau (5 Creator + 20 Viewer) ≈ 7.100 euro/anno licenze, tre anni 21.300 euro; più training e setup: totale 35-45.000 euro. Metabase self-host: licenza zero, hosting 1.500 euro/anno + manutenzione 2-3.000 euro/anno, su tre anni 10-13.000 euro, più setup 5-8.000: totale 15-22.000 euro. Looker: 60.000+ euro/anno licenze, tre anni 180.000+ euro più setup LookML 20-40.000 euro: totale 200.000+ euro, non competitivo sotto i 100 utenti. Apache Superset self-host: licenza zero, hosting 1.500-2.500 euro/anno + tempo interno: totale 10-15.000 euro se hai skill DevOps.

A questi va sempre aggiunto il costo del DWH (Snowflake 200-800 euro/mese per una PMI; BigQuery può essere meno) e degli ETL (Fivetran da 1-3.000 euro/anno, Airbyte self-host gratuito).

Semantic layer, governance, embedded analytics

La “versione unica della verità” non si risolve con il tool, si risolve con il semantic layer. Se “fatturato netto” vive nel singolo report di Power BI, ogni report avrà la sua versione e prima o poi divergeranno. Se vive in un dataset condiviso, in un Tableau Data Source pubblicato, in un model LookML versionato o in un model dbt che alimenta tutti i tool a valle, la metrica è unica per costruzione. Nel 2022 le scelte serie sono tre: nativo nel BI tool (semplice ma ti lega al tool), dbt con metric definitions (capability sperimentale dal 2021, metriche YAML versionate), semantic layer indipendente come Cube.js OSS o MetricFlow di Transform (si frappone tra DWH e BI). Parti col layer nativo, sposta verso dbt o Cube.js quando il numero di dashboard cresce.

Sulla governance pretendi almeno: row-level security (il commerciale Nord vede solo le sue righe), implementata in Power BI con ruoli RLS, in Tableau con Data Roles, in Looker con access_filter in LookML, in Metabase Enterprise con sandbox; datasets certificati distinti dai community/draft (Power BI ha la distinzione dal 2020); audit log degli accessi; un approval flow formale per nuove metriche. Senza questo processo si riproduce in BI il caos di Excel.

Sull’embedded analytics, caso d’uso frequente per PMI che vendono SaaS: Power BI Embedded ha pricing a capacity (da circa 750 dollari/mese), Tableau Embedded richiede licenze speciali, Metabase ha embedding signed (JWT) anche nella versione free, Looker Embedded ha offerta dedicata, Sigma Computing è nato proprio per questo. Per una PMI B2B Metabase signed embedding è spesso il primo passo (zero licenza, JWT firmato per tenant), per scalare poi su Power BI Embedded o Sigma.

Training: data literacy, non solo “click qui”

Il fallimento più frequente non è tecnico, è di adoption. Si compra il tool, si fa una giornata “come si trascinano i campi“, si rilasciano cinque dashboard, dopo tre mesi gli utenti sono tornati a Excel. La formazione tecnica non basta: serve data literacy. Significa insegnare cos’è una distribuzione, perché una media può ingannare, come si legge un trend, correlazione vs causalità, come si imposta un confronto YoY. Significa formare il controller a definire metriche in modo non ambiguo, e allenare i manager a fare domande migliori al dato (“perché il margine sul prodotto X è calato del 4% nel Q1?“) invece di “un report sulle vendite“.

Investire 5-10.000 euro su un percorso interno distribuito su 3-6 mesi vale spesso più di 20.000 euro di licenze in più. ANIE, Confindustria Digitale e camere di commercio territoriali offrono programmi a costo agevolato; sul mercato Maven Analytics, DataCamp, Coursera funzionano bene se accompagnati da progetti reali interni.

Manager presenta risultati e analisi dati a un team executive in sala riunioni

Errori comuni di adoption

Nessun dataset certified: tutto è “community”, ogni riunione comincia con la discussione su quale tabella sia giusta. KPI definitions sparpagliate: “customer churn” è definito in tre modi in tre dashboard, nessuno se ne accorge finché qualcuno fa la domanda sbagliata. Nessun champion per area: tutto passa dall’IT, l’IT non ha tempo, il business torna a Excel. Nessun DataOps: i model SQL non sono versionati, le pipeline ETL girano senza alerting, quando una sorgente cambia schema il sabato sera lunedì nessuno se ne accorge fino alle 11. Troppe dashboard, nessuna usata: ne produci 60 nel primo anno, ne vengono aperte 8. Tool sbagliato per la cultura: compri Tableau Creator a 25 utenti in una PMI che non sa cos’è una calculated field, quando potevi partire da Metabase e valutare di più dopo 12 mesi.

Team minimo e KPI di adoption

Per una PMI da 50-150 dipendenti il team minimo è un analytics engineer (anche frazionato: DWH, dbt, semantic layer, ELT) e uno-due champion per area (vendite, marketing, operations, finance) con 20% di tempo dedicato. Un analytics engineer freelance senior nel 2022 costa 400-700 euro al giorno; in regime di routine una PMI ne usa 4-6 giornate al mese.

Per misurare il programma applica la BI alla BI stessa. Monitora ogni mese: active users (target 70%+ su totale licenze), datasets utilizzati (se ne pubblichi 30 e ne usi 8, archivia gli altri), time-to-insight (sotto 48 ore per analisi standard), certified ratio, self-service rate (almeno 50% nuove analisi dai champion, non dall’hub).

Roadmap di rollout in 90 giorni

Giorni 1-30 — Foundation. Stand-up del data warehouse (Snowflake o BigQuery), connessione delle prime due-tre sorgenti critiche (gestionale + CRM + e-commerce), prime trasformazioni dbt sui dati base (fatti vendite, clienti, prodotti), setup del BI tool con i primi cinque utenti pilota. Output: una dashboard fatturato mensile per area, certificata, condivisa al CEO e ai direttori.

Giorni 31-60 — Extension. Aggiunta sorgenti marketing (Google Ads, Meta, email), definizione delle prime metriche customer (LTV, churn, CAC), formazione dei champion, definizione del semantic layer minimo (10-15 metriche core), introduzione della row-level security. Output: tre dashboard certificate (vendite, marketing, finance) usate settimanalmente.

Giorni 61-90 — Adoption. Apertura del tool ai restanti utenti, review delle dashboard create dai champion, archiviazione di quelle non usate, definizione del processo di approvazione di nuove metriche, prima misurazione degli indicatori di adoption. Output: programma a regime, almeno 70% utenti attivi, processo nuove metriche formalizzato.

Transizione 4.0: credito d’imposta su software BI

Esiste nel 2022 il credito d’imposta Transizione 4.0, che copre anche software di BI se rispondono ai requisiti di interconnessione con i gestionali. Il credito 2022 sui beni immateriali 4.0 è pari al 20% del costo, con tetto di 1 milione di euro. Il software deve essere “4.0 compliant” secondo l’allegato B: interconnesso con i sistemi aziendali, documentato (perizia asseverata sopra 300.000 euro, autocertificazione sotto). Power BI integrato con un ERP “4.0”, Tableau collegato a un MES, dashboard sui dati di produzione: scenari ammissibili. Coinvolgi un commercialista specializzato prima di firmare i contratti.

Vuoi capire quale piattaforma self-service BI ha senso per la tua PMI?

Brentasoft analizza il tuo stack dati attuale, le sorgenti, i KPI critici e ti propone l’architettura più adatta — senza vendere licenze, solo consulenza indipendente.

Richiedi un preventivo gratuito

Domande frequenti

Self-service BI significa che chiunque può fare report senza chiedere all’IT?

Significa che utenti formati possono esplorare dati certificati e costruire dashboard senza ticket all’IT, ma dentro un perimetro tecnico (semantic layer, row-level security) e di processo (datasets certified, approval per nuove metriche). Senza questo perimetro produce dashboard contraddittorie, non self-service vero.

Conviene partire da Power BI o da Metabase per una PMI italiana?

Se sei già su Microsoft 365 e i tuoi controller usano Excel intensivamente, Power BI Pro o PPU sono la transizione più naturale. Se hai un sistemista interno, dati in database SQL e vuoi minimizzare i costi di licenza, Metabase self-host è spesso il miglior compromesso. Tableau ha senso quando la visualizzazione è centrale o il team ha skill consolidate.

Mi serve davvero un data warehouse o posso fare BI sul gestionale?

Per pochi utenti e dati sotto i 5-10 GB puoi collegare il BI direttamente al gestionale, ma è scelta tattica. I problemi arrivano con la concorrenza carico operativo/analitico, la storicizzazione (il gestionale spesso sovrascrive, il DWH conserva la storia) e l’integrazione di più sorgenti. Sopra 20 utenti e tre sorgenti, il DWH è imprescindibile.

Quanto costa davvero un programma BI completo su tre anni?

Per 25 utenti, includendo licenze BI, DWH a consumo, ETL, consulenza analytics engineer frazionata e training, la forchetta realistica è 35-80.000 euro nei tre anni, ampiamente dentro il perimetro Transizione 4.0 con credito d’imposta al 20% sulla quota software 4.0 compliant.

Cos’è dbt e perché tutti ne parlano?

dbt (data build tool) è uno strumento open source per scrivere trasformazioni dati in SQL versionato su Git, con test automatici e documentazione generata. Gestisce la logica di trasformazione come codice. È diventato lo standard del modern data stack tra 2020 e 2022, base per un semantic layer serio sopra al DWH.

Looker e Google Data Studio sono la stessa cosa?

No. Looker (acquisito da Google nel 2019, parte di Google Cloud) è una piattaforma BI enterprise con LookML e semantic layer rigoroso, pricing da decine di migliaia di euro. Google Data Studio è il tool gratuito di reportistica di Google per dashboard rapide su Google Ads, Analytics, Sheets. Due prodotti distinti con target diversi.

Come misuro se il progetto BI sta funzionando?

Quattro indicatori principali: percentuale di utenti attivi mensili sul totale licenze (target 70%+), numero di dashboard certificate effettivamente usate, time-to-insight dalle richieste business (target sotto 48 ore per analisi standard), percentuale di nuove analisi prodotte dai champion vs dall’hub centrale (target almeno 50% dal mese 6).

Vuoi una soluzione su misura per la tua azienda?

Brentasoft sviluppa gestionali, CRM e software personalizzati per PMI italiane. Parliamo del tuo progetto.

Richiedi un preventivo Scopri ERP Brenta