Meglio Cognex, Keyence o stack open source?

Commerciale se servono 3-6 mesi al go-live e budget > 50.000 €/postazione. Open source (OpenCV + YOLOv5 + Jetson) se IT capace, molte linee, focus su TCO a 3 anni e nessun vendor lock-in.

Devo fare inferenza on-premise o nel cloud?

Sotto i 100 ms di latenza richiesta: edge on-premise obbligatorio. Latenza tollerante e statistiche aggregate: cloud (AWS Panorama, Azure Computer Vision API) accettabile. Pattern più frequente: training cloud, inferenza edge.

Come si integra la computer vision con il MES o l'ERP?

Tre livelli: PLC riceve OK/KO via OPC-UA (< 50 ms); MES aggrega scarti via REST o MQTT; ERP registra valorizzazione non conformità e tracciabilità lotti. Il MES è il livello dove la CV porta più valore.

Quanto tempo serve per andare dal pilota alla produzione?

Con roadmap disciplinata su un caso d'uso ben circoscritto: 90 giorni. I progetti che falliscono lo fanno per mancanza di caso d'uso quantificato, dataset costruito male, sottovalutazione dell'illuminazione.

Cosa succede al modello dopo qualche mese in produzione?

Model drift: cambia fornitore o lotto, sporco su illuminatori, deriva camera — accuracy crolla. Servono monitoraggio FP/FN rate, re-training trimestrale con dataset aggiornato e alert su confidenza media in calo.

Intelligenza Artificiale

Computer vision per il controllo qualità: guida 2021 per PMI manifatturiere

Gianluca Gentile 20 Agosto 2021 16 min lettura

TL;DR — Computer vision per il QC in PMI nel 2021

La computer vision (CV) industriale è oggi alla portata delle PMI: hardware GigE/USB3 sotto i 2.000 € e modelli pre-addestrati pronti via transfer learning.
I casi a ROI più rapido sono ispezione visiva difetti, lettura OCR/codici industriali e verifica DPI in sicurezza.
Stack consigliato: OpenCV 4.5 + TensorFlow 2.5 o PyTorch 1.9, YOLOv5/Mask R-CNN, edge su NVIDIA Jetson Xavier o cloud con AWS Panorama.
Servono 1.000–10.000 immagini annotate per classe difetto; con transfer learning si parte con 200–500 per pilota.
Investimento tipico PMI: 25.000–80.000 € a postazione di ispezione, ROI 12–18 mesi su volumi industriali.

Computer vision applicata alla manifattura: cosa significa nel 2021

La computer vision è la disciplina che insegna ai computer a “vedere”: riconoscere oggetti, leggere codici, misurare geometrie e classificare difetti partendo da immagini o flussi video. In ambito industriale non è una novità — sistemi come Cognex VisionPro, Keyence e MVTec HALCON equipaggiano linee di produzione da oltre vent’anni — ma fino al 2018 erano sistemi rule-based: ogni regola di ispezione andava programmata da un tecnico, con tolleranze e soglie tarate a mano.

Il salto del biennio 2020-2021 è arrivato con l’esplosione del deep learning applicato all’imaging industriale. Oggi una rete YOLOv5 addestrata con qualche migliaio di immagini riconosce graffi su lamiera, bolle in stampaggio plastica o etichette stampate male con accuracy superiori al 97%, in inferenza inferiore a 30 ms su una GPU edge da 500 €. Il contesto post-pandemia ha accelerato l’adozione: la crisi dei semiconduttori ha reso più strategico ogni scarto di linea, la carenza cronica di personale qualificato ha messo le PMI manifatturiere italiane davanti a un bivio — o si automatizza il controllo qualità o si rallenta la produzione.

Questa guida si rivolge a direttori di produzione e IT manager di PMI fra 20 e 250 dipendenti. Vediamo dove la CV conviene davvero nel 2021, quanto costa portarla in fabbrica e come evitare i tre o quattro errori che fanno fallire la maggior parte dei progetti pilota.

I 4 casi d’uso più maturi per le PMI manifatturiere

Linea di produzione moderna in fabbrica manifatturiera

Non tutti i problemi di controllo qualità sono adatti alla computer vision. I casi che nel 2021 mostrano il rapporto costo/benefici migliore in una PMI sono quattro.

1. Ispezione visiva difetti superficiali

È il caso classico e quello con il maggior numero di installazioni in produzione. Lamiere stampate, pezzi pressofusi, bottiglie soffiate, blister farmaceutici: una telecamera GigE da 5 megapixel posta sopra il nastro fotografa il pezzo, un modello di segmentazione (Mask R-CNN o U-Net) evidenzia i difetti, un attuatore espelle il pezzo non conforme. I tassi di falsi positivi tipici sono sotto il 2% con dataset ben costruiti.

2. Lettura codici industriali (OCR e barcode)

Lettura di datamatrix incisi a laser, codici stampati ink-jet che si sbavano, alfanumerici su superfici riflettenti. Qui le librerie commerciali come Cognex VisionPro sono spesso la scelta più rapida, ma un’integrazione custom con OpenCV + un OCR Tesseract o un modello custom su ResNet costa circa un terzo. Velocità tipica: 15-25 letture al secondo per postazione.

3. Monitoraggio sicurezza DPI

Una telecamera sopra l’ingresso di un’area pericolosa verifica che l’operatore indossi casco, occhiali, guanti, scarpe antinfortunistiche. YOLOv4 o YOLOv5 con un dataset di 3.000-5.000 immagini raggiungono mAP superiori a 0,90. Se manca un DPI, il sistema blocca l’accesso o invia notifica al capo reparto. Caso d’uso con ROI immediato sul piano assicurativo.

4. Pick-and-place robotico

Un braccio robotico (ABB, Fanuc, Kuka, Universal Robots) deve prendere pezzi sfusi da un cassone. La CV stima posa e orientamento del pezzo in tempo reale: telecamera 3D (Intel RealSense, Photoneo) + segmentazione + stima pose. Soluzione che fino al 2019 era esclusiva delle grandi aziende, oggi accessibile sotto i 40.000 € a cella robotica.

Lo stack tecnologico 2021: librerie e piattaforme

Nel 2021 la scelta dello stack è una decisione strategica che pesa per anni. Vediamo le opzioni.

Stack open source

OpenCV 4.5: la libreria di riferimento per pre-processing immagini, calibrazione telecamere e operazioni geometriche. Gratuita, scritta in C++ con bindings Python, ottime performance.
TensorFlow 2.5 con Keras: framework Google, ottimo per deploy industriale via TF Lite e TF Serving. Integrazione nativa con accelleratori Coral e Jetson.
PyTorch 1.9: preferito in ricerca e per training di modelli custom. TorchScript per il deploy in produzione.
YOLOv4 e YOLOv5: detector single-stage, gold standard 2021 per object detection in tempo reale. YOLOv5 di Ultralytics ha un workflow Python molto rapido.
Mask R-CNN: la scelta per segmentazione istanza quando serve il contorno preciso del difetto.

Stack commerciale

Cognex VisionPro e VisionPro Deep Learning (ex ViDi): tool grafici, integrazione PLC immediata, supporto Italia consolidato. Costo licenza per postazione 3.000-6.000 € + hardware.
Keyence: linea CV-X e XG-X, dispositivi “all-in-one” telecamera+controller. Setup rapidissimo ma vendor lock-in totale.
MVTec HALCON e MERLIC: piattaforma tedesca, libreria potente per applicazioni complesse, costo licenza elevato ma performance top.

La regola pratica del 2021: se il budget supera i 50.000 € per postazione e serve tempo-al-mercato in 3-6 mesi, partite commerciale. Se avete una funzione IT capace e volete riusare il modello su decine di linee, lo stack open source vince in TCO a 3 anni.

L’hardware: telecamere, illuminazione, GPU

Il software è il 30% del progetto, l’hardware il restante 70% — e gli errori qui sono i più costosi.

Telecamere industriali

Nel 2021 il mercato è dominato da due interfacce:

GigE Vision: cavi Ethernet Cat6, fino a 100m, bandwidth 1 Gbps, ottima per linee distribuite. Marchi: Basler ace, FLIR Blackfly, IDS uEye, Hikrobot.
USB3 Vision: economica e rapida, max 5m senza extender, fino a 5 Gbps. Ottima per pilota e installazioni compatte.

Range prezzi: telecamere monocromatiche 2 MP a partire da 400 €; modelli 12 MP color con ottica intercambiabile arrivano a 1.800 €. Le ottiche industriali (Computar, Tamron, Edmund Optics) costano altrettanto.

Illuminazione

L’errore più frequente di chi parte dal software: pensare che si possa ignorare l’illuminazione. Falso. Una buona illuminazione LED dedicata (back-light, dome, dark-field, low-angle) può rendere banale un problema che senza fa fallire qualsiasi rete neurale. Budget tipico: 500-2.500 € a postazione per illuminatori Effilux, CCS o Smart Vision Lights.

GPU edge

Per inferenza on-device le opzioni 2021 sono:

NVIDIA Jetson Xavier NX: 21 TOPS, 8GB RAM, supporto TensorRT, prezzo ~ 400 €. La piattaforma di riferimento.
NVIDIA Jetson AGX Xavier: 32 TOPS, per applicazioni multi-camera, ~ 700 €.
Hailo-8: 26 TOPS in formato M.2, lanciato 2020, alternativa interessante per integrazioni embedded.
Google Coral Edge TPU: economico (~75 €) ma supporta solo TF Lite quantizzato.

On-premise vs Cloud: dove far girare l’inferenza

La domanda strategica nel 2021 è: il modello deve girare in fabbrica (edge) o nel cloud?

Quando scegliere edge on-premise

Latenza richiesta < 100 ms (espulsione pezzo, allarme sicurezza)
Banda Internet di stabilimento insufficiente o costosa
Dati sensibili (ricette produttive, geometrie brevettate)
Continuità operativa obbligatoria anche con rete giù

Stack tipico edge: NVIDIA Jetson Xavier con Ubuntu 20.04, modello esportato in TensorRT, comunicazione PLC via OPC-UA o Modbus TCP.

Quando scegliere cloud

Tre piattaforme dominano il 2021:

AWS Panorama: lanciata dicembre 2020, è la prima offerta cloud-managed di Amazon pensata espressamente per CV industriale. Combina dispositivo edge (Panorama Appliance) con management cloud per modelli e flotta.
Azure Computer Vision API e Custom Vision: ottimi per casi standard (OCR, classificazione) senza necessità di training profondo.
Google Cloud Vision AI e AutoML Vision Edge: forte sull’AutoML, deploy facile su Coral.

Pattern ibrido che funziona: training nel cloud (dove ci sono GPU a noleggio orario), inferenza all’edge. La sincronizzazione di nuovi modelli avviene in OTA.

Dataset di training: quante immagini servono davvero

La regola empirica 2021 per i progetti CV in PMI manifatturiera:

200-500 immagini per classe difetto: sufficienti per un proof-of-concept con transfer learning da modelli pre-addestrati su ImageNet o COCO.
1.000-3.000 per classe: produzione con accuracy > 90% per casi binari (OK/KO).
5.000-10.000+: per applicazioni multi-classe con difetti rari (frequenza < 1%) o per generalizzare su più lotti, materiali, illuminazioni.

Il transfer learning ha cambiato le regole: invece di addestrare una rete da zero (servirebbero 1M+ di immagini), si parte da pesi pre-addestrati e si fa fine-tuning sul dominio specifico. Si riducono i tempi di training da settimane a ore e i requisiti di dataset di un ordine di grandezza.

La data augmentation (rotazioni, flip, variazioni luce, rumore gaussiano, cropping) moltiplica artificialmente il dataset di 5-10x ed è oggi standard. Librerie come Albumentations o il modulo image di Keras la rendono banale.

Per l’annotazione del dataset due strumenti gratuiti sono diventati lo standard di fatto nel 2021: CVAT (Computer Vision Annotation Tool, Intel) per video e immagini, e Label Studio per multi-modal. Budget tipico per annotazione esterna: 0,15-0,40 € per immagine bounding-box, 1-3 € per segmentazione pixel-precise.

Integrazione CV con MES, ERP e PLC

Tecnico con tablet monitora dati di produzione in fabbrica

Un sistema di CV isolato vale la metà di un sistema integrato. Le informazioni che il modello produce — pezzo OK/KO, tipo di difetto, coordinate, confidenza — devono finire nel MES (Manufacturing Execution System) per chiudere il loop produttivo e nell’ERP per chiudere il loop economico.

L’architettura di integrazione tipica 2021 prevede tre livelli:

Livello PLC: il PLC (Siemens S7, Rockwell Allen-Bradley, Beckhoff) comanda l’espulsore di pezzi non conformi e riceve il segnale dal sistema CV via OPC-UA o ProfiNet. Latenza tipica < 50 ms.
Livello MES: il MES aggrega le statistiche di scarto per turno, lotto, prodotto. Calcola gli OEE (Overall Equipment Effectiveness) reali e produce alert su trend anomali. Tecnologie: REST API, MQTT, OPC-UA verso storico.
Livello ERP: gli scarti finiscono in valorizzazione di non conformità, gestione resi fornitore (se difetto su materia prima), tracciabilità lotti per richiamo. Approfondisci su tracciabilità lotti e seriali ERP e su gestione produzione con ERP.

Per le PMI che ancora gestiscono la qualità in Excel, l’introduzione della CV è anche l’occasione per portare ordine sul lato dati: vedi il nostro approfondimento sulla automazione del magazzino per un esempio di come l’integrazione hardware-software-ERP cambia il modo di lavorare.

Caso reale: PMI emiliana del food packaging — ROI in 14 mesi

Un caso che abbiamo seguito a fine 2020 e portato a regime nei primi mesi del 2021. PMI emiliana, 78 dipendenti, produzione di vaschette in PET termoformate per packaging alimentare. Tre linee di produzione, ognuna capace di 200 pezzi/min.

Il problema: difetti superficiali (bolle d’aria, micro-graffi, contaminazioni) prima ispezionati a campione dal reparto qualità (1 ispettore per linea, 3 turni). Tasso di scarto rilevato dal cliente finale: 0,8% — costo annuale di non qualità stimato in 340.000 € tra resi, mancata produzione, penali contrattuali.

Soluzione implementata:

3 telecamere Basler ace acA2440-75um (5 MP) per linea, illuminazione LED back-light Effilux
Modello segmentazione su backbone EfficientNet-B0, fine-tuned su 7.200 immagini annotate
Inferenza su NVIDIA Jetson Xavier NX a bordo linea, 22 ms per pezzo
Integrazione con il PLC Siemens S7-1500 via OPC-UA per espulsione automatica
Dashboard MES custom in Grafana con metriche per turno e lotto

Numeri finali:

Investimento totale: 187.000 € (hardware + software + integrazione + training)
Tasso di scarto cliente: da 0,8% a 0,12%
Risparmio annuo netto: 295.000 €
ROI: 14 mesi
Ispettori riallocati ad attività a maggior valore (audit fornitori, miglioramento continuo)

I 5 errori più comuni nei progetti CV in PMI

Braccio robotico industriale arancione su linea automatizzata

Ecco i fallimenti che vediamo ricorrere nei progetti di CV industriale che si bloccano al pilota.

Sottovalutare l’illuminazione. È la causa numero uno. Se l’illuminazione non è studiata, neanche la migliore rete neurale produce risultati stabili. Bisogna lavorare con un esperto di optical engineering già nella fase di feasibility.
Dataset costruito male. Immagini scattate solo nei primi due giorni di una sola linea, una sola illuminazione, una sola tonalità di materiale. Il modello funziona in laboratorio e fallisce in produzione. Regola: il dataset deve coprire tutte le condizioni reali del primo anno di esercizio.
Niente piano di drift. I modelli decadono. Cambia un fornitore di materia prima, si sporcano gli illuminatori, ruota la telecamera: l’accuracy crolla. Serve un piano di re-training periodico con dataset aggiornato.
Integrazione PLC come ultimo step. Va invertito. Si parte definendo come il PLC riceverà il segnale OK/KO (tipo di campo, latenza, protocollo) e si lavora a ritroso. Aggiungere l’integrazione alla fine raddoppia i tempi.
Confondere accuracy con utilità di business. Un modello al 95% è inutile se sul 5% di falsi negativi finiscono i difetti gravi e su quel 5% di falsi positivi blocchi metà linea. Va ottimizzato il cost-sensitive learning con costi reali di errore per classe.

Roadmap di adozione: 90 giorni dal problema alla produzione

Questa è la roadmap che applichiamo nei progetti di CV industriale per arrivare in produzione entro 90 giorni, evitando il rischio “pilota infinito”.

Giorni 1-15: assessment del caso d’uso

Selezionate una postazione di ispezione. Una sola. Misurate il problema in euro/anno: scarti, resi cliente, ore di QC manuale, costo di non conformità. Se il numero non arriva a 80-100k €/anno, scegliete un altro caso d’uso.

Giorni 16-30: feasibility ottica e raccolta dataset

Coinvolgete un esperto di illuminazione industriale (spesso il fornitore di illuminatori offre il servizio gratis). Scegliete telecamera e ottica con test fisici sul pezzo reale. In parallelo iniziate a raccogliere le prime 500-1000 immagini di pezzi OK e KO da almeno 3 lotti, 2 turni, 2 operatori diversi.

Giorni 31-60: training proof-of-concept

Annotazione con CVAT (interno o esternalizzato). Transfer learning su YOLOv5 o ResNet pre-addestrato. Cross-validation. Soglia: accuracy > 90% e recall sui difetti gravi > 95% su dataset di test indipendente.

Giorni 61-80: integrazione PLC e test on-line

Deploy del modello su NVIDIA Jetson Xavier, integrazione con il PLC via OPC-UA, simulazione ciclo completo a velocità di linea. Misura della latenza end-to-end: deve essere coerente con il tempo ciclo. Approfondisci il tema in automazione processi aziendali per PMI.

Giorni 81-90: pilota in produzione

Esercizio in shadow mode: il sistema decide ma non blocca la linea. Confronto giornaliero con l’ispezione manuale. Dopo 10-15 giorni di shadow positivo, attivazione del blocco automatico. Definite subito un piano di re-training trimestrale per evitare drift.

Per inquadrare la CV nel più ampio percorso di trasformazione digitale di un’azienda manifatturiera vedi la nostra guida alla trasformazione digitale per PMI. Per il quadro su IoT e infrastruttura abilitante: IoT per PMI: cosa fare nel 2021. Per il contesto generale su AI applicata: intelligenza artificiale per PMI e Industria 5.0 vs 4.0.

FAQ — Computer vision e controllo qualità in PMI

Quanto costa il primo sistema di computer vision per il QC in una PMI?

Per una singola postazione di ispezione su problemi superficiali standard, il budget tipico 2021 è tra 25.000 € (soluzione open source + Jetson + telecamera entry-level) e 80.000 € (soluzione commerciale chiavi in mano Cognex o Keyence). L’integrazione con MES/PLC e il training del modello rappresentano il 40-60% del totale.

Quante immagini servono per addestrare un modello in produzione?

Con transfer learning da modelli pre-addestrati, 200-500 immagini per classe sono sufficienti per un proof-of-concept. Per produzione stabile servono 1.000-3.000 per classe binaria OK/KO. Difetti rari o multi-classe richiedono 5.000-10.000+.

Meglio una soluzione commerciale (Cognex, Keyence) o open source?

Commerciale se serve tempo-al-mercato in 3-6 mesi, budget > 50.000 €/postazione, integrazione PLC standard. Open source (OpenCV + YOLOv5 + NVIDIA Jetson) se avete una funzione IT capace, dovete distribuire la stessa soluzione su molte linee, volete ottimizzare il TCO a 3 anni e non temete vendor lock-in.

Posso usare il cloud o devo per forza fare inferenza on-premise?

Se la latenza richiesta è < 100 ms (espulsione pezzo, sicurezza), edge on-premise è obbligatorio. Per casi a latenza tollerante (statistiche QC, dashboard) cloud (AWS Panorama, Azure Computer Vision API) può andare. Il pattern più diffuso è ibrido: training nel cloud, inferenza all’edge.

Come si integra la CV con il MES o l’ERP esistente?

Tre livelli: il PLC riceve il verdetto OK/KO dalla CV via OPC-UA (latenza < 50 ms); il MES aggrega le statistiche di scarto via REST o MQTT; l’ERP registra valorizzazioni di non conformità e tracciabilità lotti. Il MES è il livello dove tipicamente la CV porta più valore di business.

Quanto tempo serve per portare un progetto CV dal pilota alla produzione?

Con una roadmap disciplinata su un caso d’uso ben circoscritto, 90 giorni sono realistici. I progetti che falliscono lo fanno tipicamente per mancanza di un caso d’uso quantificato in euro/anno, dataset costruito male o sottovalutazione dell’illuminazione.

Cosa succede quando il modello “smette di funzionare” dopo qualche mese?

È il model drift: cambia un fornitore di materia prima, si sporcano gli illuminatori, ruota la telecamera, varia la tonalità del lotto. La accuracy crolla silenziosamente. Soluzione: monitoraggio continuo dei false positive/negative rate, re-training trimestrale con dataset aggiornato, alert automatici quando la confidenza media del modello scende sotto una soglia.

Vuoi portare la computer vision nella tua produzione?

Aiutiamo PMI manifatturiere italiane a integrare visione artificiale, automazione e gestionali ERP in progetti end-to-end con ROI misurabile.

Soluzioni di automazione industriale
Gestionali personalizzati
Richiedi preventivo

Vuoi una soluzione su misura per la tua azienda?

Brentasoft sviluppa gestionali, CRM e software personalizzati per PMI italiane. Parliamo del tuo progetto.

Richiedi un preventivo Scopri ERP Brenta