La determinazione non distruttiva delle proprietà dei pezzi dopo il trattamento termico è di grande interesse nel contesto del controllo qualità in produzione, ma anche per prevenire danni nei successivi processi di rettifica. I metodi micromagnetici offrono buone possibilità, ma devono prima essere calibrati con analisi di riferimento su campioni con stati noti.
di Rahel Jedamski, Jérémy Epp, Leibniz-Institute for Materials Engineering
Questo studio confronta l’accuratezza e l’affidabilità di diversi metodi di calibrazione per la valutazione non distruttiva della profondità di cementazione e della durezza superficiale dell’acciaio cementato. L’analisi di regressione lineare viene utilizzata e confrontata con nuovi metodi basati sulle reti neurali artificiali. Il confronto evidenzia un leggero vantaggio del metodo basato sulle reti neurali e un potenziale per un’ulteriore ottimizzazione di entrambi gli approcci. La qualità dei risultati può essere influenzata, tra l’altro, dal numero di passaggi di addestramento della rete neurale; tuttavia, un numero maggiore di passaggi non porta sempre a un miglioramento dell’accuratezza per condizioni non incluse nella calibrazione iniziale.
Stato dell’arte
Lo stato di trattamento termico di un pezzo in acciaio cementato, in particolare la durezza superficiale e la profondità di cementazione, che spesso correlano anche con la profondità di ossidazione superficiale, sono proprietà fondamentali per le prestazioni finali dei componenti ad alte prestazioni, che devono essere costantemente monitorate nella produzione industriale. Inoltre, queste proprietà superficiali influenzano la lavorabilità dei componenti durante la rettifica, nonché la capacità di rilevare eventuali danni tramite tecniche micromagnetiche. Pertanto, la conoscenza di queste proprietà permette di stabilire i parametri ottimali di rettifica in funzione dello stato iniziale del componente e consente un monitoraggio micromagnetico affidabile durante i processi di rettifica. Oltre ai metodi distruttivi tradizionali, che seppur precisi richiedono tempo, la condizione del trattamento termico può essere valutata in modo non distruttivo tramite metodi micromagnetici come l’analisi del rumore di Barkhausen o la tecnica 3MA.
L’utilizzo di metodi micromagnetici consente, nella maggior parte dei casi, di determinare la durezza tramite una calibrazione basata sulla regressione lineare. Per determinare la profondità di cementazione mediante l’analisi del rumore di Barkhausen, esistono diversi approcci aggiuntivi basati sulle proprietà differenti del nucleo tenero e dello strato superficiale indurito. Ad esempio, alcuni ricercatori hanno osservato picchi aggiuntivi e asimmetrie nel picco di Barkhausen generato dallo strato cementato, descrivibili con diversi parametri e correlabili con la profondità di cementazione. Alcuni autori hanno impiegato variazioni della tensione di magnetizzazione per determinare la pendenza massima del rumore di Barkhausen per due frequenze di magnetizzazione (e quindi diverse profondità di penetrazione) e hanno correlato il rapporto con la profondità di cementazione. La tecnica 3MA combina quattro metodi micromagnetici con diverse profondità di penetrazione; oltre al rumore di Barkhausen, include, tra gli altri, l’analisi armonica del campo magnetico tangenziale. In questo caso, la profondità di cementazione può essere correlata al limite di frequenza in cui il fattore di distorsione si avvicina a un asintoto. Sono state osservate ulteriori influenze della profondità di cementazione sulle caratteristiche in frequenza di vari segnali micromagnetici, ma non sono ancora state pienamente spiegate.
In altri casi sono state utilizzate reti neurali artificiali per determinare la durezza a partire dal ciclo di isteresi e dalla misura delle correnti parassite, rispettivamente, dall’analisi del rumore di Barkhausen e del campo magnetico tangenziale. Oltre alla durezza, sono state così determinate le tensioni residue e la profondità di cementazione utilizzando una combinazione di rumore di Barkhausen, campo magnetico tangenziale e misurazione dell’isteresi attraverso reti neurali artificiali. Hanno poi confrontato l’idoneità della regressione lineare, delle reti neurali artificiali e dei modelli fuzzy per la determinazione delle tensioni residue a partire dalle misurazioni del rumore di Barkhausen. Hanno identificato migliori indici di prestazione, come l’RMSE (errore quadratico medio) e il coefficiente di determinazione R², per le reti neurali rispetto alla regressione lineare, ma hanno anche evidenziato un vantaggio di quest’ultima. Infatti, questo metodo presenta un basso rischio di overfitting ed è quindi adatto per set di dati di calibrazione di piccole dimensioni e per l’estrapolazione. Per ottenere buoni risultati di regressione, è stata effettuata una preselezione delle caratteristiche significative, poiché un numero troppo elevato di input ha portato a un sovra-allenamento della rete. Esistono tuttavia casi in cui è stato utilizzato solo un numero ridotto di variabili misurate per la determinazione della durezza. Il criterio di selezione era il rapporto tra la deviazione standard e il valore medio. È possibile migliorare le prestazioni includendo ulteriori variabili misurate. L’influenza del volume del set di dati è analizzata spesso con grande preoccupazione. Quale risultato generale è possibile affermare che l’estensione del set di calibrazione porta, come prevedibile, ad una diminuzione dell’errore standard. Ad esempio, nel caso di 17 punti di misurazione su un campione con tre zone di durezza, l’errore standard con nove punti di dati iniziali per la calibrazione era inferiore al 5% della durezza massima. Studi recenti trattano poi la correlazione delle proprietà magnetiche con la durezza, le tensioni residue e altre proprietà. In generale, una diminuzione della durezza e un aumento delle tensioni residue di trazione portano a un aumento del livello di rumore di Barkhausen. Tuttavia, l’aumento del rumore di Barkhausen con le tensioni residue in alcuni casi non è lineare a causa di una scarsa magnetizzazione, mentre la permeabilità media derivata dal ciclo di isteresi mostra una correlazione lineare molto migliore. Altri studi descrivono un aumento lineare del rumore di Barkhausen e della permeabilità con l’aumento delle tensioni di trazione. Oltre ai valori massimi e medi del rumore di Barkhausen e della permeabilità, vengono determinate altre variabili misurate a partire dal segnale grezzo, a seconda del dispositivo di misurazione. La coercitività si sviluppa in modo inversamente proporzionale al livello del rumore di Barkhausen o della permeabilità e mostra una buona correlazione con la durezza e le tensioni residue. La larghezza del picco diminuisce con l’aumento delle tensioni di trazione, mentre la rimanenza diminuisce con l’aumento della durezza.
Obiettivi
L’obiettivo del presente lavoro è la valutazione non distruttiva dello stato di trattamento termico di pezzi in acciaio cementato mediante misurazioni micromagnetiche 3MA con variazione delle frequenze di magnetizzazione e analisi. Invece degli approcci complessi menzionati finora per la valutazione delle variazioni di frequenza, sono state qui sviluppate diverse strategie di calibrazione. Per sfruttare le possibilità delle analisi dipendenti dalla frequenza nella determinazione delle proprietà a gradiente, sono state incluse molte variabili misurate, diversamente dai lavori precedenti. Dopo la calibrazione con campioni dalle proprietà note, queste possono essere semplicemente applicate alle misurazioni successive. A tal fine, è stato effettuato un confronto tra l’analisi di regressione classica e la calibrazione con reti neurali artificiali. È stato preparato un set di campioni con variazioni a due livelli di tre variabili e due campioni per stato per la calibrazione e l’analisi. È stata prestata particolare attenzione alle sfide derivanti dai piccoli set di dati di calibrazione rispetto al numero di variabili misurate e alle influenze sullo stato del trattamento termico. Gli errori standard dei dati di calibrazione e dei dati di test sconosciuti sono stati confrontati, valutando le possibili influenze di diversi parametri sulla qualità del risultato.
Misurazioni Micromagnetiche e Dati
La tecnologia 3MA-II (Micromagnetic Multiparametric Microstructure and Stress-Analysis) sviluppata dal Fraunhofer Institute per test non distruttivi combina quattro metodi micromagnetici: il rumore di Barkhausen (BN), l’analisi armonica della forza del campo magnetico tangenziale (HA), la permeabilità incrementale (IP) e l’analisi delle correnti parassite multifrequenza (EC). Questi metodi forniscono 41 variabili misurate con sensibilità diverse alla microstruttura e allo stato di tensione. A seconda della frequenza, questi metodi analizzano a profondità diverse. La combinazione dei parametri di misura consente di separare diversi tipi di influenze, come le tensioni residue e la durezza, e di compensare eventuali disturbi. Un modulo software aggiuntivo, chiamato “sweep module”, permette di variare automaticamente e rapidamente i parametri di misura come la frequenza e l’ampiezza di magnetizzazione.
Il rumore di Barkhausen è generato dallo spostamento graduale delle pareti di Bloch, che separano i domini magnetici, durante la magnetizzazione dei materiali ferromagnetici. Se non sono possibili ulteriori spostamenti delle pareti di Bloch, i domini si allineano nella direzione del campo attraverso processi di rotazione man mano che la magnetizzazione aumenta. In questa fase, la curva di isteresi magnetica, B(H), diventa più piatta fino a diventare orizzontale nello stato di saturazione. La figura 1 mostra una curva di isteresi schematica. Dopo aver amplificato, filtrato e rettificato il segnale BN registrato, il suo profilo viene visualizzato in relazione alla forza del campo magnetico H. La forma della curva di isteresi e del profilo, e quindi i parametri caratteristici, sono influenzati dalla microstruttura, dalle proprietà meccaniche e dallo stato di tensione residua. I materiali meccanicamente duri sono anche magneticamente duri, con alta coercitività e bassa rimanenza, e mostrano un’ampiezza massima di Barkhausen bassa poiché gli spostamenti delle pareti di Bloch interagiscono in modo simile ai movimenti delle dislocazioni.
A seconda della frequenza, è possibile investigare diverse profondità. La funzione di smorzamento esponenziale permette di calcolare la profondità di penetrazione a cui l’ampiezza del campo magnetico è ancora 1/e dell’intensità alla superficie. La permeabilità relativa (µr) e la conduttività elettrica (σ) sono parametri dipendenti dal materiale e dal trattamento termico. L’analisi armonica, ad esempio, ha la maggiore profondità di analisi possibile, con una profondità di indagine fino a qualche millimetro. Il rumore di Barkhausen, invece, analizza generalmente a profondità minori, variando tra circa 10 µm e qualche centinaio di µm. Per gli strati superficiali induriti, la profondità di analisi si aggira intorno ai 50 µm.
L’analisi armonica del campo magnetico tangenziale magnetizza il volume del campione utilizzando un campo alternato sinusoidale, simile all’analisi del rumore di Barkhausen. L’evoluzione della forza del campo tangenziale durante il ciclo di isteresi è registrata da una sonda di Hall e analizzata mediante Fourier. In questo modo, si possono determinare le armoniche superiori dispari e le variabili misurate includono le ampiezze e le fasi di tali armoniche, il fattore di distorsione (K) e la forza coercitiva derivata dall’analisi armonica (che aumenta con la durezza). Il fattore di distorsione è più alto nei materiali magneticamente morbidi e viceversa.
La permeabilità incrementale (IP) è misurata sovrapponendo un ulteriore ciclo di isteresi ad alta frequenza al ciclo di isteresi principale. Il segnale rilevato corrisponde alla permeabilità incrementale, che viene determinata dalle variazioni della forza del campo alternato in diversi punti del ciclo di isteresi. La forma della curva della permeabilità incrementale è simile a quella del rumore di Barkhausen, ma si basa su processi reversibili.
Nell’analisi delle correnti parassite (EC), un campo magnetico alternato ad alta frequenza genera correnti elettriche che producono un campo secondario opposto a quello primario. Una bobina di ricezione misura il campo magnetico come tensione indotta. Queste correnti e la tensione indotta sono influenzate sia dalla conduttività sia dalla permeabilità del campione. La tecnologia 3MA-II consente l’uso simultaneo di quattro frequenze di correnti parassite, con variabili misurate come parti reali e immaginarie, ampiezza e angolo di fase della tensione indotta.
Analisi di Regressione
Per determinare quantitativamente una proprietà obiettivo (ad esempio, la durezza), è necessario trovare una funzione di calibrazione che descriva la relazione tra la proprietà e le variabili misurate. La determinazione teorica di questa relazione utilizzando modelli fisici è possibile solo per materiali semplici, quindi, la tecnologia 3MA viene solitamente calibrata sulla base di dati empirici. Per fare ciò, i valori obiettivo vengono determinati con un metodo di riferimento (ad esempio, un test di durezza) e memorizzati in un database insieme alle misurazioni micromagnetiche per analizzare le correlazioni utilizzando l’analisi di regressione o il riconoscimento di pattern. I termini della regressione includono i parametri di misura della 3MA così come sono, i loro quadrati e le loro radici quadrate. I coefficienti vengono determinati con il metodo dei minimi quadrati.
Un indicatore della bontà di una regressione è il coefficiente di determinazione (R²) e l’errore quadratico medio (RMSE). Per migliorare la precisione della regressione e ridurre l’effetto di derive sistematiche nei valori misurati, è possibile regolare l’algoritmo di regressione. Questo è particolarmente importante per errori stocastici a bassa frequenza, come quelli dovuti all’usura o all’invecchiamento del sensore, che non possono essere ridotti aumentando il numero di misurazioni.
La gamma di valori (W) rappresenta il valore minimo e massimo di un’espressione parziale all’interno del set di dati di calibrazione. La modulazione (M) e l’effetto di errore al 1% (F1) sono calcolati per valutare quanto l’errore influenza i risultati della regressione. Se il valore misurato cambia dell’1% del valore massimo, il risultato della regressione cambia dell’ammontare di F1. Minore è l’effetto di errore, maggiore è la riproducibilità delle variabili misurate. Il software di calibrazione consente di scegliere il valore massimo tollerato di F1, riducendo le espressioni possibili a quelle che soddisfano tale condizione. Tuttavia, una limitazione troppo forte può ridurre il coefficiente di determinazione (R²) e aumentare l’errore standard (RMSE), poiché i termini rimanenti avranno un effetto ridotto sia sull’errore che sul risultato complessivo.
Reti Neurali Artificiali
Le reti neurali artificiali (ANN) sono costituite da vari elementi di elaborazione interconnessi, chiamati neuroni, organizzati in livelli: uno di input, uno o più nascosti e uno di output. I neuroni del livello di input distribuiscono i componenti del vettore di input ai neuroni del livello successivo. I livelli nascosti elaborano queste informazioni e trasmettono il risultato al livello di output.
Ogni neurone raccoglie i dati (input del neurone), li elabora, e invia il risultato (output del neurone). Gli effetti degli input su un neurone sono controllati dai pesi dei collegamenti, che vengono modificati durante l’addestramento per ottimizzare la relazione tra input e output e memorizzare le informazioni nella rete. Gli input ponderati vengono sommati e la funzione di trasferimento determina l’output del neurone. Esistono diverse funzioni di trasferimento, sia lineari che non lineari, che possono essere scelte nella costruzione della rete.
L’addestramento di una rete neurale può avvenire con tre strategie generali: apprendimento supervisionato, non supervisionato e di rinforzo. Nell’apprendimento supervisionato, il set di addestramento è costituito da input e output correlati. Nell’apprendimento non supervisionato, vengono forniti solo gli input, e la rete apprende autonomamente. Nell’apprendimento di rinforzo, il trainer indica solo se l’output della rete è corretto o meno. Per valutare la qualità della rete addestrata, il set di dati viene diviso in un set di addestramento e uno di test prima dell’addestramento.
Un algoritmo comunemente usato per reti con livelli di input, output e nascosti è l’algoritmo di retropropagazione. Ogni ciclo di addestramento è composto da una fase di avanzamento e una di retroazione. Nella fase di avanzamento, l’input attraversa la rete fino al livello di output, dove i risultati stimati vengono confrontati con quelli corretti. Nella fase di retroazione, le differenze vengono trasmesse a ritroso dai livelli di output ai livelli nascosti, e i pesi vengono aggiornati per ridurre l’errore nei cicli successivi.
Ecco una traduzione semplificata del paragrafo “2. Materials and Methods” mantenendo i riferimenti alle tabelle e semplificando il contenuto:
Materiali e Metodi
Il set di campioni utilizzato in questo studio è composto da 54 dischi realizzati con un lotto di acciaio AISI 4820 (DIN 18CrNiMo7-6) di 68 mm di diametro e 20 mm di spessore. La composizione chimica del lotto è stata analizzata con uno spettrometro a emissione ottica ARL 3460 e riportata nella Tabella 1.
I campioni sono stati cementati a gas e raffreddati in olio, con 27 varianti di trattamento termico indicate nella Tabella 2. Il trattamento è stato eseguito in un forno a camera. I dettagli del processo di cementazione sono illustrati nella Figura 3 e nella Tabella 3. Dopo il raffreddamento in olio, i campioni sono stati temprati per due ore alle temperature riportate nella Tabella 2.
La durezza superficiale e la profondità di cementazione (CHD) sono state determinate su piccoli campioni trattati nello stesso lotto dei campioni principali. La durezza superficiale è stata misurata con il metodo Vickers (carico di prova di 9,807 N, HV1). Per determinare la profondità di cementazione, sono stati registrati i profili di profondità del carbonio utilizzando la spettrometria a scintilla. La profondità di cementazione è definita come la profondità a cui il contenuto di carbonio è dello 0,3%.
Risultati e Discussione
Come risultato delle variazioni del trattamento termico descritte nella Tabella 2, sono stati ottenuti campioni con profondità di cementazione di circa 0,55 mm, 0,9 mm e 1,9 mm e con durezza superficiale compresa tra 640 HV1 e 760 HV1. Tutti i dati misurati sono presentati nella Tabella A1.
Le Figure 4–6 mostrano i profili di carbonio (a), i profili di microdurezza (b) e le sezioni trasversali (c) di campioni con profondità di cementazione target di 0,5 mm, 1 mm e 2 mm.
Il confronto tra la Profondità di Cementazione Indicata (CHD 550), la profondità di cementazione misurata (contenuto di carbonio dello 0,3%) e la transizione tra lo strato cementato e il materiale sottostante nella sezione trasversale mostra che la profondità di cementazione può essere utilizzata come un valore affidabile e strettamente correlato per valutare la CHD.
Le misurazioni micromagnetiche sono state eseguite con un dispositivo 3MA-II utilizzando un sensore standard con pattini polari convessi e un’unità di trasduttori montati su molle. I parametri di misurazione sono riportati nella Tabella 4.
La frequenza di magnetizzazione, la frequenza di alta frequenza e quella delle correnti parassite della permeabilità incrementale sono state variate con il modulo sweep per registrare un totale di 425 variabili di misura a diverse profondità di analisi. Tutti i campioni sono stati misurati dieci volte in un punto della circonferenza, con la magnetizzazione diretta in senso tangenziale.
Dopo un primo controllo del set di dati e la rimozione di campioni con valori anomali evidenti, è stata effettuata la calibrazione utilizzando il modulo di calibrazione del software 3MA e anche attraverso reti neurali artificiali. Per la calibrazione con l’analisi di regressione lineare, i dati ottenuti con una frequenza di magnetizzazione di 20 Hz sono stati esclusi a causa dell’instabilità della magnetizzazione, che ha impedito la determinazione coerente di alcuni parametri. Per mantenere la coerenza, questa frequenza è stata eliminata da tutti i set di dati.
L’analisi di regressione lineare è stata effettuata utilizzando i valori di durezza e profondità di cementazione come variabili target, impostando un massimo di 10 termini polinomiali per la calibrazione. È stata poi variata la tolleranza massima dell’effetto di errore per identificare eventuali effetti sul risultato, riducendola gradualmente per trovare un valore ottimale che riducesse l’errore senza compromettere la qualità della regressione.
Nell’analisi delle reti neurali artificiali, sono stati utilizzati 425 neuroni di input, lo stesso numero di neuroni nascosti, e neuroni di output con profondità di cementazione e durezza come output finale. La rete è stata costruita e addestrata con il metodo della retropropagazione per 30 e 60 ripetizioni. I risultati sono stati valutati nello stesso modo dell’analisi di regressione.
Per esplorare i vantaggi dell’uso delle variazioni di frequenza, sono state eseguite calibrazioni aggiuntive utilizzando solo le variabili misurate con la configurazione standard. L’analisi di regressione è stata effettuata senza limitazioni dell’effetto di errore massimo e con un addestramento della rete di 30 ripetizioni.
Calibrazione attraverso l’analisi di regressione
In seguito all’analisi di regressione lineare della durezza senza limitazione dell’effetto di errore massimo, l’effetto di errore F1 è risultato pari a 9,274 HV1. Il coefficiente di determinazione di questa regressione è R² = 0,8709 e l’errore standard RMSE = 12,919. La Tabella 5 mostra come variano il coefficiente di determinazione e l’errore standard in funzione della limitazione dell’effetto di errore. È stato scelto un limite di F1 pari a 3 HV1 come valore ottimale, poiché una limitazione più restrittiva avrebbe comportato una riduzione eccessiva del coefficiente di determinazione e un aumento dell’errore standard.
La durezza determinata micromagneticamente è stata tracciata in funzione della durezza misurata nel set di calibrazione (Figura 7). Non si osservano differenze pronunciate a causa della limitazione dell’effetto di errore. I punti rappresentano il valore medio delle 10 misurazioni micromagnetiche per campione e la relativa deviazione standard. Questa media spiega la differenza tra gli errori standard riportati in Tabella 5 e quelli visualizzati in Figura 7.
Figura 9: Correlazione tra la durezza e l’ampiezza al punto di rimanenza della permeabilità incrementale misurata con una frequenza di base di 120 Hz e una frequenza dell’anello di corrente di 100 kHz (a) e con una frequenza di base di 150 Hz e una frequenza dell’anello di corrente di 250 kHz (b).
La Figura 8 mostra la durezza misurata e quella determinata per campioni sconosciuti, non inclusi nella calibrazione (test di autorecognizione). L’errore standard è circa il 50% più alto rispetto a quello del set di calibrazione mostrato in Figura 7, raggiungendo valori pari al 15% dell’intervallo dei valori target. L’influenza della limitazione dell’effetto di errore sul risultato è molto bassa. Per un utilizzo futuro della funzione di calibrazione, sarebbe preferibile utilizzare la funzione con valori F1 ridotti per minimizzare eventuali effetti dovuti all’invecchiamento del sensore o a variazioni del sensore stesso.
I termini della regressione sono riassunti nella Tabella 6. Nessun parametro misurato dell’analisi delle correnti parassite fa parte della funzione di calibrazione, ma sono inclusi valori dell’analisi armonica (A3–A7, P3–P7, Vmag, Hco), del rumore di Barkhausen (MMAX, HCM, Mr) e della permeabilità incrementale (DH25µ, µr) con frequenze diverse. Poiché i valori della regressione non sono normalizzati, i coefficienti di regressione non permettono di trarre conclusioni sull’importanza dei singoli termini. È evidente che alcune variabili misurate appaiono sia come termini positivi che negativi, ad esempio MMAX è presente come termine negativo, come previsto, ma MMAX² appare successivamente come termine positivo.
Tracciando la durezza in funzione delle varie variabili misurate, si osserva la miglior correlazione con la rimanenza della misurazione della permeabilità incrementale (Figura 9). Tuttavia, non si osserva una relazione evidente tra la durezza e le variabili misurate dell’analisi armonica. La diversa idoneità dei metodi di misura per determinare la durezza può essere spiegata dalle diverse profondità di penetrazione dipendenti dalla frequenza. Un riepilogo delle correlazioni tra le diverse variabili misurate con durezza e profondità di cementazione è riportato nella Tabella A2. Il confronto con le Tabelle 6 e 9 mostra che non tutti i termini della regressione risultano visibilmente correlati alla durezza o alla profondità di cementazione. Questo suggerisce che la calibrazione sarebbe possibile anche con un numero inferiore di termini. Tuttavia, a causa della variazione del contenuto di carbonio superficiale, della profondità di cementazione e della temperatura di tempra, i segnali sono influenzati da molteplici fattori.
Figura 11: Correlazione tra la profondità di cementazione determinata micromagneticamente e quella misurata del set di dati di test senza limitazione dell’effetto di errore massimo (a) e con limitazione a 0,06 mm (b).
Calibrazione attraverso reti neurali artificiali
L’output della rete neurale artificiale (ANN) è stato tracciato in funzione della durezza misurata dopo 30 (Figura 12a) e 60 (Figura 12b) iterazioni del ciclo di addestramento. L’errore standard è molto inferiore rispetto alla calibrazione tramite analisi di regressione e diminuisce significativamente raddoppiando il numero di cicli di addestramento. L’errore quadratico medio (RMSE) è di 7,1 HV1 dopo 30 cicli di addestramento, un valore comparabile alla deviazione standard delle misurazioni di durezza Vickers, e scende a 3,7 HV1 dopo 60 cicli.
Per i dati di test sconosciuti (test di autorecognizione), l’errore standard tra la durezza misurata e l’output della rete è molto più alto rispetto al set di addestramento (Figura 13).
Questo errore è leggermente inferiore rispetto a quello ottenuto con l’analisi di regressione, ma la differenza tra i dati di addestramento e quelli di test è significativamente maggiore. Il raddoppio dei cicli di addestramento non porta a un miglioramento evidente dell’accuratezza, anzi, si nota un leggero aumento dell’errore standard, suggerendo il rischio di overfitting. Se la rete si adatta troppo ai dati di addestramento, ciò avviene a scapito della qualità delle previsioni per i dati sconosciuti. Per ottimizzare i risultati, il numero di cicli di addestramento deve quindi essere aumentato gradualmente. Mentre l’errore standard del set di addestramento continua a diminuire o tende a un asintoto, l’errore standard del set di test aumenta se la rete sovra-addestra i dati di addestramento. Anche la dimensione della rete influisce: più grande è la rete, maggiore è la capacità di adattarsi a soluzioni complesse, ma aumenta anche il rischio di overfitting.
Dopo aver raddoppiato i cicli di addestramento per il calcolo della durezza senza ottenere miglioramenti, la Figura 14 mostra solo l’output della rete per la profondità di cementazione dopo 30 cicli di addestramento. Nonostante alcuni valori anomali a una profondità di cementazione di 0,9 mm, questo è l’errore standard più basso ottenuto. Allo stesso tempo, l’errore standard aumenta di oltre tre volte tra il set di addestramento e quello di test. Le possibili ragioni e le potenziali migliorie sono le stesse indicate per la durezza. Inoltre, un ampliamento del set di campioni con ulteriori profondità di cementazione tra 1 mm e 2 mm o superiori a 2 mm potrebbe essere utile per estendere l’intervallo dei dati di addestramento.
Figura 14: Correlazione tra la profondità di cementazione determinata micromagneticamente e quella misurata dopo 30 ripetizioni della lezione di addestramento per il set di addestramento (a) e il set di test (b).
Figura 15: Correlazione tra la durezza determinata micromagneticamente (regressione lineare) e quella misurata del set di dati di calibrazione e test con configurazione standard (a) e con uso delle variazioni di frequenza (b).
Calibrazione con configurazione standard
Per confronto tra i risultati della calibrazione ottenuti utilizzando la configurazione standard (41 variabili misurate) e quelli ottenuti utilizzando variazioni dei parametri di misurazione (425 variabili misurate), la strategia di validazione è stata modificata. Per ridurre lo sforzo di validazione, il test di autorecognizione è stato effettuato su 14 campioni (uno per ciascuno degli stati evidenziati in grassetto nella Tabella A1). La differenza tra gli errori standard nelle Figure 15b, 7a e 8a illustra il problema dei piccoli set di dati di test. Alcuni campioni che hanno causato valori anomali in precedenza non fanno parte del set di test ridotto. Pertanto, è importante confrontare solo errori standard basati sullo stesso set di test (Figura 15; Tabella 11).
Tabella 11: Errore standard della durezza e della profondità di cementazione per la calibrazione con regressione lineare e reti neurali artificiali (ANN) utilizzando la configurazione standard e le variazioni di frequenza.
Tabella 12: Panoramica dell’errore standard per i diversi tipi di calibrazione.
Utilizzando le variazioni di frequenza, l’errore standard per la durezza determinata tramite regressione lineare diminuisce sia per il set di calibrazione che per il set di test (Figura 15).
La Tabella 11 riassume l’errore standard della durezza e della profondità di cementazione per la calibrazione utilizzando la configurazione standard e le variazioni di frequenza sia con regressione lineare che con ANN. In generale, la variazione dei parametri di misurazione (sweep) porta a una riduzione significativa dell’errore standard. Questa riduzione è particolarmente pronunciata per la determinazione della profondità di cementazione utilizzando le ANN. Per la determinazione della durezza con le ANN, invece, l’errore standard del set di calibrazione diminuisce, ma quello del set di test aumenta, evidenziando il problema del sovra-addestramento.
La Tabella 12 fornisce una panoramica dei diversi tipi di calibrazione (con uso di sweep) per la previsione della durezza e della profondità di cementazione. Sebbene ci siano grandi differenze negli errori standard del set di calibrazione, la qualità della calibrazione per il set di test è leggermente migliore per il metodo ANN rispetto alla regressione lineare. È evidente che, rispetto all’intervallo dei valori target, l’accuratezza della determinazione della durezza è generalmente inferiore rispetto a quella della profondità di cementazione, suggerendo che le variazioni delle proprietà dei materiali non considerate possano influenzare i risultati delle misurazioni.
Conclusioni
Questo studio ha mostrato e confrontato le possibilità di calibrazione mediante analisi di regressione lineare e reti neurali artificiali per la determinazione non distruttiva della durezza e della profondità di cementazione utilizzando misurazioni micromagnetiche. L’errore standard (RMSE) dei set di dati di calibrazione e di test è stato utilizzato come indicatore della qualità della calibrazione. Sebbene ci fossero differenze significative negli errori standard dei set di calibrazione, gli errori standard dei set di test sono stati generalmente più alti rispetto a quelli del set di calibrazione, ma comparabili per tutte le strategie di calibrazione.
I migliori risultati per l’analisi di campioni sconosciuti sono stati ottenuti con una rete neurale artificiale e un numero di cicli di addestramento non troppo elevato, il che ha limitato l’effetto del sovra-addestramento nel set di calibrazione. Ulteriori margini di miglioramento risiedono nell’ottimizzazione del numero di cicli di addestramento e delle variabili di input. Questo aspetto si applica anche alla calibrazione con regressione lineare, così come l’estensione del set di campioni. Aumentare o ridurre il numero di termini nella funzione di calibrazione con la regressione lineare può migliorare o peggiorare l’errore standard, ma influisce anche sull’effetto di errore massimo. Pertanto, l’ottimizzazione deve essere determinata in base al set di dati disponibile.
C’è un grande potenziale nell’accurata selezione delle variabili misurate. In questo studio sono state utilizzate 425 variabili, ma una limitazione di queste potrebbe ridurre lo sforzo di misurazione e calibrazione, oltre a minimizzare il rischio di sovra-addestramento. Per studi futuri, il set di campioni dovrebbe essere esteso a più di un lotto di acciaio per includere l’influenza del lotto nella calibrazione.
Riferimenti
Per ulteriori approfondimenti, degli stessi autori, “Determinazione micromagnetica non distruttiva della durezza e della profondità di tempra mediante analisi di regressione lineare e reti neurali artificiali” (https://dx.doi.org/10.3390/met11010018), all’interno della raccolta “Progressi nella progettazione di materiali metallici: sintesi, caratterizzazione, simulazione e applicazioni” curata da Fragassa C. et al.