
Che cos’è metanalisys
metanalisys è un software Python open source sviluppato per analizzare file della suite Microsoft Office, estrarre informazioni tecniche e metadati, calcolare hash del file e produrre report leggibili in formato testuale, CSV, JSON e HTML.
Il progetto nasce con un’impostazione prudente: non pretende di sostituire strumenti professionali consolidati, ma vuole offrire una base tecnica trasparente, verificabile e documentata per attività di studio, sperimentazione controllata e analisi preliminare.
Novità della versione v0.1.0-alpha.8
L’ottava versione alpha non introduce una grande nuova funzione: è una release di stabilizzazione. Consolida la dashboard navigabile della v0.1.0-alpha.7, rafforza la coerenza tra analisi file e analisi cartella, migliora la gestione dei casi limite e rende la sidebar più compatta.
Nuova dashboard GUI
La GUI ora distingue meglio tra azioni, risultati e dettagli. La schermata iniziale non mostra più un grande riquadro vuoto, ma invita l’utente a selezionare un file Office o una cartella. Dopo l’analisi, la dashboard centrale presenta i dati principali in forma tabellare e guidata.
Sidebar navigabile
La barra laterale introduce una navigazione più simile a un piccolo albero di analisi. Dopo una verifica di cartella, la sezione FILE ANALIZZATI mostra i documenti individuati. Cliccando su un file, sotto quel file compaiono le voci di dettaglio: Metadati, Hash, Risk score, Indicatori e Report file.
I nomi file lunghi vengono troncati alla fine, mantenendo sempre visibile l’icona 📄 e la parte iniziale del nome. Passando con il mouse sulla voce, la status bar mostra nome completo e percorso completo.
Analisi singolo file
Il comportamento tecnico dell’analisi del singolo documento resta coerente con le versioni precedenti: il core estrae i dati, calcola gli hash, valuta gli indicatori e produce il report. La differenza è nella presentazione: nella GUI i risultati vengono ora mostrati in una dashboard più leggibile, con accesso separato a metadati, hash, risk score, indicatori e report file.
Analisi riepilogativa di cartella
Dalla release v0.1.0-alpha.4 il progetto può ricevere in input una cartella. I file Office supportati vengono cercati nella cartella indicata, ordinati alfabeticamente in modo case-insensitive e analizzati uno per uno senza interrompere l’intero processo in caso di errore su un singolo file.
Con la v0.1.0-alpha.7 la dashboard cartella è diventata più navigabile; con la v0.1.0-alpha.8 questa navigazione viene consolidata. La vista mostra riepilogo, conteggi OK, LIMITED, ERROR, tabella centrale dei file analizzati e accesso diretto al dettaglio del singolo file tramite sidebar o doppio click sulla tabella.
Output prodotti
Quando viene analizzata una cartella, metanalisys può produrre quattro file: un riepilogo testuale TXT, una tabella CSV, un report strutturato JSON e un report HTML consultabile direttamente nel browser. Nella GUI il salvataggio non è automatico: l’utente sceglie quando salvare e dove salvare i file.
Indice tecnico di anomalia documentale
La release v0.1.0-alpha.3 ha reso più trasparente il parametro che nel report viene mostrato come rischio. Il punteggio è pensato come indicatore tecnico di attenzione: aiuta a individuare elementi da verificare, ma non dimostra automaticamente che il documento sia stato manomesso.
Pesi degli indicatori principali
Soglie del livello di anomalia
Formati supportati
La release v0.1.0-alpha.8 include il supporto ai principali formati Office moderni basati su Office Open XML e un supporto limitato per alcuni formati legacy.
Flusso di analisi
Il flusso operativo è stato progettato per essere leggibile e controllabile. Il software parte dal file selezionato o dalla cartella indicata, calcola gli hash, identifica il formato, prova a estrarre i metadati disponibili e produce i report finali.
Esempio di avvio
Dopo aver clonato il repository e installato le dipendenze, il software può essere eseguito da riga di comando su un singolo file.
Per analizzare una cartella da CLI, è sufficiente passare il percorso della directory. In questo caso vengono prodotti i report cumulativi TXT, CSV, JSON e HTML.
È disponibile anche una GUI basata su customtkinter. Dalla release v0.1.0-alpha.7 la GUI usa una dashboard navigabile con sidebar laterale, analisi file singolo, analisi cartella e dettaglio del singolo file selezionato; nella v0.1.0-alpha.8 questa interfaccia è stata stabilizzata e resa più compatta.
Validazione alpha con campioni sintetici
La release pubblica attuale include test automatici con pytest e una validazione alpha eseguibile basata su campioni sintetici generati a runtime. La verifica della release v0.1.0-alpha.8 è stata consolidata con 90 test automatici superati.
Sicurezza dei dati locali
La cartella manual_test_folder è pensata solo come area locale di appoggio per prove manuali. Non deve contenere file Office reali da caricare nel repository, file personali, evidenze digitali o dati sensibili. I report generati automaticamente con nome *_folder_summary.* sono ignorati da Git tramite .gitignore.
Prossimi sviluppi previsti
Il progetto potrà evolvere attraverso una matrice alpha più ampia, mantenendo separati i test sintetici dai file reali e documentando in modo progressivo i limiti osservati.
Limiti dichiarati
La natura alpha del progetto è esplicitata nella documentazione e nelle release notes. La copertura non è esaustiva, il supporto ai formati legacy resta limitato e il punteggio di anomalia richiede sempre interpretazione tecnica.
Come contribuire
Il progetto è pubblico su GitHub e accetta contributi coerenti con la sua natura alpha. Le issue pubbliche non devono contenere file Office reali, dati personali, evidenze digitali o materiali provenienti da casi concreti.
Eventuali segnalazioni dovrebbero includere informazioni riproducibili: sistema operativo, versione Python, comando usato, formato del file sintetico, comportamento osservato e comportamento atteso.
Documentazione del progetto
La documentazione pubblica include sezioni dedicate ai limiti forensi, alla catena di custodia, ai profili legali, ai test, alla validazione scientifica alpha, al modello di scoring e alle release notes.
