Skip to content

idem-loganalysis-idp: problemi di OOM con log di grandi dimensioni #68

@marcobrizi

Description

@marcobrizi

In caso di file di audit di grandi dimensioni, il processing del log per l'analisi può portare il processo il OOM con conseguente kill del processo python.

Il problema è che vengono caricate tutte le righe in memoria prima di elaborarle.
Si propone una fix per processare le righe in streaming anziché accumularle tutte in memoria:

Rimuovendo:
lines = [] for line in finput(files, openhook=compr): lines.append(line.rstrip().split("|"))

e modificando il ciclo nel seguente modo:
for line in finput(files, openhook=compr): event = line.rstrip().split("|")

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions