Home : Formatos de arquivo : Definição de moagem de documentos

Moagem de documentos

A moagem de documentos é o processo de análise documentos extrair dados significativos. O termo é frequentemente associado a hackers de computadores, pois hackers pode "moer" documentos para revelar dados confidenciais. No entanto, a moagem de documentos também é usada para fins não maliciosos. Exemplos incluem identificação desconhecida tipos de arquivos e visualizando arquivo metadados.

É possível realizar a retificação de documentos nos dois texto simples e binário arquivos.

Arquivos de texto

A moagem de arquivos de texto é um processo simples, pois eles armazenam dados como texto sem formatação. Você pode procurar por caracteres e cordas dentro de um documento de texto usando uma ferramenta como grep ou outro utilitário de pesquisa. Como o processamento de texto é uma operação relativamente rápida do computador, pode ser possível processar vários documentos grandes em menos de um segundo.

Os tipos de arquivos de texto comuns direcionados à moagem de documentos incluem arquivos de log (.LOG, .TXT) e arquivos de configuração (.CONF, .CNF) Se um hacker obtiver acesso a um servidor web, por exemplo, ele pode procurar esses arquivos por nomes de usuário, senhase outros dados confidenciais.

Arquivos binários

Arquivos binários podem conter texto simples, mas também armazenam arquivos binários dados - 1s e 0s. É mais difícil processar dados binários, pois eles não podem ser pesquisados ​​com uma ferramenta de pesquisa de texto. Além disso, muitos arquivos binários são salvos em um proprietário formato de arquivo, o que é difícil de analisar sem o correspondente aplicação. Portanto, a moagem de documentos binários geralmente se concentra no cabeçalho e rodapé de um documento, que pode conter texto sem formatação. Também pode ter como objetivo extrair metadados de arquivo.

Muitos arquivos binários contêm informações sobre o tipo de arquivo no cabeçalho do filete. Por exemplo, na imagem de amostra, as letras "PNG" no cabeçalho indicam que o arquivo é um PNG imagem. Essas informações são úteis para identificar o tipo de arquivo, pois ele não possui um extensão de arquivo. Da mesma forma, as fotos digitais geralmente contêm EXIF dados salvos quando a foto foi tirada. Um programa de visualização de imagens ou uma trituração de documentos escrita pode ser capaz de detectar e extrair essas informações.

TechLib - O dicionário de informática Lib Tech

Esta página contém uma definição técnica de Moagem de Documentos. Explica na terminologia da computação o que significa Moagem de Documentos e é um dos muitos termos de formato de arquivo no dicionário TechLib.

Todas as definições no site da TechLib foram escritas para serem tecnicamente precisas, mas também fáceis de entender. Se você achar útil essa definição de Moagem de documentos, poderá fazer referência a ela usando os links de citação acima.