Comparação entre data warehouses e data marts
O processo consiste em criar datasets de documentos (chamados 'corpus') e transformar a informação contida nos mesmos em uma matriz numérica. A partir daí, segue-se o caminho usual da Mineração de Dados, utilizando os diversos modelos de Machine Learning disponíveis, de acordo com o problema abordado.
OLTP significa Online Transaction Processing e se refere aos sistemas operacionais das organizações. Seus objetivos são processar os dados rotineiros e dar suporte às funções de execução do negócio, enquanto o OLAP se concentra na tomada de decisões.
A estrutura usada é chamada de Data Warehouse, ou também Armazém de dados, ou ainda depósito de dados.
OLAP é um software cuja tecnologia de construção permite aos analistas de negócios, gerentes e executivos analisar e visualizar dados corporativos de forma rápida, consistente e principalmente interativa.