Unlock a world of possibilities! Login now and discover the exclusive benefits awaiting you.
Pessoal,
Boa tarde
Estou iniciando na área de BI e no momento faço uma Pós graduação para obter uma base teórica mais consolidada, na disciplina de ETL o professor passou uma atividade para que nos realizassemos a modelagem a partir de uma planilha que ele disponibilizou, dentre as informações solicitadas, fiquei com algumas dúvidas que venho pedir auxilio ao pessoal mais experiente aqui.
Alguns requisitos solicitados:
* Atentar para prever que na base possa ter dados com entrada de dados sem conformidade ou com dados sujos. Criar coluna de auditoria contendo a data e hora da execução da carga.
Quais funções vocês recomendam para esse fim?
FileTime()
* Criar as chaves surrpgate keys, permanecer com as naturais. Fazer o SCD tipo 1. (Quem fizer o tipo 3 ganhará pontuação extra).
Fiz algumas pesquisas e a recomendação foi utilizar o IntervalMatch para tratar o SCD, consegui montar da forma que está na imagem abaixo, acreditam que é a melhor opção?
* Criar tabela fato com a técnica mais apropriada: (snapshot, incremental, etc)
Estou com bastante dúvida aqui, no caso de quem eleger para tabela fato a partir do modelo proposto, esse é um dos capitulos do Kimball que estou com dificuldade na interpretação, quais as melhores práticas?
Estou anexando o excel que serviu como base e o qvw contendo o que consegui fazer.
Poderiam me informar se estou no caminho certo?
Obrigado!
Um problema que percebi agora enquanto revisava o script é que perdi a referência do CL_CODIGO entre as tabelas de Cliente (ClienteDinamico, ClienteStatico) para com a tabela Nota Fiscal, existe alguma forma melhor de tratar o SCD nesse caso?
Seguindo a modelagem do excel, o relacionamento entre as tabelas seria esse aqui
Mudei um pouco a modelagem e ficou da forma do print abaixo, mas perdi o tratamento das alterações (SCD Tipo 3)
Como eu poderia fazer isso?
Anexo também a versão atual.