Dados Estruturados e Não Estruturados
Dados estruturados
- Estão em um formato especifico/rígido
- Exemplo:
o Dados mantidos em SGBD
§ Tabela de banco de dados (existem tipo de dados rigidos - datatype de uma coluna e tamanho máximo de armazenamento)
§ É possível prever o que será inserido em um campo de uma tabela. se é texto, número, o tamanho máximo e etc
Dados Não Estruturados
· - Não existe rigidez ou quase nenhum sobre os dados
· - Não existe datatype, tamanho e etc
· - Não seguem uma regra. São apresentados como aparecem.
· - Não possuem estrutura definida
· - Possui Baixa Integridade
· - Tem Escalabilidade Linear
· - Possui Baixa Integridade
· - Tem Escalabilidade Linear
· - Exemplo:
o Documentos
o Imagens
o Vídeos
o E-mails
o Post em redes sociais (Um exemplo prático de uso desse tipo é a análise de sentimento)
o Dados retirados da internet – blogs
o Dados de sensores
o Dados não relacionais
Hadoop x SGBD
Toda e qualquer sugestão/dúvida será bem vinda!
Hadoop
· - Tem a habilidade de lidar com os dois tipos de dados. Estruturados ou não
· - A grande vantagem do hadoop é a de processar dados não estruturados. O Hadoop processa em lote
· - O MapReduce processa todos os dados em busca de informação
· - Estrutura dinâmica
· - É indicado em situações onde todos os dados devem ser analisados para se ter uma resposta
· - Indicado para o caso onde os Dados são gravados apenas uma vez. E são rodados um ou mais algoritmos na mesma base para se ter uma ou mais respostas dependendo do tratamento. Mas adiante teremos um post exclusivo para abordar o desenvolvimento de algoritmos
SGBD
· - Tem a possibilidade de processamento interativo ou em lote. é possível só processar uma parte de cada vez
· - Estrutura Rígida e estática
· - Alta integridade. por ex: a exclusão de um dado que tem dependência em outra tabela
· - É indicado em situações pontuais. onde em uma consulta é possível ter uma resposta
Toda e qualquer sugestão/dúvida será bem vinda!
Muito bom o artigo. Parabéns! Tem algum outro artigo ou livro que abranja mais a parte de bancos de dados não estruturados?
ResponderExcluir