Alfabetização de Dados Compreenda, organize e interprete os dados do seu negócio
Marcio VictorinoPrefácio
"Viver é enfrentar um problema atrás do outro. O modo como você os encara é que faz a diferença". Essa afirmação é atribuída a Benjamin Franklin, um dos mais importantes personagens da história dos Estados Unidos e mundialmente conhecido por suas pesquisas científicas na área da eletricidade.
Alinhados ao pensamento de Franklin, mapeando-o para o ambiente corporativo, podemos afirmar que gerir uma organização é enfrentar um problema atrás do outro. O modo como a pessoa gestora o encara é que faz a diferença. A eficácia de uma pessoa gestora é fundamentada pela sua capacidade de tomar decisões para resolver os problemas de uma organização.
Em um mundo no qual as organizações são ou estão tentando se tornar orientadas a dados (data driven), a diferença entre o bom gestor e o não tão bom gestor é que o primeiro tende a resolver os problemas da organização tomando decisões com base nos dados, enquanto o outro tende a não dar o valor devido aos dados para a resolução desses problemas. Esses comportamentos distintos talvez possam ser explicados pela capacidade que cada gestor tem de compreender, organizar e interpretar os dados de uma corporação.
As organizações orientadas a dados atuam em um ambiente repleto de sistemas de informação transacionais e analíticos, que geram, coletam e mantêm dados sobre suas operações, clientes, concorrentes e mercado. Esses sistemas e respectivos dados gerados são subsídios fundamentais para a tomada de decisão.
A boa notícia é que esse ambiente organizacional complexo gera dados relevantes a todo momento, potencialmente utilizáveis para o entendimento do comportamento dos clientes, do negócio da organização e da concorrência. Por outro lado, devido ao grande volume, à grande variedade de formatos e à velocidade com que esses dados devem ser processados para não se tornarem obsoletos, há a necessidade de se ter um conhecimento sobre a linguagem dos dados, independentemente da área de atuação e posição ocupada nas organizações. Essa linguagem se refere à facilidade para ler e interpretar visualizações de dados e entender os dados subjacentes.
Pode-se inferir que a qualidade dos sistemas de informação e a capacidade de pessoas gestoras fazerem o uso apropriado dos dados gerados por esses sistemas podem impactar dramaticamente a qualidade da gestão dessas organizações.
Então, surge a indagação: Como aprimorar a qualidade dos sistemas de informação e a compreensão dos dados gerados por esses sistemas?
Durante os últimos 30 anos, tive a oportunidade de participar de vários projetos que incluíam a concepção, implementação e implantação de sistemas de informação transacionais e analíticos. Nesse período, foi possível perceber que, quanto mais eu explicava aos usuários como funcionava o processo de desenvolvimento de sistemas de informação computadorizados e as tecnologias utilizadas, maior era o interesse deles em relação a esses assuntos. Esse círculo virtuoso incrementava significativamente a qualidade dos sistemas de informação e a compreensão dos dados gerados por esses sistemas.
Tudo começou em 1994, quando concluí o curso de Engenharia da Computação e comecei a fazer parte de equipes de projetos do Exército Brasileiro (EB) para o desenvolvimento de sistemas computacionais. Mais tarde, em 2002, após concluir o mestrado, iniciei a carreira acadêmica em paralelo à carreira de profissional de Tecnologia da Informação (TI), ministrando aulas em instituições de ensino superior do Distrito Federal, mais precisamente em Brasília. Foram vários anos lidando com alunos e usuários dos mais diversos tipos de sistemas.
Sempre incentivei os usuários a entenderem o processo de desenvolvimento de sistemas. Com o passar do tempo, alguns usuários começaram a solicitar cursos de modelagem de dados para que eles entendessem melhor os modelos conceituais dos sistemas a serem implementados. Atendi a essas demandas e foi dessa forma que iniciei a ensinar TI para profissionais que não são da área de tecnologia. Assim, foi possível perceber que quanto mais os usuários entendiam o processo de desenvolvimento de software, mais eles participavam do projeto de desenvolvimento e, consequentemente, os sistemas desenvolvidos apresentavam maior qualidade e esses usuários compreendiam profundamente os dados gerados por esses sistemas.
Particularmente, sempre acreditei que os profissionais de qualquer área de formação ou atuação são capazes de entender os fundamentos dos sistemas de informação computadorizados e as tecnologias envolvidas, até que, no início da década de 2010, tive contato com o termo alfabetização de dados (Data Literacy), consolidando a certeza de que é possível e útil ensinar os fundamentos dos processos e tecnologias utilizadas para o tratamento dos dados para esses profissionais.
"Alfabetização de dados pode ser entendida como a capacidade de entender, encontrar, ler, interpretar, avaliar, gerenciar e usar dados. Ela permite que os indivíduos acessem, interpretem, avaliem criticamente, gerenciem, manejem e usem os dados eticamente (PRADO; MARZAL, 2013).
Então, para uma pessoa profissional ser considerada alfabetizada em dados, ela precisa desenvolver um conjunto de habilidades relacionadas a processos e tecnologias computacionais utilizadas para o tratamento da informação. O principal objetivo deste livro é proporcionar o entendimento da linguagem dos dados, de como esses dados devem ser organizados e como podem ser transformados para serem usados no apoio à decisão nas organizações.
Para incentivar o processo de alfabetização de dados de pessoas universitárias e profissionais de qualquer área, resolvi escrever este livro, que é um registro da experiência adquirida nos últimos 30 anos por meio da participação em projetos de TI e atuação como professor de disciplinas em cursos de graduação e pós-graduação na área de Ciência da Computação e Ciência da Informação, ministradas para universitários e profissionais de diversas áreas de formação e atuação.
Para enriquecer sua experiência durante a leitura, você pode visualizar a implementação dos principais conceitos apresentados neste livro também por meio do canal do YouTube @ProgramarIsCool e obter materiais complementares no repositório LivroAlfabetizacaoDeDados (https://github.com/profvictorino/LivroAlfabetizacaoDeDados) do usuário profvictorino (https://github.com/profvictorino) do GitHub.
Sobre o autor
Marcio Victorino é engenheiro da computação formado pelo Instituto Militar de Engenharia (IME), possui especialização em Sistemas de Informação e Telemática pela Universidade Federal do Rio Grande do Sul (UFRGS), mestrado em Sistemas e Computação pelo IME e doutorado em Ciência da Informação pela Universidade de Brasília (UnB).
Tornou-se profissional de Tecnologia da Informação (TI) em 1994 quando concluiu o curso de graduação. Desde então, participou de vários projetos de TI do Exército Brasileiro (EB), desempenhando diversos papéis, iniciando como desenvolvedor de software até assumir a posição de gerente de projetos.
Em paralelo às atividades de engenharia, dedicou-se à carreira acadêmica por acreditar que a experiência adquirida no desenvolvimento de projetos de TI seria de grande valia para a formação de futuros profissionais da área. Em 2002, começou a ministrar disciplinas de TI em instituições de ensino superior do Distrito Federal. Em 2014, quando passou para a reserva do EB, ingressou como professor substituto do Departamento de Ciência da Computação (CIC) e, em 2017, tornou-se professor adjunto da Faculdade de Ciência da Informação (FCI) da UnB. Atualmente, é professor da Graduação em Biblioteconomia da FCI e participa de dois programas de Pós-Graduação da UnB nas seguintes linhas de pesquisa: Gestão, Tecnologias e Organização da Informação e do Conhecimento do PPGCInf (FCI) e Ciência de Dados do PPCA (CIC).
Sumário
- 1 Alfabetização de dados
- 2 Sistemas de informação
- 2.1 Classificação dos sistemas de informação
- 3 Projeto conceitual de banco de dados
- 3.1 Modelo Entidade-Relacionamento
- 3.2 Notação da engenharia da informação
- 3.3 Exemplo de projeto conceitual
- 4 Projeto lógico de banco de dados
- 4.1 Modelo Relacional
- 4.2 Mapeamento do modelo conceitual para o lógico
- 4.3 Normalização
- 4.4 Exemplo de projeto lógico
- 5 Projeto físico de banco de dados
- 5.1 Artefatos resultantes do projeto físico
- 5.2 SQL — Linguagem de Definição de Dados (LDD)
- 5.3 Exemplo de Script de Geração do Banco de Dados
- 5.4 SQL — Linguagem de Manipulação de Dados (DML)
- 5.5 Operadores de Conjuntos
- 6 Big Data e banco de dados NoSQL
- 6.1 Big Data
- 6.2 Banco de dados NoSQL
- 7 Data Warehouse
- 7.1 Modelagem dimensional
- 7.2 Exemplo de um projeto de modelagem dimensional de um ambiente de DW
- 7.3 Consultas OLAP
- 8 Lógica de Programação
- 8.1 Algoritmo
- 8.2 Algoritmo com decisão
- 8.3 Algoritmo com repetição
- 9 Linguagem de programação Python
- 9.1 Origem da linguagem de programação Python
- 9.2 Sintaxe da linguagem de programação Python
- 9.3 Blocos de código Python
- 10 Ciência de Dados
- 10.1 Inteligência Artificial, Aprendizado de Máquina e Aprendizado Profundo
- 10.2 Tipos de aprendizado
- 10.3 Técnicas utilizadas em Machine Learning
- 11 Aprendizado supervisionado
- 11.1 Classificação
- 11.2 Regressão
- 12 Aprendizado não supervisionado
- 12.1 Regras de Associação
- 12.2 Agrupamento
- 13 Considerações finais
Dados do produto
- Número de páginas:
- 341
- ISBN:
- 978-85-5519-386-6
- Data publicação:
- 10/2024