Image for post
Image for post
By: Luiz Felipe Mendes Nogueira, Laryssa Kimi Kato, Edgar Bermúdez

Cientista de Dados | Três visões sobre o dia a dia deste profissional

Cientista de Dados é uma nova profissão do mercado que está em ascensão e que surgiu com essa nova era da informação que estamos vivendo. Neste post, vamos falar sobre essa carreira promissora sob o olhar de três profissionais da área, que vão compartilhar suas experiências.

Por ser uma área relativamente nova, a ciência de dados é difícil de se descrever e há diferentes opiniões sobre o que um profissional deste mercado deve saber e dominar. Na prática, a equipe de Data Science é composta de pessoas com perfil e habilidades diferentes. Minha equipe é composta, principalmente, por pessoas da área de Matemática, Estatística e Engenharia, todos com conhecimentos complementares e em constante colaboração.

O aprendizado é bastante recorrente na equipe. Trabalhamos com muitos projetos e cada um deles tem particularidades que exigem habilidades em que é preciso aprender, de forma individual, com treinamentos on-line por exemplo, sem esquecer do prazo da entrega do projeto. Há uma grande quantidade de aprendizados e softwares a dominar e é vital focar os esforços para priorizar o aprendizado do software que cada um dos projetos requer. O aprendizado é contínuo e mandatório.

Minha trajetória começou com a integração em um projeto em andamento do qual fiquei responsável pouco tempo depois. Os primeiros dias foram divididos entre o entendimento do problema a resolver, o acompanhamento do desenvolvimento do projeto e a aprendizagem do Python, uma nova linguagem de programação para mim.

Depois de compreender o projeto, mais de 80% do trabalho consistiu em acondicionar os dados recebidos do cliente, mais de 20 bases de dados diferentes que tiveram que ser entendidas, tratadas e unificadas para se conseguir extrair a informação necessária. Posteriormente, passei por uma etapa desafiadora, na qual as descobertas feitas usando técnicas de classificação e clusterização em cima da informação tiveram que ser apresentadas ao cliente, de uma forma fácil de entender. A complicada arte de fazer o difícil parecer fácil.

Meu segundo projeto foi também de muito aprendizado, já que foi necessário acondicionar os resultados de uma pesquisa criada para um cenário internacional aplicada a um cenário nacional. Novamente, parte do trabalho consistiu somente no acondicionamento dos dados para se trabalhar com eles. Aqui, além de aprender novas ferramentas de Python, foi preciso aprender ferramentas de R para classificação e priorização de caraterísticas para, então, chegar no resultado esperado e dentro do prazo.

O terceiro e atual projeto tem por objetivo a identificação automática de documentos, um novo desafio que requer conhecimentos de Deep Learning e Machine Learning assim como novas formas de acondicionar a informação, apresentá-la e trabalhar com tecnologias diferentes. No fim, trabalhar com Data Science é um aprendizado contínuo.

É uma área de diversidade intelectual | Luiz Nogueira

A complexidade, o dinamismo e a constante busca por informações são marcantes no ambiente de consultoria, e fazem com que o cientista de dados se mantenha sempre alinhado com as constantes inovações para uma entrega de soluções eficientes ao cliente. Sair da zona de conforto e se adequar à velocidade de aprendizado e de entrega de resultados descrevem o meu início de carreira como cientista de dados.

Sou graduado em Engenharia Mecânica e durante o curso tive pouco contato com programação. Na everis, tive a oportunidade de entrar em contato direto com novas linguagens, conhecimentos e, com o tempo, pude me aprofundar em Phyton, conhecimento que me auxiliou no aprendizado de tecnologias avançadas dentro da área de Data Science como NLP, Deep Learning e Machine Learning. Os três projetos que participei demonstraram a complexidade e a heterogeneidade da área, o que reflete em uma aprendizagem ímpar para minha carreira.

A minha equipe de Data Science é marcada pela diversidade intelectual de seus componentes, fazendo com que cada dia seja composto por novos desafios e aprendizados. O trabalho em equipe permite a troca de informações e o seu alinhamento reflete um projeto inovador e bem estruturado. Contribuem também um ambiente de trabalho leve, com a opção de home office, que permite que os funcionários adequem suas necessidades às obrigações de maneira eficiente.

A globalização permite a rápida circulação de informações e deve ser usada com cautela, analisando-se sempre a veracidade dos fatos. Um cientista de dados deve coletar, analisar e interpretar um grande volume de dados para criar ou gerar soluções para um determinado problema. Sendo assim, para me manter sempre atualizado, realizo cursos on-line de plataformas seguras e indicadas pela empresa.

Os principais meios de se manter atualizado são: ler artigos, seguir grandes pesquisadores e empresas em redes sociais, manter-se sempre atento a novas postagens sobre novas tecnologias. Contudo, a grande dificuldade de se manter informado sobre as principais inovações da área é, sem dúvida, conciliar o trabalho, descanso e tempo para ler e estudar.

Tem que gostar de trabalhar com algoritmos, métodos, modelos e números: Laryssa Kato

Ainda vejo muitas definições sobre as atribuições de um cientista de dados na internet. Porém, com os meus nove meses de experiência, sei é que o requisito mínimo é entender de estatística básica, de matemática e, principalmente, ter familiaridade com geometria analítica. Sei disso porque eram apenas estes os conhecimentos que possuía, além do conhecimento da linguagem de programação Fortran.

Antes de ser cientista de dados eu fui da área acadêmica. Sou formada em licenciatura em Física, em que o ritmo e a dinâmica de trabalho são bem diferentes, levei um tempo até conseguir me adaptar às novas formas de pensar. Basicamente, ainda tenho um problema para procurar uma solução, o que mudou é que agora, é necessário que as soluções sejam rápidas — o tempo é curto, e temos que cumprir prazos para entrega dos projetos, e resolver de forma eficaz e inteligente, de forma que atenda às necessidades.

O que aprendi ao longo da minha experiência na nova profissão foram métodos de machine learning, os básicos e necessários para entender como funciona a estrutura para a criação de um modelo adequado, onde tudo se inicia na exploração e estruturação dos dados. Em Machine Learning, o que mais tenho experiência é em redes neurais, mais especificamente, LSTM (Long Short Term Memory), que aplico no projeto que estou desde que iniciei na carreira. O que aprendi foi sobre a exploração de dados, a partir disso vi a importância que eles possuem; já que, com eles, conseguimos extrair informações muito importantes que determinam qual modelo devemos escolher, como devemos estruturar os dados e vemos as reais necessidades que o projeto possui. A maior parte do tempo que temos é para organizar, estruturar e limpar estes dados e fazemos isso usando python, uma linguagem de programação que estou aprendendo e que é necessária nas aplicações do projeto.

Meu maior contato é com a equipe do projeto em que trabalho, fazendo reuniões, discutindo sobre os problemas, coletando dados, fazendo status sobre como anda a construção do modelo, entre outras atividades. O projeto que estou, não é apenas de ciência de dados, somos uma das peças do quebra-cabeça que, ao final, será um projeto completo. O que faço é a implementação de machine learning através de um modelo de redes neurais. E não atuo sozinha, trabalho com mais uma pessoa, a qual eu auxílio e aprendo muito junto.

O que sinto desde que comecei nesta carreira é que existem muitos algoritmos, métodos, modelos e problemas que exigem dos cientistas de dados conhecimentos diversos, já que nunca recebemos o mesmo tipo de problema para resolver. Isso faz com que a cada projeto seja necessário um estudo para ajudar a resolver o problema. Além disso, somente conhecimentos em Machine Learning não são suficientes. Precisei aprender linguagem SQL para conseguir buscar e baixar dados de um banco de dados (hive) e saber um pouco de Linux, que já possuía conhecimento básico, devido aos programas que eu executava quando estava na área acadêmica. O que estou fazendo agora é aprofundando esses conhecimentos.

Onde trabalho, temos uma equipe apenas de cientista de dados e cada um trabalha em um projeto diferente e, muitas vezes, funciona da mesma forma como o meu, em que são partes do projeto, tendo que lidar com várias pessoas. No meu caso, eu não tenho contato direto com o cliente, mas outros profissionais estão constantemente em contato.

Sempre temos uma reunião semanal que me ajuda a conhecer os projetos que todos estão inseridos e amplia o conhecimento básico sobre as coisas para poder pesquisar mais por fora. O que mais gosto é o fato de poder aprender muito sempre, já que temos cursos para ajudar na capacitação e pessoas que estão empenhadas em compartilhar seus conhecimentos, pensando no ganho geral da equipe. O que também ajuda muito na construção do conhecimento são os cursos on-line que fazemos, neles conseguimos aprender sobre teorias do que sabemos na prática, o que faz com que o conhecimento seja mais completo.

Em todos os relatos, nota-se que a rotina de trabalho deste profissional nunca é a mesma, há sempre algo novo para aprender e problemas a serem resolvidos que exigem cada vez mais de conhecimentos diversificados nas áreas de tecnologia e informação.

Através dos dados, é possível obter informações que não são evidentes e se transformam em conhecimentos que trazem benefícios para a sociedade, otimização de processos, agilização de procedimentos e no geral, melhora da qualidade de vida das pessoas e a satisfação de ajudar ao próximo.

Written by

Exponential intelligence for exponential companies

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store