Engenharia de Dados ( Junior/Pleno )

Sobre o departamento

A empresa
O NIC.br é uma entidade civil, de direito privado e sem fins lucrativos que atua em projetos e ações para a melhoria da Internet no Brasil. Com sede em São Paulo, financiamento sólido e atuação em todo país, o NIC.br desempenha um papel fundamental para a evolução da Internet. Acreditamos que a Internet é para todos e que ela terá uma importância cada vez maior em nossas vidas. Por isso, o nosso trabalho é a favor de toda sociedade e de todo Brasil.
Saiba mais sobre o NIC.br em:
https://youtu.be/MGSzdKpZEWo

I. Descrição da vaga:


A vaga
No NIC.br, você fará parte do projeto do Observatório de Inteligência Artificial – OBIA, que se estabelece como um centro de referência na coleta e produção de indicadores sobre os avanços e impactos da IA nos diversos setores do Brasil. Terá a possibilidade, dentro da instituição, de atuar em outros projetos relacionados a mapeamento de conectividade no país. Nossa missão está pautada em valores éticos, transparência e de desenvolvimento de projetos que visem o aprimoramento de políticas públicas, baseadas em evidências empíricas, pensando na qualidade de Internet e seus impactos nos aspectos socioeconômicos do país. Como profissional em Engenharia de Dados, você terá um papel ativo no desenvolvimento de produtos e soluções, assim como atuará no ciclo de vida dos dados, desde as etapas de: captação, extração, transformação de dados (ETL) e na construção de API, dashboards e serviços de stream. Para isto você terá a opção de fazer uso de ferramentas analíticas assim como linguagens de programação voltadas para análises de dados como Python e R. O profissional terá a possibilidade de trabalhar em um centro de pesquisa de referência internacional trabalhando com metodologias e cases de âmbito nacional e internacional.

II. Requisitos:

Qualificação necessária
  • Procuramos gente apaixonada por tecnologia e pela Internet que adore se aprofundar e aprender novas metodologias e conceitos relacionados a área de tecnologia.
  • Vontade de construir colaborativamente em um ambiente de troca científica e aprendizado em uma equipe multidisciplinar
  • Formação superior. Mestrado e/ou doutorado serão valorizados
  • Conhecimento em boas práticas de desenvolvimento de software em linguagens voltadas a análises de dados como Python ou R.
  • Conhecimento de algoritmos para resolução de problemas complexos
  • Experiência com Computação Distribuída e processos de ETL usando PySpark
  • Experiência com ferramentas de gerenciamento de dados e tecnologias como Apache Spark e Apache Airflow
  • Modelar e estruturar dados para suportar time de ciência de dados, analistas de dados e negócio usando notebooks, parquets e RDDs
  • Experiência na construção de pipelines de dados
  • Experiência com alguma biblioteca de manipulação de dados como: Pandas, dplyr ou similares
  • Contato ou experiência inicial com Bancos de Dados e/ou Linguagem SQL
  • Versionamento de código GIT
  • Inglês intermediário

Qualificação desejável (não obrigatória)
  • Contato ou Experiência com Stream de Dados usando Kafka
  • Conhecimento em técnicas de construção de APIs REST e/ou GRAPHQL
  • Experiência com metodologias ágeis de projeto
  • Experiência em ambientes de Micro Serviços
  • Docker e/ou Kubernetes
  • Conhecimento de sistema operacional Linux
  • Algum contato com métodos estatísticos

    III. Informações gerais:

    Benefícios e Informações
    • Contratação por CLT em regime de 40h semanais.
    • Plano de saúde executivo.
    • Vale refeição.
    • Convênio com Wellhub (Gympass).
    • Após 1 ano de empresa é possível solicitar bolsa estudo para pós e especialização em temas que tenham uma relação a área de atuação na empresa, ou cursos de idiomas.
    • Programa de bem estar e previdência privada, entre outros.
    • Carga horária: 40 horas semanais presenciais na região empresarial de São Paulo (Berrini)