Para você que nos acompanhou nessa Sprint e ficou com gostinho de quero mais, reunimos aqui uma lista de links, agrupados pelos temas vistos nesta semana. Começamos querendo indicar 3 links por tema e idioma (português e inglês), mas, no processo de curadoria, as abas foram literalmente se multiplicando e a internet é o mundo! Resultado? Passamos um pouco dessa marca, mas a ideia aqui é ser um segundo movimento na expansão dos seus conhecimentos a partir das áreas que mais tiver interesse. A lista contém textos, vídeos, livros e até atividades práticas guiadas. Esperamos que você volte à listinha no futuro próximo e daqui um tempinho também e, quem sabe numa próxima sprint, como autoras <3.
Papéis nas carreiras técnicas
[PT]
- Como alavancar sua carreira na área de dados por meio das soft skills?
- A importância das Soft Skills, e por que nunca foram prioridade
- Uma abordagem baseada em habilidades para construir a força de trabalho do futuro
- Qual é a Diferença entre Engenheiro de Dados, Cientista de Dados e Analista de Dados?
- A diferença entre júnior, pleno e sênior — qual é você?
- Dissecando a carreira do Software Engineering Specialist (Staff, Principal e Distinguished Engineer)
- O que é preciso para ser um bom tech lead
[EN]
- Gender Gap Report 2023
- The Universe of “Data Science” Roles
- TDS: 10 trends that will shape the role of data scientists in the next 10 years | by Shahrokh Barati
- How to put the plus in ‘staff+’ engineer · GitHub
Cultura de dados
[PT]
- Como criar uma organização impulsionada por dados
- Competindo em um Mundo Guiado por Dados
- Data Thinking: uma proposta metodológica para se pensar a partir de dados
- O uso de dados abertos para maior transparência do setor governamental: um estudo sobre o panorama global da cultura do accountability, controle social e de análise de dados
- Desenvolvimento de cultura organizacional data-driven: uma visão dos profissionais de agências de publicidade
- Data-driven na indústria da moda: um estudo da utilização de dados no processo de criação de produto de moda em Santa Catarina
[EN]
- Closing the Results Gap in Advanced Analytics: Lessons from the Front Lines
- Five facts: How customer analytics boosts corporate performance
- Data and Analytics – Data-Driven Business Models: A Blueprint for Innovation
Projetos & Desenvolvimento na Área de Dados
[PT]
- Como Precificar Um Projeto de Data Science, Machine Learning ou IA – Data Science Academy
- Projetos de Ciência de Dados para o seu portfólio de projetos
- Top 10 Open Datasets Para Construir Portfólio de Projetos em Data Science
[EN]
- From Data to AI with the Machine Learning Canvas: Part I, Part II, Part III, Part IV
- Method for Constructing Machine Learning Project Canvas Based on Enterprise Architecture Modeling
- Spotify Rhythm – how we get aligned
- Spark Analysers: Catching Anti-Patterns In Spark Apps
IA e seus modelos (ML, NLP, LLM, etc)
[PT]
- O que é IA Generativa? A importância e o uso das Inteligências Artificiais como ChatGPT, MidJourney e outras
- Guia Completo Sobre Inteligência Artificial Generativa – Data Science Academy
[EN]
- AI Companies: OpenAI; Designs.AI and Albert.AI
- Stanford University Natural Language Processing Group
- Natural Language Toolkit
- What Is KI-NLP And How Can It Be Used For Conversational AI?
- How ChatGPT really works, explained for non-technical people
- Beyond ChatGPT: The Future of Generative AI for Enterprises
- Harness the power of generative AI for software development · GitHub
- Top 10 Generative AI Applications You Should Know in 2023
- Launching New Generative AI? Four Principles Critical to Success
Ética, explicabilidade e fairness em IA
[PT]
- O Que É AI Explicável (XAI)? | Blog da NVIDIA
- A explicabilidade na construção de uma inteligência artificial
- Implicações da Inteligência Artificial e Como Mitigar Vieses com Ferramentas Open source
[EN]
- Computational approaches to Explainable Artificial Intelligence: Advances in theory, applications and trends
- Inclusive Machine Learning: addressing model fairness
- Toward an Inclusive Artificial Intelligence: The Ms. Q&A With Gabriela de Queiroz
- A framework for managing ethics in data science projects
- Manifesto for the Responsible Development of Mathematical Works — A Tool for Practitioners and for Management
Data Science, Stats, Feature Engineering, MLOps
[PT]
- A arte da estatística
- DataOps: o que é, como funciona e como implementá-lo?
- O Que é DataOps? Um Exemplo de Caso de Uso
- O que é MLOps? – Blog oficial NVIDIA Brasil
- O que é MLOps? – Databricks
- Feature Engineering: dados para aprendizado de máquina | ateliware
- Feature Engineering: Extraindo o potencial máximo dos dados para modelos preditivos
- Automated feature engineering: como utilizar o featuretools – Datarisk
- Guia rápido de estudo Visão computacional e processamento de imagens.
- Tutorial: Introdução à Visão Computacional usando OpenCV
[EN]
- Thinking Clearly with Data
- Introducing Data Ops with MS Power BI
- The case for using Rust in MLOps · GitHub
- 6 Powerful Feature Engineering Techniques For Time Series Data (using Python)
- Top 10 Computer Vision Trends to Watch in 2023
Datalake, Datawarehouse & Lakehouse
[PT]
[EN]
- Setting Uber’s Transactional Data Lake in Motion with Incremental ETL Using Apache Hudi | Uber Blog
- Fast Copy-On-Write within Apache Parquet for Data Lakehouse ACID Upserts
- How Discord Stores Trillions of Messages
- Taking Charge of Tables: Introducing OpenHouse for Big Data Management | LinkedIn Engineering
- OpenLineage
Data Mesh
[PT]
[EN]
- Data Mesh: Delivering Data-Driven Value at Scale
- Introduction to Data Mesh with Zhamak Dehghani
- Keynote – Data Mesh by Zhamak Dehghani
- Data Mesh Architecture
- data-mesh | Thoughtworks
- Data Mesh in a nutshell – 1o capítulo do livro Data Mesh Delivering Data-Driven Value at Scale
Dataviz & Data Storytelling
[PT]
[EN]
- The Data Visualization Tools Wars – PolicyViz
- VLAT: Development of a Visualization Literacy Assessment Test
- Investigating aspects of data visualization literacy using 20 information visualizations and 273 science museum visitors
Dados Abertos & Dados Públicos
[PT]
- Lei de Acesso à Informação
- A Lei Geral de Proteção de Dados Pessoais
- O que são dados públicos, segundo a LGPD
- A Lei Geral de Proteção de Dados e a interoperabilidade dos dados públicos
- O que são Dados Abertos
- Portal Brasileiro de Dados Abertos
- Infraestrutura Nacional de Dados Abertos
- Criando Portais de Dados Abertos usando o CKAN
- O Poder do Open Data
- Base dos Dados
- Sete conjuntos de dados públicos que você pode analisar gratuitamente agora mesmo
[EN]
- Open Data Index
- Open Data Barometer
- Unlocking the potential of open data – European Data Portal
- Developments and Potential in Open Data: Exploring the Growth of the Field
- How government can promote open data and help unleash over $3 trillion in economic value
- World Bank Open Data
Batch, near real-time e streaming processing
[PT]
- O que são dados de streaming?
- Processamento em tempo real – Azure Architecture Center | Microsoft Learn
- Entenda como funciona streaming de dados em tempo real
[EN]
- How to build an effective streaming data architecture | TechTarget
- How Netflix built its real-time data infrastructure | VentureBeat
Podcasts & Meetups
[PT]
- Pizza de Dados
- Dadocracia
- Data Hackers
- Data Talks Brasil
- RLadies SP
- PyLadies Brasil
- Nubank’s Data Sciente & Machine Learning Meetups
[EN]
Cultura Dev & Textos gerais sobre trends e perspectivas de dados
- Accelerate test-driven development with AI · GitHub
- Accountability is Not Blame – by Kent Beck
- Developer Tools 2.0
- Databriks 2023 State of Data Report
- Gartner Identifies the Top 10 Data and Analytics Trends for 2023
- Thoughtworks Technology Radar
- Forbes Top 5 Data Science and Analytics trends in 2023
- The data-driven enterprise of 2025 | McKinsey
- The State of Data Engineering 2023 – Data Version Control at Scale
Leituras edificantes (e/ou divertidas) com dados
- O andar do bêbado: Como o acaso determina nossas vidas
- Subliminar: Como o inconsciente influencia nossas vidas
- Elástico: Como o pensamento flexível pode mudar nossas vidas
- Uma senhora toma chá: Como a estatística revolucionou a ciência no século XX
Autoras Bianca Ximenes, Especialista em Dados e Machine Learning Foi nomeada pelo Google Developers em 2021 como uma de 21 mulheres ao redor do mundo que estão abrindo novos caminhos relevantes na tecnologia. Atualmente em sabático, antes disso foi Head de IA na Gupy por anos. Também é Doutora em Ciência da Computação com foco em Ética aplicada a Machine Learning e Google Developer Expert em ML. Já impactou mais de 35 milhões de pessoas por meio dos seus produtos de IA e produziu conteúdos técnicos e palestras para mais de 80.000 pessoas. Haydee Svab, Consultora, pesquisadora e cientista de dados na ASK-AR Mãe da Zoé e do David, é sócia e co-fundadora da ASK-AR (consultoria em análise de dados). Atualmente é membro do Conselho de Governança da Open Knowledge Brasil e coordenadora do capítulo RLadies-São Paulo. É mestra em Engenharia e Planejamento de Transportes (Poli-USP), especialista em Democracia Participativa, Repúblicas e Movimentos Sociais (UFMG) e formada em Engenharia Civil/Arquitetura pela USP (Programa Poli-FAU). Enfim, é uma feminista que quer usar dados e ciência para tornar as cidades melhores, mais acolhedoras, mais inteligentes e mais sustentáveis para todas, todos e todes. Revisora Luciana Fleury, jornalista
Saiba mais no LinkedIn
Este conteúdo faz parte da PrograMaria Sprint Dados: ampliando as fronteiras.