JA

bons dados começam com grande governança

Saved To Meu conteúdo salvo
Download Artigo

Não foi há muito tempo que os especialistas estavam tocando em uma nova era de big data em que todas as informações de uma empresa, juntamente com a abundância de dados disponíveis em mundos. Para seu crédito, muitas organizações se sentaram e tomaram conhecimento. Hoje, é aceito a sabedoria que os dados e análises fornecem uma ferramenta essencial na diferenciação competitiva. To be sure, leading companies in every industry—including retail, telecommunications, pharmaceuticals, and banking and insurance—have adopted advanced analytical methods and high-performance data-handling capabilities to improve cost performance and increase revenues.

Still, too many companies embrace data and leave it at just that. To be sure, leading companies in every industry—including retail, telecommunications, pharmaceuticals, and banking and insurance—have adopted advanced analytical methods and high-performance data-handling capabilities to improve cost performance and increase revenues.

Indeed, many have achieved small, early wins with pockets of analytics applications, but scaling those wins requires internal development of a full set of data Recursos.

Data governance comprises four building blocks: data structures, data policies, data tools, and the organization’s participants and target operating model.

Nos próximos anos, o Empresas com os melhores recursos de dados - e a melhor qualidade de dados - dominarão . Com base no trabalho do nosso cliente, o BCG construiu uma estrutura estruturada que define os recursos necessários para a transformação do modelo operacional de uma empresa e para obter sucesso na corrida de dados de hoje. (Consulte Anexo 1.) No coração da questão, a governança de dados compreende quatro blocos de construção: estruturas de dados, políticas de dados, ferramentas de dados e os participantes da organização e o modelo de operação de destino (TOM). Isso facilita a melhoria sustentável da qualidade dos dados de uma empresa. Nossa definição relativamente ampla de qualidade de dados inclui integridade, precisão, consistência, acessibilidade e as qualidades que são importantes para os negócios em particular e são determinados por essa empresa individual. Algumas indústrias, como bancos e produtos farmacêuticos, estão sujeitos a regulamentos que os obrigam a melhorar seus dados de maneira sustentável. Mas, além de cumprir as obrigações regulatórias, os dados limpos permitem que uma organização otimize a eficiência, ofereça jornadas modernas e simplificadas dos clientes, antecipam a evolução continuamente as necessidades e desejos dos clientes por meio de análises avançadas eficazes e inteligência artificial (IA) e até criam novos negócios. Um grande banco europeu liberou vários bilhões de dólares em capital depois que os dados de exposição aprimorados diminuíram seus buffers de capital regulatório. Uma empresa líder em bens de consumo gerou centenas de milhões de dólares anualmente após a implementação de uma abordagem hiperpessoal que alavancou os dados do cliente, integrando -os com dados externos em modelos de IA. Um fabricante global de aço reduziu os custos em centenas de milhões de dólares, simplificando seus dados da cadeia de suprimentos, integrando fluxos de dados internos e externos e usando os dados para otimizar suas operações. Devidamente implementado, a governança de dados focada na qualidade dos dados pode ajudar as empresas a colher benefícios quantificáveis ​​significativos. Na mesma respiração, muitos dados problemáticos da culpa por sua incapacidade de alavancar análises avançadas e IA. Em um recente estudo de benchmarking que cobriu mais de 600 empresas, o BCG descobriu que mais de 60% dessas empresas avaliaram suas capacidades de governança de dados em vários níveis de subdesenvolvimento.

goodda-3-tcm9-233575.PNG

Data Governance Affects the Entire Organization

Data governance may include organizational and technological elements that facilitate the sustainable improvement of a company’s data quality. Our relatively broad definition of data quality includes data completeness, accuracy, consistency, accessibility, and the qualities that are important to the particular business and are ultimately determined by that individual company.

Good data matters—not least for compliance and operational excellence. Some industries, such as banking and pharmaceuticals, are subject to regulations that compel them to improve their data in a sustainable way. But in addition to complying with regulatory obligations, clean data allows an organization to optimize efficiency, offer modern and streamlined customer journeys, anticipate continually evolving customer needs and desires through effective advanced analytics and artificial intelligence (AI), and even create new businesses.

Good data also offers innumerable opportunities for unlocking value. A major European bank freed up several billion dollars of capital after improved exposure data decreased its regulatory capital buffers. A leading consumer goods company generated hundreds of millions of dollars annually after implementing a hyperpersonalized approach that leveraged customer data by integrating it with external data in AI models. A global steel manufacturer reduced costs by hundreds of millions of dollars by streamlining its supply chain data, integrating internal and external data flows, and using the data to optimize its operations. Properly implemented, data governance that is focused on data quality can help companies reap significant quantifiable benefits.

We hear too many complaints about the quality, consistency, and accuracy of company data, as well as the difficulty of accessing it. In the same breath, many blame problematic data for their inability to leverage advanced analytics and AI. In a recent benchmarking study that covered more than 600 companies, BCG found that more than 60% of those companies assessed their data governance capabilities at various levels of underdevelopment. 1 1 Pesquisa de Avaliação de Maturidade dos Recursos de Dados do BCG, março de 2019.

Obstáculos organizacionais a serem superados

O que impede as empresas de desenvolver e incorporar a governança de dados que podem melhorar a qualidade de seus dados? Existem três culpados primários:

The failure to implement data governance has very real and long-lasting ramifications. We’ve seen companies embark on multiyear projects, struggle with regulations, institute governance rules that aren’t needed, and spend millions of dollars on tools without moving the needle much on improving data quality or creating value.

The Four Building Blocks of Data Governance

Best practices create the optimal environment for successful data projects. (See Exhibit 2.)

goodda-2-tcm9-233576.PNG

Estruturas de dados. As estruturas de dados ajudam a criar um inventário e linguagem compartilhada em torno dos dados. Eles incluem descrições dos dados da empresa, definidos e classificados em glossários, domínios, famílias, modelos, dicionários e fluxos. Isso não é exatamente novo: as empresas usam essas ferramentas há décadas. Na maioria das vezes, no entanto, eles estão desatualizados, incompletos e não adequados ao objetivo. O Glossário é uma lista dos termos pelos quais os dados da Companhia são categorizados; portanto, a seleção dos termos é crucial para a maneira como o negócio é conduzido e alinha a organização sobre seu significado e uso. Por exemplo, um banco de varejo líder passou vários meses passando de clientes "individuais" para clientes "domésticos" e decidindo quais dados devem estar associados a eles. Uma montadora global precisava de um esforço semelhante para definir e categorizar "peças de reposição". Uma empresa líder de artigos de luxo teve problemas com "pontos de venda". As butiques totalmente de propriedade são, obviamente, pontos de venda, mas e os vários estandes em uma loja de departamentos? Cada um serve como um ou como um dos vários pontos de venda? Eles devem ser descritos pelos mesmos dados? E como as “vendas” são definidas? Receita nominal? Receitas nominais menos descontos? Comissões menos? Essas são algumas das preocupações que os glossários de dados abordam. Essa classificação sem desculpas e de alto nível permite lacunas nem sobreposições. Conseguir isso é mais fácil dizer do que fazer. Alguns dados críticos são usados ​​em casos de uso variados e com diferentes entendimentos de seu significado e propósito. Assim, parece pertencente a muitas pessoas ou entidades corporativas. Por exemplo, quem possui os dados do cliente? O departamento de vendas? Marketing? Financiar?  This is the starting point. Data structures help create an inventory and shared language around data. They include descriptions of the company’s data, defined and classified in glossaries, domains, families, models, dictionaries, and flows. This isn’t exactly new: companies have been using such tools for decades. More often than not, however, they are outdated, incomplete, and not fit for purpose.

The most important of these structures are data glossaries and data domains, which help define, organize, and assign the management of company data.

A data glossary serves as an important exercise in semantics. The glossary is a list of the terms by which the company’s data is categorized, so the selection of the terms is crucial to the way the business is conducted and aligns the organization on their meaning and use. For example, a leading retail bank spent several months moving from “individual” customers to “household” customers and deciding which data should be associated with them. A global automaker needed a similar effort to define and categorize “spare parts.” A leading luxury goods company had trouble with “points of sale.” Fully owned boutiques are, of course, points of sale, but what about multiple stands in a department store? Does each serve as one or as one of several points of sale? Should they be described by the same data? And how are “sales” defined? Nominal revenues? Nominal revenues minus discounts? Minus commissions? These are some of the concerns that data glossaries address.

Data domains focus on where data resides and specify ownership of the data defined in the glossary. This high-level, unapologetic classification allows for no gaps and no overlaps. Achieving this is easier said than done. Some critical data is used in varying use cases and with different understandings of its meaning and purpose. It thus seems owned by many people or corporate entities. For example, who owns the customer data? The sales department? Marketing? Finance? 

Vale a pena notar o quão importante é desamarrar os usos sobrepostos e conflitantes dos dados e atribuir todos os dados a domínios bem definidos.

Depois que os dados críticos forem classificados, os proprietários de dados são atribuídos a cada domínio e dada a responsabilidade final por todas as decisões de qualidade dos dados, levando em consideração as necessidades específicas para a qualidade dos dados de sua área de negócios. Vale a pena notar o quão importante é desamarrar os usos sobrepostos e conflitantes dos dados e atribuir todos os dados a domínios bem definidos. Quando os dados são espalhados pelos domínios, a responsabilidade é diluída e as decisões e ações necessárias para a qualidade do domínio são facilmente ignoradas.

Os domínios de dados também desempenham funções úteis na identificação de áreas para melhorar a qualidade dos dados. Domínios correspondentes-e suas subdivisões e famílias-para obter dados usados ​​por vários projetos e casos de uso em andamento e quase futuro é uma maneira fácil e muito eficaz de priorizar áreas nas quais as ações de governança de dados devem ser focadas. (Consulte Anexo 3.) Essa abordagem tem, portanto, um amplo impacto na eficiência de uma organização. Os metadados podem ser descritivos e relacionados a modelos de dados, restrições de segurança, indicadores de qualidade e governança de dados. Um dicionário de dados é passivo (mantido separadamente do conjunto de dados que descreve) ou ativo (atualizado automaticamente quando a estrutura do conjunto de dados for alterada).

goodda-1-tcm9-233577.PNG

A data dictionary (not to be confused with a data glossary) focuses on data about the data—metadata. Metadata can be descriptive and related to data models, security restrictions, quality indicators, and data governance. A data dictionary is either passive (maintained separately from the dataset it describes) or active (updated automatically when the dataset structure changes).

Fluxos de dados help stakeholders understand the paths data takes in an organization. They provide visibility on data location and status, simplifying error tracing back to the error source. Data flows have become increasingly important for the data governance of companies subject to the European Union’s General Data Protection Regulation. 2 2 O Regulamento Geral de Proteção de Dados, UE-2016/679, abrange proteção e privacidade de dados para cada cidadão individual da UE e do Espaço Econômico Europeu. Ele também aborda a transferência de dados pessoais fora dessas áreas. Vários dos direitos garantidos pelo regulamento da UE são oferecidos apenas com fluxos de dados atualizados. Vimos várias empresas adotarem a abordagem errada para isso, lançando esforços de vários anos para desenvolver políticas sobre tudo e qualquer coisa. Isso invariavelmente leva a um esforço burocrático e ineficiente do "Ministério dos Dados". Como essas iniciativas geram nenhum valor, a alta gerência geralmente as interrompe.

Data Policies. Once a company has organized and clarified its data, it should develop rules related to, for example, its processes, actions, roles, and budget allocation principles. We have seen several companies take the wrong approach to this, launching multiyear efforts to develop policies about everything and anything. This invariably leads to a bureaucratic and inefficient “Ministry of Data” effort. Because such initiatives generate no value, top management generally discontinues them.

Once a company has organized and clarified its data, it should develop rules related to, for example, its processes, actions, roles, and budget allocation principles.

Nossa posição sobre esse ponto é clara: todas as empresas precisam de definições claras e inequívidas de qualidade dos dados, diretrizes de medição e as principais funções e responsabilidades que governam as melhorias. Eles variam do muito básico que são fáceis de medir com indicadores de qualidade-chave simples (KQIS), como "integridade", para o muito complexo que pode ser medido apenas aplicando regras de negócios sofisticadas, como "precisão". Qual e quantos devem usar uma empresa? Opte pela simplicidade. Com base nas necessidades e usos dos dados, as empresas devem selecionar um pequeno número de critérios e consagrá -los como a definição de qualidade dos dados. É importante observar que os critérios não são igualmente importantes entre os domínios. Por exemplo, a qualidade dos endereços de email do cliente é provavelmente menos importante que a qualidade dos dados de vendas. Embora os critérios permaneçam os mesmos, os objetivos KQI podem ser diferentes, refletindo os vários níveis de qualidade necessários para cada tipo de dados. É papel de todos os proprietários de dados definir os objetivos de qualidade de seus domínios específicos. dados.

At least two dozen sets of criteria are available to describe data quality. They range from the very basic that are easy to meas-ure with simple key quality indicators (KQIs), such as “completeness,” to the very complex that can be measured only by applying sophisticated business rules, such as “accuracy.” Which and how many should a company use? Opt for simplicity. On the basis of the needs and uses of data, companies should select a small number of criteria and enshrine them as the data quality definition.

A company should next specify the ways these criteria will be applied and measured and establish a baseline for the current situation. It’s important to note that criteria are not equally important across domains. For example, the quality of customer email addresses is likely less important than the quality of sales data. While the criteria remain the same, the KQI objectives may be different, reflecting the various levels of quality needed for each type of data. It is the role of all data owners to define the quality objectives of their specific domains.

The data quality policy must also lay out the processes by which KQIs are defined and measured, the roles and responsibilities of the people participating in their improvement, the budget allocation process for these activities, and, more generally, all organizational and technical elements necessary for continuously monitoring and sustainably improving the quality of the data.

Outras políticas podem ou não ser solicitadas. Se uma empresa tiver problemas com seus dados de referência (um recurso para outros dados), provavelmente precisa de uma política de gerenciamento de dados mestre (MDM); Se não tiver um problema referencial, não precisará de um MDM. As empresas que estão lidando com problemas de acessibilidade de dados devem criar uma política de direitos de acesso ao usuário. Eles são um meio para um fim e desempenharem papéis importantes no bom funcionamento, consolidação e simplificação dos esforços de dados. Não mais do que isso. Esquecer isso pode levar a um esforço desnecessário, o desperdício de recursos e a burocracia excessiva. Vimos empresas desenvolvendo inúmeras políticas de dados, mas é raro que mais de quatro ou cinco políticas sejam necessárias para a governança eficaz de dados.

As a general rule, data policies must correspond with and address the company’s specific data issues and their root causes. They are a means to an end and play important roles in the smooth functioning, consolidating, and streamlining of data efforts. No more than that. Forgetting this can lead to unnecessary effort, the waste of resources, and excessive bureaucracy. We have seen companies developing numerous data policies, but it is quite rare that more than four or five policies are needed for effective data governance. 3 3 Excluímos explicitamente a política de segurança e a política de privacidade de dados: eles nem sempre fazem parte da governança de dados ou da responsabilidade do diretor de dados. Em muitos casos, o primeiro é de responsabilidade do Diretor de Segurança da Informação e do segundo, do Diretor de Proteção de Dados.

Ferramentas de dados. Ainda assim, é importante considerar dois tipos: higiene básica de dados e ferramentas avançadas. No entanto, compartilhar e atualizar esses elementos em uma comunidade de várias centenas de usuários em alguns ou muitos locais podem ser complicados e excessivamente complexos, se não totalmente impossíveis. Just as data policies require the simplicity approach, the approach to data governance has no need of myriad tool sets. Still, it is important to consider two types: basic data hygiene and advanced tools.

It’s possible to build a list of data domains or a data dictionary using a spreadsheet or to represent a data flow using any kind of graphic software. However, sharing and updating such elements across a community of several hundred users in a few or many locations can be cumbersome and overly complex, if not outright impossible.

Digite ferramentas de higiene de dados. Essas ferramentas relativamente básicas e construídas para fins ajudam as empresas a criar e manter suas estruturas de dados, glossários de dados, dicionários e fluxos com eficiência.

Ferramentas avançadas executam tarefas sofisticadas. Algumas ferramentas, por exemplo, focadas em uma área específica, como MDM ou linhagem de dados, servem a um único objetivo, enquanto outros que são multiuso cobrem todo o espectro de funções de dados, como calcular KQIs e gerenciamento de fluxo de trabalho. As ferramentas de dados devem ser adaptadas às necessidades de cada empresa e devem ajudar a aplicar suas políticas de dados.

Implementation of data tools is not a panacea and can consume resources that could be better employed in other data-related tasks. Data tools should be adapted to each company’s needs and should help enforce its data policies.

Successful data governance requires multilayer management that is focused on business but spans both business and IT.

Os participantes da organização de dados e o modelo operacional de destino. Normalmente, é construído em torno dos diretores de dados e de suas equipes - as únicas pessoas dedicadas especificamente à governança de dados - além de um Conselho de Governança de Dados (DGC), proprietários de dados, administradores de dados e custodiantes de dados. Successful data governance requires multilayer management that is focused on business but spans both business and IT. It is typically built around chief data officers and their teams—the only people specifically dedicated to data governance—plus a data governance council (DGC), data owners, data stewards, and data custodians. 4 4 Os títulos exatos e a granularidade dos papéis da governança de dados diferem de empresa para empresa, mas devem resultar na mesma coisa: uma base de dados mais forte.

And what should data governance’s TOM be? We see four main organizational archetypes:

It is not uncommon for companies to begin by using a federated model with a doer CDO and, as the organization matures and builds its capabilities, to evolve to a CDO-as-facilitator model.


Over the past few years, data has been established as a fundamental source of business value. Companies compete in an environment characterized by enormous—and growing—data sets, stringent data regulations, and frequent data-powered disruptions. In this context, data governance—and the resulting improvement of data quality—provides a way to achieve not just short-term results but also to embed data in the organization and succeed in its data and analytics journey.

It just requires some attention and dedication to a data transformation. Any company can get it right.

Authors

Partner & Director

Elias Baltassis

Parceiro e diretor
Dubai

Diretor Gerente e Parceiro Sênior

Antoine Gourévitch

Diretor Gerente e Parceiro Sênior
Paris

Diretor Gerente e Parceiro

Lucas Quarta

Diretor Gerente e Parceiro
Paris

Conteúdo relacionado

Salvo para Meu conteúdo salvo
Saved To Meu conteúdo salvo
Download Artigo