Com inteligência artificial, as empresas podem mais proativamente - e com mais eficiência - gerenciar incidentes, economizar tempo, reduzir custos e poupar muita frustração.
As organizações de TI têm um problema com seus problemas. Como os tempos incertos fazem novas demandas - e urgência - na continuidade dos negócios, a maioria dos departamentos de TI ainda está adotando uma abordagem reativa para apoiar, apagando incêndios em vez de procurar fumaça. E mesmo quando o alarme soa, o problema geralmente não é claro. Os ingressos de incidente saltam em torno dele, soluções lag, os usuários ficam frustrados.
Digite Inteligência Artificial . A IA nas operações de TI é uma área emergente, e uma de suas aplicações mais atraentes está em gerenciamento de problemas e incidentes. A idéia é aproveitar os dados para antecipar falhas (ou pelo menos reduzir o tempo de resolução), classificar melhor os ingressos de suporte e identificar as causas subjacentes. Mas obter o benefício total da IA significa mais do que conectar algoritmos. Isso também significa garantir a disponibilidade e a qualidade dos dados e fazer alterações nos processos e organização. Perdem essas etapas e as economias de 20% a 30% se tornam mais de 4% a 7%. Embora as organizações de TI normalmente alocem 10% a 15% de seus orçamentos - e 10% a 20% de sua mão de obra - para apoiar, a satisfação do usuário tende a ser ruim. E suporte técnico de nível 1, o nível inicial em que a equipe de TI coleta informações e soluciona problemas de problemas mais básicos, raramente atinge a taxa de resolução de 90% considerada melhor em classe. Em vez de terminar com uma correção, uma chamada para apoiar geralmente apenas inicia as coisas. Os problemas avançam para cima e para baixo da cadeia, os desvios incluídos. As organizações de TI iniciam sua solução de problemas no final do jogo, geralmente quando o impacto de um incidente já é substancial. Para citar o encanador em pé em uma cozinha inundada: “Se você ligasse quando o tubo estivesse pingando.” Normalmente, as empresas classificam a grande maioria dos ingressos - geralmente ao norte de 80% - em um punhado de categorias de pia de cozinha, como hardware ou correio, que ocultam a complexidade do problema. (Consulte o Anexo 1.) Por exemplo, os problemas de impressora e estação de trabalho pousarão no balde de hardware. Portanto, a ineficiência começa bem na frente. Em vez de se hospedar no problema específico e nas pessoas mais bem posicionadas para resolvê -lo, as equipes de TI entram em um loop onde passam os ingressos, procuram mais informações, sofrem uma facada em uma solução e - quando isso não faz o truque - inicia novamente. conseqüência. Quando você coloca ingressos em baldes que não são terrivelmente significativos, a análise após o fato não é viável. É impossível identificar, em nível granular, as áreas mais importantes para a correção. A abordagem Big Bucket também significa que os departamentos de TI podem não estar alocando seus orçamentos para manutenção evolução-pequenos aprimoramentos que abordam questões diárias-da maneira mais eficiente.
In our experience, companies can reduce their IT support costs by 20% to 30%, while increasing user satisfaction and giving time back to staff. But gaining the full benefit of AI means more than plugging in algorithms. It also means ensuring the availability and quality of data and making changes to processes and organization. Miss those steps and the 20% to 30% savings become more like 4% to 7%.
Anticipate, Resolve, Improve
Problem and incident management will rarely win awards for ROI. While IT organizations typically allocate 10% to 15% of their budgets—and 10% to 20% of their manpower—to support, user satisfaction tends to be poor. And level 1 tech support, the initial tier where IT staff collect information and troubleshoot the more basic issues, rarely hits the 90% resolution rate considered best in class. Instead of ending with a fix, a call to support often just gets things started. Issues move up and down the chain, detours included.
The reactive approach to support doesn’t just skew the balance between costs and returns, it puts a thumb on the scale. IT organizations start their troubleshooting late in the game, often when an incident’s impact is already substantial. To quote the plumber standing in a flooded kitchen: “If only you’d called when the pipe was dripping.”
Tipping the scale even further is the poor quality of many support tickets. Typically, companies will sort the vast majority of tickets—often north of 80%—into a handful of kitchen sink categories, like hardware or mail, that hide the problem’s complexity. (See Exhibit 1.) For example, printer and workstation issues will both land in the hardware bucket. So the inefficiency starts right up front. Instead of homing in on the specific problem and the people best positioned to solve it, IT teams enter a loop where they pass around tickets, seek more information, take a stab at a solution, and—when that doesn’t do the trick—start again.
Poor classification has another consequence. When you drop tickets into buckets that are not terribly meaningful, after-the-fact analysis is not feasible. It’s impossible to identify, at a granular level, the most important areas for remediation. The big-bucket approach also means that IT departments may not be allocating their budgets for evolutive maintenance—small enhancements that address day-to-day issues—in the most efficient way.
Ai retira os polegares da balança. E faz isso de várias maneiras. Diferentes casos de uso permitem que os departamentos de TI antecipem problemas, resolvam problemas de maneira mais eficaz e melhorem a maneira como gerenciam e priorizam o suporte. (Consulte o Anexo 2.)
Some use cases are more sophisticated and more complex to implement than others, but companies don’t need to take an all-or-nothing approach. They can implement AI in a gradual way, generating value—and buy-in—with an initial wave of applications and then build on that foundation.
Support Ticket Classification
AI provides options and flexibility. Companies can employ different methods and algorithms to solve different kinds of problems. So where to start? We’ve found that support ticket classification is a particularly ripe area for AI enhancement. If an IT department could classify tickets more precisely, it would be able to identify connections and patterns across tickets—insights that would help it detect emerging trouble spots and prioritize remediation efforts.
Better yet, if that classification happened in real time, with the algorithm working even as the support agent enters the caller’s description, the ticket could be routed to the right place immediately, instead of bouncing around and triggering delays and dissatisfaction.
While not an exhaustive list, the following seven use cases spotlight how AI can help companies better manage and leverage support tickets:
- Improve support ticket classification (enabling granular categorization and correlating related tickets).
- Classify incidents by system, site, user cluster, and other criteria (segmenting tickets as needed for different types of analysis).
- Priorize os tickets de suporte. Tempo, quando um problema está reaparecendo ou quando algo está se comportando de maneira incomum).
- Enable smart rerouting of support tickets (in real time).
- Predict support team workload.
- Detect patterns in support tickets.
- Detect emerging issues (using the patterns identified in the previous use case to recognize, in real time, when an issue is reappearing or when something is behaving in an unusual manner).
Como exatamente você faz essas coisas? Duas técnicas de ciência de dados são fundamentais: processamento de linguagem natural (PNL) e aprendizado de máquina. Isso permite classificar os tickets em subcategorias e direcionar problemas para a equipe mais apropriada, acelerando a resolução. (Consulte o Anexo 3.) Ele também permite criar clusters - tijolos vinculados por palavras -chave e temas comuns. Eles podem revelar questões subjacentes que justificam a atenção. Em seguida, usando o aprendizado de máquina, você pode identificar distribuições de ingressos que pressagiaram problemas emergentes. Por exemplo, talvez você tenha descoberto que, no passado, um certo padrão de relatórios precedeu um aumento acentuado nos ingressos conectados a uma questão da estação de trabalho. Se você pudesse detectar, em tempo real, quando começou a ver esse padrão, poderá soar um alarme bem antes da chegada do pico do ingresso. Isso permitiria que você trabalhe o problema anteriormente, mas também permitiria que você tomasse medidas - como colocar uma mensagem "Estamos cientes da questão" na linha de call center - para reduzir o número de tickets de entrada. Tradicionalmente, os departamentos de TI confiam no instinto e na experiência. Ai conta com dados. A maioria das empresas mantém registros técnicos que capturam centenas de métricas de desempenho: uso da CPU, uso de memória, largura de banda de rede e assim por diante. Esse rico tesouro de informações pode alimentar o reconhecimento sofisticado de padrões. Isso permite entender o padrão de sinal que prediz uma anomalia e soa um aviso quando o problema está prestes a levantar a cabeça. O resultado: uma janela de antecipação - se 30 minutos ou 30 horas - para mitigar o impacto dos incidentes ou impedi -los completamente. Sem um padrão conhecido a detectar, como você pode criar e se beneficiar de uma janela de antecipação? A resposta está em um conceito de IA conhecido como aprendizado não supervisionado. Embora você possa não ter um padrão para combinar, o algoritmo ainda pode detectar anomalias nos dados - algo que levanta as sobrancelhas simplesmente porque é incomum. O processo pode não ter precisão, pois os dados anômalos não estão vinculados a um problema específico, mas fornece um aviso de que algo merece investigação.
NLP algorithms analyze free-text descriptions in support tickets to identify topics and connections. This lets you classify tickets into subcategories and direct issues to the most appropriate team, accelerating resolution. (See Exhibit 3.) It also lets you create clusters—tickets linked by common keywords and themes. These can reveal underlying issues that warrant attention.
When you apply NLP to past as well as current tickets, you can create a rich historical record of incidents, categorized and linked in very specific ways. Then, by using machine learning, you can identify ticket distributions that have presaged emerging issues. For example, perhaps you have discovered that in the past, a certain pattern of reports preceded a sharp rise in tickets connected to a workstation issue. If you could detect, in real time, when you started to see this pattern, you could sound an alarm well before the ticket peak arrived. This would let you work the problem earlier, but it would also let you to take steps—like putting a “We’re aware of the issue” message on the call center line—to reduce the number of incoming tickets.
Incident Anticipation
AI also enables a more robust and precise approach to incident anticipation. Traditionally, IT departments have relied on instinct and experience. AI relies on data. Most companies maintain technical logs that capture hundreds of performance metrics: CPU usage, memory usage, network bandwidth, and so on. This rich trove of information can fuel sophisticated pattern recognition.
The idea is to use machine learning algorithms, including regression, clustering, decision trees, and deep learning, to identify correlations between log data and past incidents. This lets you understand the signal pattern that foretells an anomaly and sound a warning when the problem is about to raise its head. The result: an anticipation window—whether 30 minutes or 30 hours—for mitigating the impact of incidents or preventing them entirely.
But what about a new type of incident? Without a known pattern to detect, how can you create and benefit from an anticipation window? The answer lies in an AI concept known as unsupervised learning. While you may not have a pattern to match against, the algorithm still can detect anomalies in the data—something that raises eyebrows simply because it’s unusual. The process may lack precision, as the anomalous data isn’t linked to a specific problem, but it provides a heads-up that something warrants investigation.
As empresas podem implementar a IA de maneira gradual, gerando valor-e adesão-com uma onda inicial de aplicativos e depois desenvolver essa base.
Você pode alimentar esses novos eventos de volta à IA para identificar os padrões de aviso e criar alarmes. De fato, um caso de uso intrigante para a IA é a análise forense de casos complexos: aplicar algoritmos para entender a causa raiz de um novo evento para que você possa reagir mais rápido e melhor da próxima vez. Em muitas empresas, os dados estão espalhados pela empresa - instalados em sistemas específicos e difíceis de acessar e usar para outros fins. É aqui que um
Give the Algorithms a Boost
Of course, the best data in the world won’t mean much if it can’t be pulled into the algorithms that need it. At many companies, data is scattered across the enterprise—stored within specific systems and hard to access and use for other purposes. This is where a Plataforma de dados prova inestimável: um mecanismo para armazenar e integrar informações de incidentes e desempenho, passado e presente. Vire o interruptor neste momento e é provável que você veja menos bilhetes de incidentes e uma redução de 4% a 7% nos custos de suporte de TI. Isso não é trivial, mas é frutas baixas. O verdadeiro impulso ocorre quando você também faz alterações em seu modelo operacional - mudanças que promovem
Still, algorithms and technology only get you so far. Flip the switch at this point and you’re likely to see fewer incident tickets and a 4% to 7% reduction in IT support costs. That’s not trivial but it’s low-hanging fruit. The real boost comes when you also make changes to your operating model—changes that foster Governança de dados robustos (Assim, seus dados são precisos, consistentes e disponíveis para os algoritmos que precisam), adapte papéis e processos (para que você aproveite as idéias com mais eficiência) e otimize como você trabalha com fornecedores externos (para que eles façam apenas o que precisam. Vimos empresas obter uma redução adicional de 10% a 14%, melhorando a eficiência do processo e da equipe e uma redução adicional de 6% a 9% através dos custos reduzidos do fornecedor externo. Então agora as economias gerais saltam para 20% a 30%. E isso está no topo da satisfação do usuário aumenta e o tempo todo você está retribuindo aos funcionários - dentro e fora dele - que agora estão disputando com menos incidentes. Em nosso trabalho em inteligência artificial, frequentemente falamos sobre a regra de 20/10/70: a IA é 10% sobre algoritmos, 20% sobre tecnologia e 70% sobre a transformação do processo de negócios. Para obter o benefício máximo, você precisa entender que tipo de insights os algoritmos geram. Então você precisa pensar em quais mudanças, em seus processos e organização, você pode fazer para alavancar essas idéias. Você pode alterar as responsabilidades em cada camada de suporte para que as pessoas no nível 1 tenham mais poder para resolver problemas, enquanto aqueles no nível 3-que estão responsáveis pelos aplicativos reais-gaste menos tempo no monitoramento (liberando tempo para obter mais atividades de criação de valor). Você também pode fazer ajustes menos essenciais, mas ainda altamente benéficos, como integrar os resultados da análise de ingressos em seu processo para priorizar a manutenção evolução. Isso permitiria que você alocasse mais efetivamente o financiamento e a redução, ou mesmo eliminando os debates usuais sobre onde colocar o dinheiro. Compare isso com uma abordagem abordada abrangente, onde você pode esperar dois anos por uma grande revelação. O impulso real ocorre quando você também faz alterações no seu modelo operacional.
Take these steps and the savings soar. We’ve seen companies gain an additional 10% to 14% cost reduction by improving process and team efficiency and a further 6% to 9% reduction through decreased external provider costs. So now overall savings jump to 20% to 30%. And that’s on top of user satisfaction boosts and all the time you’re giving back to employees—both within and outside IT—who are now contending with fewer incidents.
The added value that the right operating model brings isn’t headline news. In our work in artificial intelligence, we often talk about the 10/20/70 rule: AI is 10% about algorithms, 20% about technology, and 70% about business process transformation. To get the maximum benefit, you need to understand what kind of insights the algorithms generate. Then you need to think about what changes, to your processes and organization, you could make to leverage those insights.
For example, you could tweak processes so that incoming tickets, once analyzed, are steered directly to the right people. You could change the responsibilities at each support tier so that the people at level 1 are more empowered to solve problems, while those at level 3—who are in charge of the actual applications—spend less time on monitoring (freeing up time for more value-creating activities). You could also make less essential but still highly beneficial adjustments, such as integrating the results of ticket analysis into your process for prioritizing evolutive maintenance. This would let you more effectively allocate funding and shorten, or even eliminate, the usual debates over where to put the money.
Putting It All in Place
By prioritizing use cases, you can start reaping the benefits of AI quickly—in as little as three months if you know how you want to use AI and can access the relevant data. Contrast that with an all-encompassing big-bang approach, where you may wait two years for a grand unveiling.
Algorithms and technology only get you so far. The real boost comes when you also make changes to your operating model.
Enquanto isso, ao priorizar os casos de uso de alto valor, você demonstra visivelmente os benefícios da IA. Isso ajuda a criar suporte e financiamento para um esforço contínuo e para as mudanças necessárias nos processos e organização. Portanto, em vez de começar com um algoritmo e decidir que problema ele pode resolver, comece com um grande ponto de dor e decida qual algoritmo, usando quais dados pode resolvê-lo. Os casos de uso e o modelo operacional se desenvolvem em paralelo e em sincronização.
This kind of progressive approach also lets you deploy your target operating model in a gradual, value-driven way. Use cases and operating model develop in parallel and in sync.
Como tudo isso funciona na prática? Normalmente, o esforço abrange três fases:
- Ignite. Nesta fase inicial, as organizações de TI analisam seus pontos de dor e priorizam os casos de uso. Eles identificam os dados que podem aproveitar e como integrá -los à plataforma de dados (é aqui que a governança de dados robusta é essencial para garantir a disponibilidade, acesso e precisão). Ao mesmo tempo, define um modelo de operação de destino. As etapas aqui incluem a criação de um esquema de organização para suporte de nível 1, nível 2 e nível 3; descrevendo os principais processos; e examinando o modelo de fornecimento atual.
- protótipo. Em seguida, ele começa a prototipar soluções para a primeira onda de casos de uso. A idéia é testar a IA em um ambiente do mundo real para garantir que os algoritmos e novos processos funcionem conforme o esperado. Com a primeira onda de casos de uso "industrializados", ele se move para a próxima onda e repete o processo. Mas uma plataforma de dados também pode ser desenvolvida de maneira incremental, onde você constrói o que precisa para um caso de uso específico e construir mais a cada caso de uso subsequente. Os benefícios dessa plataforma vão além da IA. Com a tomada de decisão orientada a dados agora
- Incubate and industrialize. After developing a proof of concept, IT brings the AI and the processes around it to scale in order to automate the solution and realize its full potential. With the first wave of use cases “industrialized,” IT moves to the next wave and repeats the process.
A data platform is a key enabler for launching use cases, and deploying one (should it not already exist) is no trivial undertaking. But a data platform can also be developed in an incremental way, where you build what you need for a specific use case and build more with each subsequent use case. The benefits of such a platform go beyond AI. With data-driven decision making now table stakes for growth, an Arquitetura de dados integrada e escalável Deve estar na lista de tarefas de todas as empresas. Pode diminuir os custos do gerenciamento de incidentes e aumentar a resiliência. Ele faz todas essas coisas, dando -lhe clareza sobre questões de TI - e até, talvez, um pouco de clarividência. Alexandre aractingi
When deployed with the right changes to processes and organization, AI can boost the uptime of your systems and the productivity of your people. It can lower the costs of incident management and build resilience. It does all these things by giving you clarity on IT issues—and even, perhaps, a bit of clairvoyance.