Gerenciamento de incidentes: por que categorizar chamados no Help Desk?

Incidentes podem acontecer em qualquer local, mesmo naqueles mais bem estruturados e focados na prevenção. Um ponto bastante relevante é o que se faz quando um episódio desse tipo ocorre. Pensando mais especificamente em nossa área: por que realizar o gerenciamento de incidentes em um Help Desk é essencial?

Quando lidamos com máquinas, sistemas — seja um sistema de Help Desk, seja um sistema de Service Desk — e outras formas de tecnologia e entendemos que nosso trabalho depende em boa parte desses equipamentos, é compreensível que fiquemos ansiosos pela resolução de um incidente que afeta nosso dia a dia na empresa.

Do mesmo modo que isso pode acontecer com você, pode ser com seu colega da mesa ao lado ou com os dois simultaneamente. Por isso, ações como a categorização e o controle de chamados e o estabelecimento de rotinas para lidar com tais problemas são tão relevantes.

Neste artigo completo sobre gerenciamento de incidentes, discorreremos mais sobre essa tarefa essencialmente reativa, por que ela é tão relevante para um bom atendimento ao cliente interno e as etapas que a compreendem. Continue a leitura para saber muito mais sobre o tema!

Diferença entre problema e incidente

Antes de falarmos propriamente sobre gerenciamento de incidentes no Help Desk, é importante situarmos você, leitor, no que consiste um incidente nessa área e estabelecermos a diferença entre esse termo e problema. Frequentemente usados como sinônimos, essas palavras dizem respeito a ocorrências diferentes quando lidamos com processos de gestão. Veja:

  • incidente: acontecimento que não faz parte da operação padrão e que pode causar efeitos negativos em um serviço, como redução da sua qualidade ou até mesmo interrupção;
  • problema: causa raiz — e inicialmente desconhecida — de um ou mais incidentes.

Resumidamente, podemos dizer que um incidente cuja causa não é identificada rapidamente pode vir a tornar-se um problema.

Exemplo: um chamado foi aberto para um computador que está dando reset sozinho a todo momento. A operação foi restaurada, no entanto, a causa raiz não foi identificada. Assim, é preciso proceder com a abertura de um problema para que não somente o incidente — que é um evento — seja solucionado.

A gestão de problemas deve estar aliada à de incidentes, de modo que as informações importantes sejam coletadas e ajudem no processo decisório — tanto no presente quanto no futuro.

A sugestão de tempo gasto na resolução de incidentes e problemas deve ser, respectivamente, de 80% e 20%. Neste artigo, focaremos no gerenciamento de incidentes, porém, eventualmente, falaremos também sobre os problemas.

O que é e para que serve o gerenciamento de incidentes?

Como explicamos brevemente no tópico anterior, incidente, de acordo com a definição dada pela Information Technology Infrastructure Library (ITIL) — biblioteca de boas práticas de serviços de TI —, é a interrupção não planejada de um serviço ou a redução na sua qualidade.

Alguns exemplos básicos de incidentes são um servidor fora do ar, computadores lentos ou falta de acesso à internet. A forma de identificação desses problemas pode ser variada, e vai desde sistemas de monitoramento à abertura de chamados por parte dos colaboradores, seja de que área eles fizerem parte.

O objetivo maior do gerenciamento de incidentes é o restabelecimento de determinado serviço o mais rapidamente possível, o que minimizará o impacto negativo que esse evento possa ter causado e fará com que os colaboradores voltem às atividades o quanto antes.

É importante ter em mente que o controle de atendimento passa, também, pelos incidentes. A resolução pode ocorrer por meio de um reparo breve ou de uma solução alternativa. Faz parte das atribuições do gerenciamento desses eventos garantir os melhores níveis de qualidade e disponibilidade dos serviços prestados.

Conforme as boas práticas para gestão que estão listadas no ITIL, o processo de gerenciamento de incidentes precisa ser composto de algumas etapas. Vamos conhecer mais detalhes sobre cada uma delas?

Quais são as principais etapas do gerenciamento de incidentes e como elas funcionam?

O gerenciamento de incidentes, para ser bem estruturado, deve obedecer a uma série de etapas. A nomenclatura envolvendo esse processo também deve ser corretamente utilizada para fins de padronização e melhor entendimento sobre o que está sendo feito.

Detecção do incidente

Para que uma boa gestão de incidentes seja feita, é necessário, primeiramente, que seja reconhecida a necessidade de uma intervenção. No caso de um Help Desk, é preciso que um incidente seja identificado.

Os avisos relativos a essas detecções podem chegar a partir de diversos canais, como chat, e-mail e telefone. É interessante, portanto, que a empresa trabalhe com um sistema que integre as aberturas de chamados.

Registro

Após feitas a detecção e o aviso do incidente, é realizado o registro, de modo que o incidente não fique perdido no “limbo” e deixe de ser resolvido.

Esse registro é essencial por diversos motivos: o mais básico, claro, é a própria resolução do incidente, mas também por permitir a criação de uma base de conhecimento para consultas posteriores.

O registro também facilita a comunicação naqueles casos nos quais houver a necessidade de que o gerenciamento de um incidente passe de um setor a outro.

Classificação

Aqui, poderá haver a diferenciação entre um chamado que é, de fato, um incidente, e outro que é apenas uma requisição.

Nessa etapa, a Central do Help Desk deverá fazer a classificação do chamado. Usualmente, a prioridade não é por “ordem de chegada”, mas, sim, pela prioridade na resolução.

Os critérios para o estabelecimento dessa prioridade ficarão ao seu cargo e ao do seu time, mas o básico é pensar na urgência e no impacto — e a relação desses dois com um incidente em específico:

  • urgente: precisa ter atendimento de forma imediata;
  • impactante: pode gerar grandes riscos à empresa.

Em termos de priorização de atendimento, um incidente pode ter os seguintes graus: muito baixo, baixo, normal, alto e muito alto. Nesse momento, não é estabelecida somente a prioridade: é feita também a identificação de a qual serviço e a qual área o evento está relacionado.

Diagnóstico

O responsável pelo atendimento ao incidente deverá avaliar e entender o que ele representa. Assim, para que o diagnóstico seja feito, normalmente o colaborador consultará a Central de Serviços em busca de alguma solução para a resolução do chamado.

Atendentes do primeiro nível do Help Desk podem buscar respostas na Base de Conhecimento que citamos, alimentada, entre outras coisas, pelos registros dos incidentes anteriores.

Eles realizarão os procedimentos técnicos padrão da empresa. Poderão, inclusive, solicitar aos requisitantes dos chamados mais informações, caso entendam que aquelas já constantes não são suficientes.

Escalada

Nem sempre um evento terá sua resolução por um atendente do primeiro nível. Às vezes, o conhecimento técnico necessário para isso virá de um profissional mais especializado. Quando situações desse tipo ocorrem, elas são chamadas de escaladas no gerenciamento de incidentes.

Resolução

Deu para perceber como diversos passos são tomados antes que a resolução, de fato, seja alcançada. No entanto, todos eles, embora a princípio possam parecer atrasar todo o processo, visam à otimização desse gerenciamento, evitando, por exemplo, que chamados se acumulem, passem na frente um do outro ou sejam atendidos pelo setor errado.

Tudo isso colocado “na ponta do papel” afeta drasticamente a organização da gestão desses incidentes e, como consequência, as rotinas da empresa.

Fechamento do incidente

Após resolvido, o incidente precisa ter seu fechamento consolidado. Todas as informações coletadas durante todo o processo de tal incidente devem ser exportadas para a Base de Conhecimento.

Monitoramento

Alguns tipos de incidentes requerem monitoramento. Assim, o colaborador poderá identificar em qual etapa do processo o chamado está, quais providências estão sendo tomadas e uma previsão de tempo para a solução.

Essa possibilidade de acompanhamento é boa tanto para o responsável pela resolução quanto para quem realizou a abertura do chamado.

Para o primeiro, significa que ele não necessitará responder a eventuais perguntas relativas ao incidente, sendo que a informação está facilmente disponível. Já o segundo poderá acessar informações de maneira mais independente. O monitoramento também pode ser feito a qualquer momento pelo gestor.

Por que aplicar o gerenciamento de incidentes no Help Desk?

Já vimos uma série de motivos pelos quais você deve fazer do gerenciamento de incidentes uma prioridade no Help Desk da sua empresa. Por meio de uma ferramenta apropriada, é possível identificar mais facilmente esses acontecimentos e solucioná-los, uma vez que ela permitirá a visualização de toda a infraestrutura da empresa, oferecendo uma visão panorâmica do que ocorre.

Listamos, abaixo, alguns dos principais benefícios advindos dessa aplicação:

  • agilidade na resolução dos incidentes;
  • automatização de processos;
  • centralização das operações;
  • facilitação para análise de tendências;
  • redução do tempo médio para resolução de incidentes;
  • reconhecimento de pontos infra estruturais necessários para o desenvolvimento da empresa;
  • maior transparência na gestão;
  • melhoria dos serviços.

Muito pode ser conquistado com um correto gerenciamento de incidentes por meio da categorização de chamados no seu Help Desk.

Como implementar o gerenciamento de incidentes no Help Desk?

Pensando nas etapas que descrevemos, vamos abordar agora como deve ser feita a implementação do gerenciamento de incidentes no seu Help Desk, destrinchando um pouco mais sobre elas.

Documente modelos de atendimento

Um dos passos descritos anteriormente tem relação com o registro e a categorização dos incidentes. Ao pensar na adoção da gestão adequada, essa deve ser uma das preocupações primordiais do gestor. Do contrário, será uma espécie de desperdício de tempo e trabalho não documentar esses processos e estabelecer modelos de atendimento.

Alguns tipos de incidentes podem ser recorrentes, o que poderia caracterizar, inclusive, um problema. No entanto, eles só serão corretamente e mais rapidamente solucionados caso haja essa documentação, que alimentará a Base de Conhecimento dos colaboradores responsáveis.

É preciso, além da documentação de modelos de atendimento, estabelecer os canais de entrada e o que cada um deles poderá receber em termos de abertura de chamados. Alguns exemplos que já demos foram contatos telefônicos dos colaboradores, abertura de chamados por meio de um sistema de gestão, envio de e-mails e cadastro presencial.

É importante ter em mente o seguinte: quanto maior for a oferta de canais, mais complexa será a administração desses chamados. Por isso, deve-se contar com uma ferramenta com recursos diversos e determinar formas de sistematização.

Classifique os incidentes com a real prioridade

Nesse momento, um procedimento que pode ser feito é o estabelecimento de graus de prioridade em espécies de tabelas, que deve estar disponível para todos os colaboradores, não somente para os responsáveis pelo gerenciamento de incidentes, de modo que todos os envolvidos possam acompanhar o fluxo de atendimento do chamado.

A partir disso, pode ser criada uma matriz com base em serviços, setores e outros parâmetros considerados relevantes para o estabelecimento das prioridades e criado um catálogo de serviços, documento determinante para o gerenciamento dos chamados e definição do Service Level Agreement (SLA).

O SLA também é conhecido como Acordo de Nível de Serviço. Basicamente, no caso de um Help Desk, é um compromisso assumido pelos colaboradores da TI perante os demais colaboradores de procedimentos que serão feitos diante de diferentes cenários.

É interessante criar uma cultura entre todos, de modo que os requisitantes entendam que nem sempre suas próprias demandas serão prioritárias e o que atendimento a todas simultaneamente não é algo possível.

O estabelecimento desses níveis de criticidade, que determinarão a ordem das soluções, deve ser pensado em conjunto. Colaboradores da TI trarão suas contribuições, bem como os administradores, pensando no que engloba os pontos de urgência e impacto sobre os quais falamos.

Alguns pontos essenciais são quantos usuários ou sistemas são afetados diretamente por um incidente, pois pode ser que o impacto não se dê apenas no usuário requisitante e na máquina usada por ele.

Além disso, é preciso pensar no tipo de impacto, pois, mesmo que um incidente atinja um número maior de máquinas ou pessoas, pode ser que ele não seja o mais impactante em termos de danos causados.

Outras condições a serem consideradas são as chamadas variáveis críticas. Elas devem considerar alguns parâmetros, como: houve interrupção de vendas ou prestação de serviços em função de determinado incidente? Ele afetará o faturamento? Quantos e quais funcionários serão afetados? Essas são algumas das perguntas que devem ser respondidas para que as variáveis críticas sejam estabelecidas.

O cenário, que é a análise das possíveis combinações de variáveis críticas, também deve ser levado em conta. Como podemos perceber, tudo o que envolve o gerenciamento de incidentes é complexo e, por isso mesmo, precisa ser bem destrinchado.

Cada empresa tem suas especificidades. Sendo assim, não é indicado seguir padrões, mesmo aqueles já adotados universalmente, sem que antes eles sejam analisados de acordo com a sua realidade. Assim, mudanças podem ser feitas, tanto para a adição quanto para a remoção de critérios e até mesmo para adaptação.

Analise as causas dos incidentes de TI

A seguir, listaremos as origens mais comuns de vulnerabilidades. A partir da análise dessas origens, é possível pensar em mecanismos de solução de incidentes mais imediatos. Veja:

  • phishing — tentativas de obtenção de informação pessoalmente identificável por meio de e-mail com links clicáveis e outras formas;
  • escolha de senhas fracas;
  • uso de dispositivos infectados nas máquinas, como pendrives e HDs;
  • conexão insegura;
  • infraestrutura de TI exposta a ataques.

É importante que não somente a solução para incidentes seja pensada, alternativas para a diminuição e repetições também são importantes.

Como dissemos lá no início do texto, mesmo em ambientes bem estruturados, é possível que incidentes ocorram. Sendo assim, é preciso trabalhar concomitantemente em dois caminhos: resolução e prevenção. Assim, as chances de que incidentes cheguem a se tornar problemas serão reduzidas.

As consequências positivas vindas disso são muitas, e uma das principais é que a equipe de TI, normalmente já muito requisitada, não será acionada com tanta frequência para atender a chamados sempre pelos mesmos motivos.

Um ponto importante aqui é incluir indicadores de desempenho que avaliem eventos classificados incorretamente como incidentes, pois isso pode ajudar os times em futuras ocorrências.

Escolha ferramentas adequadas para o gerenciamento de incidentes de TI

Em um setor cujo trabalho é pautado e evoluído com a ajuda de ferramentas de Help Desk, é fundamental contar com sistemas que potencializam o gerenciamento de incidentes.

Abaixo, citaremos alguns frameworks — espécies de conjuntos de bibliotecas e componentes a partir dos quais uma base é construída. Veja:

  • Control Objectives for Information and Related Technologies (COBIT): de propriedade da Information Systems Audit and Control Association (ISACA), o COBIT é formado por ferramentas e modelos analíticos desenvolvidos para governança e gerenciamento de incidentes de TI;
  • Information Technology Infrastructure Library (ITIL): comentamos brevemente sobre a metodologia ITIL e como muitos das etapas envolvidas, não só no gerenciamento de incidentes, mas, também, no gerenciamento de serviços, são originárias dessa biblioteca de boas práticas. Ela compreende as práticas de prototipação, implementação, transição, operacionalização e melhoria continuada a diferentes tecnologias;
  • Factor Analysis of Information Risk (FAIR): esse é um framework, também de propriedade privada, que contribui para a mensuração e análise da criticidade dos aspectos que envolvem a segurança da informação e os riscos operacionais. O FAIR pode fornecer base e estrutura para fortificar alguns processos já consolidados. Assim, pode complementar frameworks como o COBIT e o ITIL;
  • Known Error Database (KEDB): conhecido em português como Banco de Dados de Erros, esse framework é usado no diagnóstico de incidentes. O KEDB identifica quaisquer problemas ou erros já documentados e que causaram incidentes no passado. A partir disso, oferece soluções alternativas que já tenham sido identificadas.

Alguns termos a ter em mente

Chegamos ao final deste artigo e, para retomar o conteúdo visto e ajudar você a memorizá-lo e a pensar mais sobre o tema, vamos listar alguns dos principais termos envolvendo o gerenciamento de incidentes — alguns deles já citados, outros não. São eles:

  • carga de trabalho: o tempo e/ou o esforço gastos na resolução de um incidente, integralmente ou em parte dele;
  • prioridade: geralmente, é medida com base na urgência e no impacto sobre o negócio;
  • classificação e suporte inicial: é preciso classificar, fazer comparações e estabelecer prioridades para fornecer suporte inicial;
  • detecção de incidentes e registros: momento inicial, no qual são registradas informações básicas sobre o incidente;
  • escalada: recurso por meio do qual um incidente é destinado ao setor e ao nível de atendimento corretos para sua resolução;
  • esforço esperado: quantidade de esforço empregada para restaurar o serviço impactado pelo incidente;
  • fechamento do incidente: momento de verificar junto ao colaborador requisitante se o chamado foi atendido e devidamente resolvido e a comunicação do fechamento do incidente e seu registro no local apropriado;
  • funcional: quando um chamado é escalonado para um segundo nível de atendimento;
  • hierárquico: quando existir possibilidade de que o chamado não seja atendido no prazo inicialmente estabelecido;
  • impacto: grau em que o fornecimento de um serviço é interrompido;
  • incidente: interrupção não planejada de um serviço ou a redução na sua qualidade;
  • investigação e diagnóstico: avaliação de todos os detalhes envolvidos no incidente e solução de contorno;
  • posição no fluxo de trabalho: qual é o status do incidente, algo que reflete sua situação atual no ciclo de vida;
  • requisição de serviços: categoria na qual não são provocadas interrupções ou falhas na infraestrutura de TI;
  • resolução e recuperação: momento da resolução do incidente e de ações corretivas;
  • urgência: prioridade para resolução do incidente.

Diante de tudo o que vimos ao longo deste texto, acreditamos ter ficado claro que a gestão de incidentes de TI é uma etapa essencial para a identificação de eventos, o reconhecimento e a resolução de problemas e, como consequência, a criação de processos internos mais eficientes.

Qualquer Help Desk pode ser beneficiado por esse tipo de gestão. Contudo, isso só será possível quando as melhores práticas são aplicadas e atribuídas aos colaboradores adequados.

Esperamos que tenha chegado ao final deste artigo com o pensamento de implementar o gerenciamento de incidentes em sua empresa e, caso já existente, de uma preocupação constante com o desenvolvimento desse gerenciamento. Quanto mais eficientes forem as ações envolvidas nesse processo, mais você terá excelência em atendimento.

Convidamos você a deixar sua contribuição no campo de comentários: ficou com alguma dúvida? Tem algum relato para dividir? Não deixe de participar e ajude-nos a enriquecer o conteúdo.

Receba os melhores conteúdos sobre atendimento

Sobre o autor

Deixar uma resposta