ITIL Proceso de Incidentes
ITIL Proceso de Incidentes
ITIL Proceso de Incidentes
2 INCIDENT MANAGEMENT
Los tipos de incidentes que son reportados por los usuarios a través de diferentes medios o
directamente levantados por el staff técnico, son:
Fallas
Preguntas
Reporte de requerimientos
PROPOSITO DE INCIDENTES. Restaurar la operación normal del servicio tan pronto como sea
posible, minimizando el riesgo de impacto en la operación de la organización asegurando como
sea posible la calidad en los niveles de servicio y mantener la disponibilidad.
DEFINICION DE OPERACIÓN NORMAL DEL SERVICIO: Operación del Servicio dentro de los límites
del SLA.
ALCANCE (SCOPE), Se define como el límite o grado al que un Procedimiento de Proceso se aplica.
( Un procedimiento es un documento que contiene los pasos a seguir para ejecutar determinada
actividad, y un proceso contiene un conjunto estructurado de secuencia de actividades para
cumplir un objetivo)
ALCANCE DE INCIDENTES:
No todos los eventos que llegan a una mesa de ayuda son incidentes ya sea reportados por los
usuarios o levantados directamente por el staff técnico, para que este evento se clasifique como
incidente este debe estar interrumpiendo el servicio. Aquellos eventos que no interrumpen los
acuerdos de servicio son llamados Requerimientos de Servicio y son indicadores de la operación
normal o simplemente informativos. Los REQUERIMIENTOS DE SERVICIO tienen relación con el
proceso de REQUEST FULFILMENT.
(CUMPLIMIENTO DEL PETICION, Proceso responsable de administrar el Ciclo de Vida de todas las
Peticiones de Servicio).
VALOR DE LOS INCIDENTES
Estas son una de las razones por las que el Proceso de incidentes es uno de los primeros
procesos a ser implementados en proyectos de Administración de Servicio. Puede ser usado
como indicador para saber qué áreas requieren atención, como justificante para gastos en la
implementación de otros procesos.
CONCEPTOS BASICOS
a. Timescales (Calendarios): Estos deben acordarse para todas las etapas del proceso de
incidentes y dependen del nivel de prioridad del mismo. Se basan en la definición en los
acuerdos de servicio SLAs, OLAs y UCs. Adicional todos los grupos de soporte deben estar
enterados de los detalles de los mismos. Para automatizar la definición y seguimiento de
los calendarios se requiere una herramienta para realizar escalamientos automáticos en
base a reglas previamente definidas.
b. INCIDENT MODEL (incidente Módelo): Algunos incidentes no son siempre nuevos, pueden
ser eventos que han pasado y que vuelven a presentarse nuevamente. Es por eso que
resulta necesario definir un estándar de Incidentes Modelos que pueda aplicarse a
cualquier incidente que ocurra y que cumpla ese estándar. Un incidente Modelo tiene
definido claramente los pasos deben de seguirse durante el proceso. Una herramienta de
soporte permite administrar este proceso y asegurar que ese estándar pueda seguirse
bajo un calendario predefinido. Esta definición permite direccionar incidentes especiales a
otros procesos. Por ejemplo incidentes relacionados con la Seguridad pueden ser
direccionados a la Administración de Seguridad de Información.
Un incidente Modelo debe incluir:
Los pasos que deben seguirse durante el proceso
Un orden cronológico de dichos pasos, con sus dependencias o co-procesos
definidos.
Responsabilidades, quien tiene que hace que cosa.
Calendarios y umbrales para poder ejecutar las acciones
Procedimientos de escalamiento. Quien debe ser contactado y cuando
Preservar cualquier evidencia de cualquier actividad relacionada, en especial
aquellas que se involucren con la seguridad y capacidad.
Los incidentes modelos deben ser entradas para la ejecución de un incidente a través de
herramientas que permitan automatizar la ejecución, administración y escalamiento
durante el proceso.
INCIDENTES MAYORES
IMPACTO
ALTO MEDIO BAJO
URGENCIA
ALTO 1 2 3
MEDIO 2 3 4
BAJO 3 4 5
Es importante para que el staff tenga claro el nivel de prioridad a seleccionar, que se den
guías de ejemplo prácticos para que se pueda seleccionar la adecuada prioridad del caso.
El seleccionar la urgencia y el impacto adecuado que determinen la adecuada prioridad
deben estar en esas guías que deben haber generado durante los acuerdos de nivel de
servicio.
No hay que olvidar que en ocasiones estos niveles de prioridad normal deben hacerse a un
lado sobre todo cuando la organización así lo requiera o cuando un usuario es
demandante que obliga a romper los niveles de servicio establecidos, simplemente se
resuelve en la Mesa de ayuda como una petición fuera de línea de los niveles de servicio
establecidos, generalmente esto ocurre cuando el usuario esta al teléfono.
Algunas organizaciones considerar los usuarios VIP ( rangos mayores de jerarquía,
oficiales, diplomáticos, políticos, directores, gerentes, etc) En donde los incidentes deben
ejecutarse con una alta prioridad y donde el staff de la mesa de ayuda debe tener una
guía de cómo aplicar los niveles de prioridad para este grupo de personas.
Es importante resaltar que los niveles de prioridad son dinámicos dependiendo de si
circunstancias cambian, si un incidente no es resuelto dentro de los acuerdos de niveles de
servicio, de que la prioridad cambie en base a nueva situación. Este dinamismo se puede
facilitar a través del uso de una herramienta que permita calcular la prioridad adecuada en
base a la situación actual durante el ciclo del incidente, y en base a una parametrización
predefinida.
d. DIAGNOSTICO INCIAL
ECALAMIENTO FUNCIONAL, Tan pronto como quede claro para la Mesa de Servicio
que no podrá resolver el incidente por si sola y que el tiempo de los acuerdos de
niveles de servicio haya caducado, el incidente debe ser escalado.
En este sentido dentro de la organización se recomienda contar con un segundo nivel
de soporte que solucione el incidente, y siguiendo el esquema contar con un tercer
nivel de soporte en caso de que la solución no se proporcione en el segundo nivel.
Algunas veces ese tercer nivel de soporte puede involucrar terceros como
proveedores de Software, Hardware, Fabricantes o proveedores de servicio. Las reglas
de escalamiento deben estar acordadas bajo los acuerdos de servicios
correspondientes ya sea internamente con los OLAs o externamente con los UCs.
Importante señalar que siempre la Mesa de servicio es la dueña del incidente, no
importa a donde esté siendo referido, esta debe ser responsable de la ejecución del
progreso, de mantener informado a los usuarios y del cierre del incidente.
ESCALAMIENTO POR JERARQUICO, Si un incidente tiene un prioridad considerada los
encargados del TI por lo menos deben estar enterados. Adicional este tipo de
escalamiento puede ocurrir cuando se está invirtiendo demasiado tiempo en la
invirtiendo demasiado tiempo en la investigación y diagnóstico para la solución y
restauración del servicio y existen complicaciones. Importante notificar a los altos
mandos para el caso de que se requiera recursos adicionales, involucrar proveedores o
servicios de terceros. Igual se utiliza cuando no existe un avance de la persona que
tiene asignado el incidente. Todos los detalles del escalamiento deben ser registrada
en el incidente por la Mesa de Servicio. En caso de que exista otro incidente con la
misma prioridad, entre la Mesa de Servicios y el Administrador de Incidentes deben de
decidir cual incidente se deberá escalar para comenzar su solución, debemos estar
consientes de la prioridad real de la organización antes de tomar esta decisión.
e. INVESTIGACION Y DIAGNOSTICO
f. SOLUCION Y RESTAURACION
Cuando una solución potencial es detectada, esta debe ser aplicada y probada. Las
acciones específicas y las personas que deban involucrarse varían dependiendo de la
naturaleza de la falla, pero puede involucrar:
Pedirle al usuario que realice algunas acciones directamente en su equipo yo
realizarlas remotamente a través de una herramienta.
La mesa de servicio puede realizar estas acciones de manera centralizada o
remotamente a través de una herramienta de control remoto que le permita
diagnosticar e implementar dicha solución.
Pedir a grupo de especialistas la ejecución de ciertas acciones para restaurar el
servicio.
Pedir a un proveedor tercero o de mantenimiento para resolver la falla.
g. CIERRE DE INCIDENTE
La Mesa de Servicio debe verificar que el incidente ha sido resuelto completamente y que
el usuario está satisfecho y de acuerdo con que el incidente sea cerrado. Para eso la mesa
de servicio debe verificar lo siguiente:
ADMINISTRACION DE INFORMACION
METRICAS
Son usadas para monitorear y reportar y en todo caso juzgar la efectividad y eficiencia del proceso
de la administración de incidentes. Deben incluir:
Los reportes deben ser generados con la autoridad de de incidentes quien deberá determinar la
lista de las personas a las cuales se deistribuiran: Los administradores de servicio de TI, los grupos
de especialistas de soporte, igual considera tener disponible algunos para los usuarios como los de
SLA.
A. DEAFIOS
Los siguientes desafíos deben de existir para lograr una administración exitosa de
incidentes.
Posibilidad de detectar la ocurrencia de incidentes tempranamente. Educar a los
usuarios finales a reportar las fallas, utilizar los super usuarios, herramientas de
reporte de incidentes.
Convencer al staff técnico a registrar todo incidente que llega a sus manos.
Disponibilidad de información acerca de los problemas y los errores conocidos.
Aprender de incidentes pasados como tratar nuevos incidentes.
Integrar la CMS para tener presente la relaciones entre los CIs y tener como punto
de referencia el histórico en el primer punto de contacto
Integrar el proceso de SLM parta determinar el impacto y la prioridad del
incidente y realizar el proceso de escalamiento adecuado.
B. FACTORES DE ÉXITO CRITICOS
Una buena Mesa de Servicios es clave para tener éxito en la administración de
incidentes.
Definición clara de metas en base a SLAs
Integración de herramientas de administración para el control de los procesos
OLAS Y UC capaces de influir en el comportamiento adecuado del staff.
C. RIESGOS
El registro de incidentes que no puedan atenderse base el tiempo de respuesta
adecuado por no contar con los recursos o entrenamiento adecuado, por no
contar con instrumentos que nos permitan levantar alarmas del cumplimiento de
los acuerdos de nivel de servicio o que nos indiquen el continuar con el progreso
del mismo, contar con herramientas que no nos pueden proporcionar la
información adecuada en el momento adecuado por malas integraciones, errores
en los objetivos o acciones por no estar alineados o la inexistencia de OLAS o UCs.