El monitoreo del centro de datos utiliza una combinación de herramientas, sistemas, software y soluciones para vigilar de cerca los aspectos ambientales, energéticos, de hardware de TI y de seguridad de una instalación informática. Depender únicamente de la supuesta confiabilidad y rendimiento de un centro de datos es optimista. En realidad, lograr y mantener un tiempo de actividad del 99,999 % (lo que se conoce como “cinco nueves”) exige un enfoque metódico y orientado a los procesos.
El monitoreo del centro de datos implica el seguimiento de los aspectos operativos, incluido el tiempo de actividad, el rendimiento y las condiciones ambientales de un centro de datos, utilizando herramientas y sensores. Supervisa factores como la temperatura, la humedad y el uso de energía, y emite alertas cuando estos elementos se desvían de los umbrales establecidos.
¿Tiene curiosidad por saber qué se monitorea exactamente en un centro de datos y por qué es tan crucial? Continúe leyendo para explorar los diferentes componentes que la industria de los centros de datos vigila, desde la temperatura y el flujo de aire hasta la energía y las amenazas a la seguridad. También exploramos las herramientas y sistemas que hacen posible el monitoreo del centro de datos, incluidos sensores, protocolos de comunicación y software de gestión.
¿Qué es la supervisión del centro de datos?
El monitoreo del centro de datos es el proceso de supervisar y administrar el tiempo de actividad, la confiabilidad, el rendimiento, las condiciones ambientales y la seguridad de un centro de datos. Este proceso utiliza una variedad de herramientas, sistemas y sensores para recopilar y rastrear continuamente datos relacionados con el estado de los servidores, dispositivos de almacenamiento, equipos de red, así como suministro de energía, sistemas de enfriamiento y medidas de seguridad.

Este monitoreo cubre factores específicos como la temperatura, la humedad, el flujo de aire, el consumo de energía, la eficiencia de los sistemas de enfriamiento, el rendimiento del servidor, la utilización del almacenamiento, los niveles de tráfico de la red y los sistemas de control de acceso. Además, los sistemas de monitoreo de centros de datos están diseñados para emitir alertas y notificaciones si las mediciones exceden o caen por debajo de umbrales predeterminados.
Al monitorear estos elementos, los operadores de centros de datos, gerentes de TI, administradores de redes, profesionales de seguridad, ingenieros de sistemas, administradores de instalaciones, equipos de finanzas y contabilidad, ejecutivos corporativos y clientes de centros de datos pueden detectar y abordar problemas potenciales desde el principio. Este enfoque proactivo ayuda a evitar el tiempo de inactividad, la degradación del rendimiento, la pérdida de datos y las vulnerabilidades de seguridad.
Componentes monitoreados en un centro de datos
![]()
Monitorear un centro de datos implica realizar un seguimiento de los siguientes componentes clave:
- Hardware de TI:
- Servidores: métricas de rendimiento como procesamiento (CPU, GPU, memoria), uso del disco y temperatura.
- Dispositivos de almacenamiento: niveles de utilización, velocidades de lectura/escritura y estado de salud
- Equipos de red: enrutadores, conmutadores y firewalls para rendimiento, latencia y tasas de error
- Condiciones ambientales:
- Temperatura: Mantenga un ambiente fresco para evitar el sobrecalentamiento.
- Humedad: Controle la humedad para evitar daños al equipo
- Flujo de aire: controle la circulación adecuada y la eficiencia de refrigeración
- Energía y refrigeración:
- Sistemas de alimentación ininterrumpida (UPS): estado de la batería, potencia de salida
- Unidades de distribución de energía (PDU): entrega de energía a racks y servidores
- Generadores de respaldo: niveles de combustible, estado operativo y eficiencia.
- Sistemas de refrigeración: acondicionadores de aire, unidades de tratamiento de aire, eficacia del flujo de aire.
- Seguridad Física:
- Cámaras de vigilancia: monitorea la actividad dentro de las instalaciones y el acceso no autorizado.
- Sistemas de control de acceso: requieren el uso de tarjetas de acceso o datos biométricos para otorgar acceso
- Acceso a la puerta: realice un seguimiento de las entradas y salidas, así como del estado de las cerraduras.
El monitoreo en un centro de datos puede variar desde una vista macro de todo el espacio hasta una microperspectiva que se centra en racks individuales, gabinetes e incluso salidas específicas en una PDU, lo que brinda una supervisión integral.
Importancia del monitoreo del centro de datos
El monitoreo del centro de datos es una tarea que funciona las 24 horas del día, los 7 días de la semana, crucial para el seguimiento en tiempo real del tiempo de actividad, la confiabilidad, el rendimiento, la seguridad y más.

Estas son las razones más importantes para monitorear el centro de datos:
- Tiempo de actividad y confiabilidad: El monitoreo continuo ayuda a identificar y resolver de manera proactiva problemas potenciales antes de que se conviertan en interrupciones o tiempo de inactividad del sistema. Al seguir cerca las fallas de hardware, las fallas de software y los problemas de conectividad de la red a través de encuestas de estado, alertas basadas en umbrales y notificaciones, las organizaciones pueden garantizar que sus centros de datos sigan siendo altamente disponibles y confiables. Esta vigilancia es crucial para evitar interrupciones del servicio que podrían afectar las operaciones comerciales y para cumplir con los objetivos del acuerdo de nivel de servicio (SLA).
- Optimización del rendimiento: Las herramientas de monitoreo del centro de datos ofrecen información valiosa sobre el rendimiento de servidores, sistemas de almacenamiento, equipos de red y aplicaciones. Estos conocimientos ayudan a identificar cuellos de botella e ineficiencias, lo que permite una asignación optimizada de recursos, un equilibrio de carga efectiva y actualizaciones oportunas de la infraestructura, con el objetivo final de mejorar el rendimiento del sistema.
- Gestión de costos: Las herramientas de monitoreo del centro de datos ayudan a detectar recursos infrautilizados e ineficiencias, lo que permite la reasignación o reducción de recursos para reducir los gastos operativos. La identificación de servidores “zombis” (aquellos que consumen energía sin realizar ninguna tarea útil) permite su desmantelamiento a favor de hardware más eficiente energéticamente, reduciendo así el consumo y los costos de energía.
- Condiciones ambientales: Monitorear las condiciones ambientales dentro de un centro de datos, como la temperatura, la humedad y el flujo de aire, es crucial para evitar daños y fallas en el hardware debido al calor o la humedad excesivas. Dicho monitoreo no solo prolonga la vida útil del hardware, sino que también ayuda a que las operaciones del centro de datos se mantengan dentro de los parámetros ambientales óptimos, como los niveles específicos de eficacia del uso de energía (PUE). Por ejemplo, eliminar los problemas de sobreenfriamiento y abordar los puntos críticos son formas comunes de mejorar la eficiencia energética.
- Planificación de capacidad y escalabilidad: El monitoreo del centro de datos proporciona información sobre la utilización de recursos, las limitaciones del sistema y las necesidades futuras, que son cruciales para una planificación de capacidad y escalabilidad efectivas. Al analizar tendencias y patrones de uso, las organizaciones pueden escalar estratégicamente los recursos de computación, almacenamiento y redes para satisfacer la demanda, garantizando que el centro de datos respalde el crecimiento empresarial sin aprovisionamiento excesivo ni creación de limitaciones de capacidad.
- Seguridad y cumplimiento: Monitorear el acceso y la actividad dentro de un centro de datos es crucial para detectar accesos no autorizados, violaciones de datos y amenazas de ciberseguridad. También desempeña un papel importante en el mantenimiento del cumplimiento de las regulaciones y estándares de la industria, ofreciendo pistas de auditoría detalladas, registros y registros de acceso a datos y modificaciones del sistema.
Tipos de monitoreo del centro de datos
El monitoreo del centro de datos abarca varias áreas clave: monitoreo ambiental, monitoreo de energía, monitoreo de hardware y monitoreo de seguridad. A continuación se muestra un examen detallado de cada uno:
1. Monitoreo Ambiental
El monitoreo ambiental rastrea las condiciones físicas dentro de un centro de datos, incluyendo la temperatura, la humedad, el flujo de aire, las fugas de agua, el humo y las vibraciones. Implica desplegar numerosos sensores en toda la instalación para monitorear continuamente estos parámetros. Se emiten alertas y notificaciones si alguna medición excede o cae por debajo de los umbrales predeterminados. Este proceso es esencial para prevenir daños al hardware, mantener condiciones operativas óptimas y evitar interrupciones inesperadas.

Los componentes del monitoreo ambiental del centro de datos incluyen:
Temperatura
Las herramientas de monitoreo del centro de datos rastrean umbrales operativos predefinidos para la temperatura midiendo tanto el ambiente como las temperaturas de equipos específicos. Estos umbrales son cruciales porque las altas temperaturas pueden provocar la formación de puntos de acceso alrededor de los racks, lo que podría dañar los servidores alojados en ellos. Por el contrario, las bajas temperaturas pueden aumentar el riesgo de condensación, lo que plantea peligros adicionales.
Para mitigar estos riesgos, se utilizan sensores de temperatura en los centros de datos para rastrear los cambios en la temperatura ambiente. ASHRAE, una organización centrada en sistemas de construcción y eficiencia energética, recomienda mantener el hardware operativo dentro del rango de temperatura de 64 °F (18 °C) a 81 °F (27 °C). Este rango ayuda a evitar la degradación del rendimiento o el apagado completo del hardware.
Para un monitoreo eficaz, la ubicación estratégica de sensores de temperatura en todo el centro de datos es fundamental. Estos sensores se colocan en varios lugares, incluidos bastidores y rejillas de ventilación del aire acondicionado, para evaluar la eficiencia del sistema de enfriamiento y facilitar la detección temprana de problemas relacionados con la temperatura. En concreto, esta estrategia de colocación implica:
- Delante de los racks (en el pasillo frío) para medir las temperaturas de entrada
- Detrás de las rejillas (en el pasillo caliente) para medir las temperaturas de escape.
- Cerca de unidades de aire acondicionado para monitorear la temperatura del aire de suministro.
- En varios puntos de la sala de ordenadores para evaluar la temperatura ambiente general.
Humedad
El monitoreo de la humedad en los centros de datos es crucial para mantener condiciones operativas óptimas y prevenir fallas en los equipos. Este proceso es posible mediante higrómetros, un tipo de sensor, que mide el contenido de humedad del aire.
ASHRAE sugiere que la humedad relativa en los centros de datos debería rondar el 60%, con niveles aceptables que oscilan entre el 20% y el 80%. En otras palabras, es importante mantener la humedad relativa dentro de estos límites seguros para evitar los riesgos asociados con condiciones extremas. Específicamente, una humedad relativa superior al 90 % puede provocar condensación y corrosión, mientras que niveles inferiores al 10% aumentan la probabilidad de descarga electrostática.
Mantener la humedad relativa dentro de estos parámetros recomendados es vital para prevenir daños al hardware, minimizar el riesgo de fallas del equipo y evitar los costos significativos asociados con el tiempo de inactividad.
flujo de aire
El flujo de aire dentro de los centros de datos se monitorea mediante el uso de sensores y dispositivos que miden la velocidad, la temperatura y la presión del aire. Este monitoreo es crucial para brindar un enfriamiento óptimo en todos los equipos del centro de datos, reduciendo así la formación de puntos de acceso.

Estos sensores están ubicados en numerosas ubicaciones en todo el centro de datos para permitir un monitoreo integral. Las ubicaciones clave incluyen áreas de contención, puntos de transferencia de aire, plenos, puntos de suministro y salida de HVAC, espacios de techo y directamente dentro de racks y gabinetes. Por ejemplo, los sensores de presión diferencial de aire se instalan combinados en la parte superior e inferior de los estantes, entre pasillos, entre lasetas perforadas de pisos elevados y dentro de las rejillas de ventilación y las cámaras de aire.
La medición del flujo de aire en los centros de datos normalmente emplea pies cúbicos por minuto (CFM) para cuantificar el volumen de aire que circula y metros por segundo (m/s) para medir la velocidad del movimiento del aire. El objetivo principal de monitorear el flujo de aire es satisfacer las necesidades de enfriamiento de los componentes internos de los equipos de TI, evitando así el sobrecalentamiento, el desarrollo de puntos calientes y el riesgo de fuga térmica.
fuga de agua
Las fugas de agua en los centros de datos generalmente se monitorean instalando sensores de humedad en áreas clave, como debajo de pisos elevados y debajo de tuberías. Esta ubicación permite la detección temprana de fugas dentro de los sistemas de tuberías o incidentes de inundaciones, los cuales pueden dañar gravemente los activos de hardware y provocar interrupciones. Varios factores, incluidas fugas de aire acondicionado, condensación, tuberías rotas o fallas de plomería locales, pueden causar fugas de agua en los centros de datos.
fumar
Los detectores de humo en los centros de datos suelen utilizar tecnología óptica o de ionización para detectar partículas de humo en el aire, lo que activa alarmas cuando la concentración de humo excede los umbrales predeterminados. La presencia de humo en un centro de datos plantea riesgos importantes, incluidos posibles daños al personal que trabaja en las instalaciones y daños físicos al hardware debido a su naturaleza corrosiva y conductora. Además, el humo puede obstruir los filtros de aire, reducir el flujo de aire y contaminar los sistemas de refrigeración, lo que en última instancia provoca interrupciones operativas y tiempo de inactividad.
Vibración
La vibración generalmente se monitorea mediante acelerómetros o sensores de vibración, que miden tanto la frecuencia como la amplitud de las vibraciones. En los centros de datos, los equipos más comúnmente monitoreados para detectar vibraciones incluyen placas, gabinetes, unidades de disco duro (HDD), sistemas de enfriamiento (como ventiladores, compresores y bombas), unidades de suministro de energía (PSU) y generadores de respaldo.
Por ejemplo, las vibraciones dentro de un centro de datos pueden, con el tiempo, dañar potencialmente las unidades de disco duro (HDD), provocando pérdida o corrupción de datos, así como mayores costos por tener que reemplazar las unidades dañadas. Por lo tanto, es importante monitorear cerca de marcas y modelos específicos de HDD que se sabe que tienen una mayor probabilidad de fallar debido a vibraciones.
2. Monitoreo de energía
El monitoreo de energía es el seguimiento y análisis del uso, la distribución y la eficiencia de la energía eléctrica para ayudar a identificar áreas de alto consumo de energía y posibles desequilibrios, lo que permite optimizar el uso de energía y tomar medidas proactivas contra cortes. Utiliza medidores de energía y sensores para rastrear el consumo de energía de dispositivos de TI individuales, componentes de energía específicos, racks y gabinetes completos, salas de computadoras y el medidor general de las instalaciones del centro de datos.

Los componentes de energía comunes monitoreados en los centros de datos incluyen:
- Sistemas de Alimentación Ininterrumpida (UPS), incluidos sus sistemas de baterías.
- Unidades de distribución de energía (PDU)
- Generadores de respaldo
- Conmutadores de Transferencia Automática (ATS)
- Circuitos derivados
- Vías de autobús
- Paneles de energía remota (RPP)

Fuente: Google. Conmutadores de transferencia automática (ATS) en el centro de datos de Singapur.
Monitoreo del sistema de alimentación ininterrumpida (UPS)
El monitoreo del sistema de alimentación ininterrumpida (UPS) implica realizar un seguimiento continuo del rendimiento, el estado de la batería y la capacidad de carga de los sistemas UPS para garantizar una entrega de energía constante e identificar posibles problemas de energía de la red pública. Las unidades UPS individuales a menudo vienen equipadas con sistemas de monitoreo interno.
Los sistemas de monitoreo de UPS están diseñados para rastrear e informar sobre diversos parámetros operativos, como:
- Nivel de tensión de entrada procedente de la red pública.
- Nivel de voltaje de salida que se suministra al equipo conectado
- Voltaje del banco de baterías (voltaje de cadena)
- Nivel de carga restante en las baterías del UPS
- Cantidad de tiempo que el UPS puede funcionar con energía de la batería (tiempo de ejecución estimado)
- Temperatura interna del UPS
Este monitoreo es crucial para mantener la confiabilidad y efectividad de los sistemas UPS, que se utilizan para proporcionar energía de emergencia a los dispositivos cuando falla la fuente de energía principal, además de ofrecer cierto nivel de protección contra caídas de voltaje significativas.
Monitoreo de la unidad de distribución de energía (PDU)
El monitoreo de la unidad de distribución de energía (PDU) es el seguimiento y análisis en tiempo real de las métricas de distribución y consumo de energía eléctrica a nivel de tomacorriente, lo que permite la detección temprana de posibles problemas de energía y una mejor asignación de recursos. Dentro de un centro de datos, las PDU se implementan combinadas en dos configuraciones específicas: PDU de rack y PDU de piso, las cuales se pueden monitorear.
Los sistemas de monitoreo de PDU están diseñados para rastrear e informar sobre diversos parámetros operativos, como:
- Nivel de voltaje de entrada proveniente de la fuente de energía, generalmente la red pública o un sistema UPS
- Nivel de voltaje de salida que se suministra al equipo conectado
- Consumo de corriente de dispositivos individuales en cada toma de corriente en amperios
- Consumo total de corriente de todos los dispositivos, bastidores y gabinetes conectados a la PDU en amperios
- Consumo de energía del equipo conectado a la PDU en vatios
- Consumo de energía utilizada en el tiempo por el equipo en kilovatios-hora (kWh)
- Estado de cada toma (encendido/apagado)
Este monitoreo es importante para una gestión eficiente de la energía y prevenir tiempos de inactividad debido a fallas eléctricas.
Monitoreo de la calidad de la energía (PQM)
El monitoreo de la calidad de la energía (PQM) es el proceso de analizar constante y continuamente el estado y la estabilidad del suministro eléctrico para proteger los equipos de anomalías de energía y mejorar la confiabilidad del sistema.

PQM se basa en componentes de hardware y software para rastrear específicamente parámetros de calidad como:
- Tensión: Diferencia de potencial eléctrico entre dos puntos
- Corriente: Flujo de carga eléctrica a través de un conductor
- Frecuencia: Número de ciclos completos por segundo en corriente alterna
- Factor de potencia: Eficiencia del uso de energía; Relación entre la potencia real y la potencia aparente en un circuito.
- Potencia Reactiva: Potencia que oscila entre fuente y carga, no utilizada para trabajo
- Armónicos: Distorsiones en la forma de onda de la fuente de alimentación de CA
- Transitorios: picos o caídas de voltaje repentinos y de corta duración que se desvían de los niveles de voltaje normales
- Corriente de Tierra: Corriente que fluye por el suelo en sistemas eléctricos
El monitoreo de estos factores de calidad de la energía ayuda a facilitar una entrega de energía eficiente y confiable, garantizando que el suministro de energía se mantenga dentro de los umbrales aceptables para los equipos del centro de datos.
3. Monitoreo de hardware
El monitoreo de hardware rastrea el estado y la salud de los equipos de TI dentro del centro de datos, incluidos servidores, sistemas de almacenamiento y equipos de red. Supervise fallos de hardware, errores de software, limitaciones de capacidad y problemas de rendimiento, lo que permite una detección temprana y una rápida resolución de problemas para evitar el tiempo de inactividad.

Los fabricantes de equipos de TI suelen incorporar sensores y controladores en sus productos. Estos componentes permiten el monitoreo directo de una amplia gama de métricas desde el procesador del equipo. Las métricas clave incluyen el consumo de energía, los niveles de temperatura, el flujo de aire y la utilización de recursos, que cubren las operaciones de CPU, memoria y E/S (entrada/salida).
Monitoreo del servidor
La supervisión del servidor es el proceso de observar continuamente los recursos del sistema de un servidor, como el uso de la CPU, la utilización de la memoria, las operaciones de entrada/salida (E/S), el tráfico de la red y el rendimiento de las aplicaciones para garantizar un funcionamiento y un tiempo de actividad óptimos. Supervise específicamente el estado y el rendimiento de servidores físicos y máquinas virtuales (VM), generando alertas y notificaciones para problemas como fallas de hardware o saturación de recursos.
Los beneficios claves de la supervisión del servidor incluyen:
- Identificación proactiva de problemas: Identifique problemas potenciales (por ejemplo, cuellos de botella en el rendimiento, agotamiento del espacio en disco) antes de que causen tiempo de inactividad o afecten la experiencia del usuario.
- Mejorar la utilización de recursos: Mejore la eficiencia identificando servidores sobrecargados o subutilizados, facilitando ajustes de asignación de recursos para optimizar el rendimiento, lo que conduce a ahorros de costos.
Monitoreo de almacenamiento
El monitoreo del almacenamiento es la supervisión y el análisis continuo de los recursos de almacenamiento de un centro de datos para ofrecer un rendimiento, una gestión de la capacidad y una integridad de los datos óptimas. Observe dispositivos como unidades de disco duro (HDD), unidades de estado sólido (SSD) y unidades de cinta, así como diferentes configuraciones de almacenamiento, como redes de área de almacenamiento (SAN) y almacenamiento conectado a la red (NAS).
Monitoreo de red
El monitoreo de la red es el proceso de observar continuamente el rendimiento, el estado y la disponibilidad de una red del centro de datos para ayudar a identificar cuellos de botella, degradación del rendimiento y posibles violaciones de seguridad dentro de la red. Supervisa específicamente dispositivos como conmutadores, enrutadores, firewalls y equilibradores de carga, así como el tráfico y el rendimiento general de la red. Estas soluciones de monitoreo también ayudan a rastrear todas las rutas de red que conducen hacia y desde el centro de datos.
4. Monitoreo de seguridad
El monitoreo de seguridad se dedica a proteger los activos del centro de datos contra accesos no autorizados y amenazas cibernéticas. Incluye monitorear intrusiones, vulnerabilidades, malware y garantizar el cumplimiento de políticas y estándares de seguridad.

- Monitoreo de Seguridad Física: Implica la vigilancia y control del entorno físico del centro de datos para evitar el acceso físico no autorizado, robo o daño a los activos de hardware. Las técnicas incluyen el uso de cámaras de vigilancia, guardias de seguridad, sistemas de control de acceso (como tarjetas de acceso o escáneres biométricos) y sensores de cierre de contactos en las puertas de los gabinetes.
- Monitoreo de ciberseguridad: Se centra en proteger los activos digitales del centro de datos de amenazas cibernéticas como piratería informática, malware y phishing mediante el escaneo continuo en busca de vulnerabilidades e infracciones.
- Monitoreo de seguridad de la red: Implica el análisis continuo del tráfico y los registros de la red para detectar y responder a amenazas o actividades inusuales que podrían indicar una violación de la seguridad o un intento de ataque a la infraestructura de la red.
Herramientas y sistemas en monitoreo de centros de datos.
Las herramientas y sistemas de monitoreo del centro de datos agregan diversos conjuntos de datos de varios subsistemas en un repositorio de administración unificado y una interfaz gráfica de usuario, lo que mejora la visibilidad de métricas de desempeño únicas, desperdicio de instalaciones y problemas operativos. Estas herramientas y sistemas transforman lo que de otro modo sería un proceso intensivo en mano de obra (que requiere inspecciones físicas de diferentes equipos e infraestructura) en una operación más eficiente y optimizada.

Estas herramientas y sistemas de monitoreo de centros de datos comprenden componentes de hardware y software:
Sensores
Los sensores sirven como componentes de monitoreo fundamentales, esenciales para recopilar datos sobre las condiciones ambientales dentro de un centro de datos, lo cual es vital para comprender el rendimiento del equipo y tomar acciones preventivas para evitar daños. Realice un seguimiento de diversas condiciones físicas, incluida la temperatura, la humedad, el flujo de aire, las fugas de agua, el humo y la vibración. Normalmente, la recopilación de datos implica sondear el equipo dentro de un centro de datos varias veces por hora para recopilar esta información.
Para los sensores se utilizan conexiones inalámbricas y cableadas, pero la elección entre ellas depende de varios factores, como el tipo de sensor, su ubicación dentro del centro de datos, la importancia de los datos que se monitorean y los requisitos específicos de velocidad, confiabilidad, seguridad y costo. TCP/IP facilita la comunicación entre sensores y sistemas de monitoreo en centros de datos, tanto a través de conexiones cableadas como inalámbricas.
Protocolos de comunicación
Los protocolos de comunicación más comunes utilizados para el monitoreo de centros de datos son:
- Protocolo simple de administración de red (SNMP): SNMP se utiliza para recopilar y organizar información sobre dispositivos administrados en redes IP y modificar esa información para cambiar el comportamiento del dispositivo.
- Modbus: Un protocolo de comunicación en serie utilizado principalmente para conectar dispositivos electrónicos industriales.
- Protocolo seguro de transferencia de hipertexto (HTTPS): Permite el acceso a interfaces de administración de dispositivos basados en web. Se utiliza para recuperar datos a los que es posible que no se pueda acceder fácilmente a través de SNMP o Modbus.
Gestión de infraestructura del centro de datos (DCIM)
El software de gestión de infraestructura del centro de datos (DCIM) actúa como un sistema nervioso central para el monitoreo del centro de datos, proporcionando una vista holística y en tiempo real de factores clave como la temperatura, la humedad, el uso de energía, el rendimiento del sistema de refrigeración, el tráfico de la red y el rendimiento del servidor.
DCIM almacena, analiza y muestra visualmente los datos recopilados del monitoreo de un centro de datos en paneles e informes de análisis e inteligencia empresarial, lo que facilita la toma de decisiones administración del centro de datos basada en datos. También es capaz de enviar alertas cuando se superan ciertos umbrales operativos o se cumplen condiciones.

Fuente: Nlyte. Haga clic aquí para ver una versión más grande de esta imagen.
Al utilizar una herramienta DCIM para monitorear los datos operativos recopilados de los sensores, los operadores de centros de datos pueden administrar y resolver eventos rápidamente, al tiempo que reduce significativamente la probabilidad de problemas inesperados.
Los problemas típicos que pueden mitigarse incluyen condiciones ambientales inadecuadas, como el desarrollo de puntos críticos, que son áreas donde la temperatura es considerablemente más alta que en los alrededores. Los puntos de acceso crean un riesgo de sobrecalentamiento de los equipos de TI, lo que puede provocar cortes e interrupciones en el servicio.
LEER MÁS: Gestión de infraestructura de centro de datos (DCIM): descripción general
Sistema de control y monitoreo ambiental y de energía (PEMCS)
El software del Sistema de control y monitoreo ambiental y de energía (PEMCS) desempeña un papel crucial en el monitoreo del centro de datos al analizar y administrar centralmente el suministro de energía y las condiciones ambientales. También es adecuado para realizar un seguimiento de los datos sin procesar necesario para calcular la [Efectividad del uso de energía (PUE)](/articulos/pue-power-usage-effectiveness Effectiveness/), que es una relación que mide la eficiencia con la que un centro de datos utiliza la energía para sus equipos informáticos.
PEMCS actúa como un sistema general que abarca las siguientes soluciones de software (entre otras) utilizadas en el monitoreo de centros de datos:
- Sistema de monitoreo de energía eléctrica (EPMS): Se enfoca específicamente en monitorear varios aspectos de la energía eléctrica, incluidos: niveles de voltaje, flujo de corriente, consumo de energía y calidad de la energía.
- Sistema de monitoreo ambiental (EMS): Se concentra en monitorear diversos factores ambientales que pueden afectar el rendimiento del equipo y la eficiencia energética, como: temperatura, humedad y flujo de aire.
Monitoreo remoto y en sitio
El monitoreo del centro de datos generalmente se realiza las 24 horas del día, los 7 días de la semana, tanto in situ como remota, para cumplir con los requisitos y configuraciones específicas de un centro de datos. Este seguimiento suele tener lugar en los denominados “centros de mando”.
- Monitoreo in situ: Muchos centros de datos tienen un espacio dedicado conocido como Centro de operaciones de red (NOC). El NOC suele estar ubicado cerca de la entrada principal de la sala de computadoras y está equipado con pantallas que muestran datos en tiempo real sobre el estado del servidor, el rendimiento de la red, las condiciones ambientales (como temperatura y humedad) y alertas de seguridad.
- Monitoreo remoto: Algunas organizaciones o proveedores de servicios externos operan centros de monitoreo remoto. Estos sitios pueden monitorear múltiples centros de datos desde una sola ubicación, aprovechando herramientas de software para vigilar el estado del sistema, las violaciones de seguridad y las métricas de rendimiento.