Desconstruyendo el Rastreo Distribuido

Rate this content
Bookmark
Slides

El rastreo distribuido es una técnica poderosa que te permite seguir el flujo y el tiempo de las solicitudes a medida que navegan a través de un sistema. Al vincular operaciones y solicitudes entre múltiples servicios, el rastreo distribuido proporciona valiosos conocimientos sobre el rendimiento de la aplicación y ayuda a identificar cuellos de botella. En esta charla, Lazar explicará el concepto de Rastreo Distribuido guiándote a través de cómo las herramientas de monitoreo construyen soluciones de rastreo.

FAQ

La trazabilidad distribuida es una técnica que permite rastrear el flujo y el tiempo de las solicitudes y operaciones a través de un sistema, especialmente útil en aplicaciones de microservicios y pilas completas para entender el rendimiento del sistema e identificar cuellos de botella.

Es importante porque ayuda a comprender el rendimiento del sistema y a identificar problemas complejos y cuellos de botella, facilitando la depuración de errores inusuales y condiciones de carrera que no se podrían identificar fácilmente con métodos de depuración más simples.

Inicialmente, se utilizaban registros simples en servidores como Apache. Con el tiempo, la concurrencia y la asincronía en las aplicaciones requirieron métodos más complejos, como el uso de IDs únicos para solicitudes y, finalmente, la implementación de microservicios y contenedores intensificó la necesidad de herramientas más avanzadas como la trazabilidad distribuida.

Un 'span' es la unidad más pequeña de trabajo en la trazabilidad distribuida, como una solicitud HTTP o una llamada a función, que puede iniciar otros 'spans' hijos, creando una jerarquía que refleja la estructura del software y ayuda a identificar el flujo y rendimiento de operaciones específicas dentro del sistema.

Se utiliza un contexto de traza que concatena el ID de la traza y el ID del último 'span' en una cadena. Esta cadena se transfiere entre clientes, microservicios y otras unidades de procesamiento, permitiendo que el sistema continúe la traza a partir del último 'span' donde se quedó.

Además de mejorar la depuración y el rendimiento del sistema, la trazabilidad distribuida permite mantener etiquetas y un estado en cada 'span', lo que facilita la búsqueda, agrupación y análisis detallado de datos para optimizar aún más las operaciones y detectar ineficiencias.

Lazar Nikolov
Lazar Nikolov
8 min
12 Dec, 2023

Comments

Sign in or register to post your comment.

Video Summary and Transcription

El rastreo distribuido es una técnica poderosa para rastrear solicitudes y operaciones en un sistema, especialmente en aplicaciones de pila completa y microservicios. La reinvención del rastreo distribuido introduce el concepto de un rastro y abarca para capturar datos de depuración. Las mejoras incluyen etiquetas y un campo de estado para un mejor análisis, y la distribución de rastros utilizando un contexto de rastro para un rastreo continuo.

1. Introducción a la Trazabilidad Distribuida

Short description:

La trazabilidad distribuida es una técnica poderosa que ayuda a rastrear el flujo y el tiempo de las solicitudes y operaciones en un sistema. Es especialmente útil para aplicaciones de pila completa y microservicios, permitiendo una mejor comprensión del rendimiento del sistema e identificación de cuellos de botella. La técnica ha estado presente desde principios de los años 2000 pero ganó popularidad en la década de 2010. A medida que las bibliotecas y los marcos evolucionaron, también lo hicieron las herramientas de depuración, desde los registros en Apache Server hasta el manejo de múltiples solicitudes en un solo proceso con hilos separados. Con la concurrencia avanzada, marcos como Node.js permiten que las solicitudes comiencen y terminen en diferentes hilos.

♪ ♪ Reconstruyendo la trazabilidad distribuida. Hola a todos. Mi nombre es Laza Nikolov, y soy un defensor del desarrollo en Sentry. Hoy en mi charla, vamos a hablar sobre la trazabilidad distribuida. Primero explicaré qué es. Luego vamos a entrar un poco en la historia de las herramientas de depuración para descubrir por qué existía la trazabilidad distribuida en primer lugar. Y luego, para entenderlo mejor, vamos a reconstruir la trazabilidad distribuida desde cero o al menos solo el concepto de ella.

Muy bien, entonces, sumerjámonos. La trazabilidad distribuida es una técnica poderosa que te permite rastrear el flujo y el tiempo de las solicitudes y operaciones a medida que fluyen a través de tu sistema. Esto es especialmente útil para la pila completa y para las aplicaciones de microservicios. La trazabilidad distribuida te ayuda a entender el rendimiento del sistema e identificar cualquier cuello de botella. Es especialmente útil para depurar errores complejos y extraños como los errores de condición de carrera que requieren mucho más que solo un bloqueo de consola y un rastreo de pila. No es nuevo por ningún medio. Hay documentos técnicos que mencionan la trazabilidad desde principios de los años 2000, pero se popularizó durante la década de 2010. Entonces, para entender por qué existe, necesitamos retroceder en el tiempo.

A medida que nuestras bibliotecas y marcos evolucionaron, también lo hicieron nuestras herramientas de depuración. Por ejemplo, en los primeros días de Apache Server, los registros eran uno de los pocos métodos para depurar. A medida que llegaban las solicitudes, Apache generaba un proceso hijo y manejaba las solicitudes. Si querías depurar lo que sucedió durante esa solicitud específica, podrías simplemente extraer los registros del proceso y verás todo el flujo de operación. Y eso funcionó. Estábamos contentos. Luego obtuvimos concurrencia básica. Piensa en IIS en ASP.NET. En lugar de generar un proceso para cada solicitud, comenzamos a manejar múltiples solicitudes en un solo proceso, pero en un hilo separado. Los registros siguen siendo un buen método de depuración, pero para aislar los registros de la solicitud, necesitamos prefijarlos con el nombre del hilo y luego filtrar los mensajes de registro basándonos en él. No es gran cosa, pero lo hicimos funcionar. Luego obtuvimos concurrencia avanzada. Nuestros marcos evolucionaron a ser asíncronos, multihilos, futuros y promesas, marcos basados en bucles de eventos. Esto es Node.js. Así que ahora nuestra solicitud puede comenzar en un hilo, pero terminar en uno diferente, pasando por muchos otros hilos en el camino.

2. Reinventando la Trazabilidad Distribuida

Short description:

El prefijo de los registros con un ID único para cada solicitud ya no resuelve el problema en un sistema distribuido. Con el auge de los servicios contenerizados, los backends se distribuyen en varias máquinas, lo que dificulta el seguimiento de las operaciones. Para abordar esto, reinventamos la trazabilidad distribuida desde cero. Introdujimos el concepto de una traza, que sigue una solicitud y captura datos de depuración. Dentro de la traza, tenemos spans que representan la unidad más pequeña de trabajo, como una solicitud HTTP o una llamada a una función. Los spans pueden crear spans hijos, lo que nos permite reflejar la estructura de nuestro software. Cada span tiene un ID único y contiene datos como su ID padre.

Prefijarlos con el nombre del hilo realmente no resuelve nuestro problema ahora. Necesitamos prefijarlos con algo único para la solicitud en sí, y eso es lo que hicimos. Generamos un ID único para cada solicitud y lo prefijamos, nuestros registros.

Pero nuestros frameworks no dejaron de evolucionar. Hace unos 10 años, Docker y AWS dieron paso a los servicios contenerizados. Y ahora nuestros backends ni siquiera viven en una sola máquina. Cada contenedor y microservicio manejaba múltiples solicitudes y producía sus propios registros. Nuestros registros están por todas partes ahora. Era muy difícil entender el flujo de operaciones, por lo que necesitábamos una mejor herramienta de depuración que pudiera rastrear las operaciones a medida que saltan entre containers y servicios. Ahí es cuando la trazabilidad distribuida se convirtió en una herramienta necesaria para la depuración.

Para entender cómo funciona, vamos a reinventarlo desde cero. Dado que nuestros backends ahora tienen una naturaleza muy distribuida, necesitábamos definir un vehículo para cada solicitud que la seguirá y capturará los data de depuración en el camino. Llamemos a eso una traza. La traza comenzará cuando comience el flujo de operaciones, y va a tener un ID único. Eso puede ser el frontend, por ejemplo.

Si pensamos en los registros, generalmente nos dicen qué sucedió en un momento particular. Intentan imitar la estructura de nuestro código. Así que inventemos eso ahora. Inventemos algo que vaya a describir la unidad más pequeña de trabajo, como una solicitud HTTP o una llamada a una función o cualquier cosa específica que nuestro software haga en un momento específico. Vamos a llamar a eso un span, y vamos a crear uno inmediatamente cuando comience la traza. Eso va a ser nuestro span raíz.

Así que al igual que los registros, los spans van a imitar la estructura de nuestro software. Pero como lo estamos reinventando, hagámoslo mucho más inteligente que simples mensajes. Entonces, como los spans son la unidad más pequeña de trabajo, como una sola función, y sabemos que una función puede invocar a otra función, que a su vez también puede invocar a una tercera función, vamos a design nuestros spans para que puedan crear spans hijos, que pueden crear sus propios spans hijos y así sucesivamente. Ahora realmente podemos reflejar la estructura de nuestro software con esto. Tenemos una jerarquía de spans, pero necesitamos recordar qué span es hijo de qué span. Para hacer eso, vamos a necesitar algo para identificar cada span. Así que asignaremos un ID a cada span a medida que los creamos. También necesitamos guardar el ID del span padre. Así que vamos a crear un espacio dentro de cada span para que pueda contener data como su ID y su ID padre.

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Una Guía del Comportamiento de Renderizado de React
React Advanced Conference 2022React Advanced Conference 2022
25 min
Una Guía del Comportamiento de Renderizado de React
Top Content
React es una biblioteca para "renderizar" UI a partir de componentes, pero muchos usuarios se encuentran confundidos acerca de cómo funciona realmente el renderizado de React. ¿Qué significan términos como "renderizado", "reconciliación", "Fibers", y "committing"? ¿Cuándo ocurren los renderizados? ¿Cómo afecta el Contexto al renderizado, y cómo las bibliotecas como Redux causan actualizaciones? En esta charla, aclararemos la confusión y proporcionaremos una base sólida para entender cuándo, por qué, y cómo React renderiza. Veremos: - Qué es realmente el "renderizado" - Cómo React encola los renderizados y el comportamiento de renderizado estándar - Cómo se utilizan las claves y los tipos de componentes en el renderizado - Técnicas para optimizar el rendimiento del renderizado - Cómo el uso del contexto afecta al comportamiento del renderizado - Cómo las bibliotecas externas se integran en el renderizado de React
Acelerando tu aplicación React con menos JavaScript
React Summit 2023React Summit 2023
32 min
Acelerando tu aplicación React con menos JavaScript
Top Content
¿Demasiado JavaScript te está agobiando? Los nuevos marcos que prometen no usar JavaScript parecen interesantes, pero tienes una aplicación React existente que mantener. ¿Qué tal si Qwik React es tu respuesta para un inicio de aplicaciones más rápido y una mejor experiencia de usuario? Qwik React te permite convertir fácilmente tu aplicación React en una colección de islas, que pueden ser renderizadas en el servidor y rehidratadas con retraso, e incluso en algunos casos, se puede omitir la rehidratación por completo. Y todo esto de manera incremental sin una reescritura.
Concurrencia en React, Explicada
React Summit 2023React Summit 2023
23 min
Concurrencia en React, Explicada
Top Content
¡React 18! ¡Funciones concurrentes! Tal vez ya hayas probado las nuevas APIs como useTransition, o tal vez solo hayas oído hablar de ellas. Pero, ¿sabes cómo React 18 logra las mejoras de rendimiento que trae consigo? En esta charla, echemos un vistazo bajo el capó de las características de rendimiento de React 18: - Cómo React 18 reduce el tiempo que tu página permanece congelada (también conocido como TBT) - Qué sucede exactamente en el hilo principal cuando ejecutas useTransition() - Cuál es la trampa con las mejoras (¡no hay torta gratis!), y por qué Vue.js y Preact se negaron rotundamente a lanzar algo similar
El Futuro de las Herramientas de Rendimiento
JSNation 2022JSNation 2022
21 min
El Futuro de las Herramientas de Rendimiento
Top Content
Nuestra comprensión del rendimiento y la experiencia del usuario ha evolucionado mucho a lo largo de los años. Las herramientas de desarrollo web necesitan evolucionar de manera similar para asegurarse de que sean centradas en el usuario, accionables y contextuales donde se refiere a las experiencias modernas. En esta charla, Addy te guiará a través de cómo Chrome y otros han estado pensando en este problema y qué actualizaciones han estado haciendo a las herramientas de rendimiento para reducir la fricción para construir grandes experiencias en la web.
Optimización de juegos HTML5: 10 años de aprendizaje
JS GameDev Summit 2022JS GameDev Summit 2022
33 min
Optimización de juegos HTML5: 10 años de aprendizaje
Top Content
El motor de juegos de código abierto PlayCanvas está construido específicamente para el navegador, incorporando 10 años de aprendizaje sobre optimización. En esta charla, descubrirás la salsa secreta que permite a PlayCanvas generar juegos con tiempos de carga increíblemente rápidos y tasas de fotogramas sólidas como una roca.
Solucionando Problemas de Rendimiento en React
React Advanced Conference 2023React Advanced Conference 2023
22 min
Solucionando Problemas de Rendimiento en React
Top Content
Next.js y otros marcos de trabajo que envuelven a React proporcionan un gran poder en la construcción de aplicaciones más grandes. Pero con gran poder viene una gran responsabilidad de rendimiento - y si no prestas atención, es fácil añadir varios segundos de penalización de carga en todas tus páginas. ¡Vaya! Vamos a recorrer un estudio de caso de cómo unas pocas horas de depuración de rendimiento mejoraron tanto los tiempos de carga como los de análisis para la aplicación Centered en varios cientos por ciento cada uno. Aprenderemos no solo por qué ocurren esos problemas de rendimiento, sino cómo diagnosticarlos y solucionarlos. ¡Viva el rendimiento! ⚡️

Workshops on related topic

Masterclass de Depuración de Rendimiento de React
React Summit 2023React Summit 2023
170 min
Masterclass de Depuración de Rendimiento de React
Top Content
Featured WorkshopFree
Ivan Akulov
Ivan Akulov
Los primeros intentos de Ivan en la depuración de rendimiento fueron caóticos. Vería una interacción lenta, intentaría una optimización aleatoria, vería que no ayudaba, y seguiría intentando otras optimizaciones hasta que encontraba la correcta (o se rendía).
En aquel entonces, Ivan no sabía cómo usar bien las herramientas de rendimiento. Haría una grabación en Chrome DevTools o React Profiler, la examinaría, intentaría hacer clic en cosas aleatorias, y luego la cerraría frustrado unos minutos después. Ahora, Ivan sabe exactamente dónde y qué buscar. Y en esta masterclass, Ivan te enseñará eso también.
Así es como va a funcionar. Tomaremos una aplicación lenta → la depuraremos (usando herramientas como Chrome DevTools, React Profiler, y why-did-you-render) → identificaremos el cuello de botella → y luego repetiremos, varias veces más. No hablaremos de las soluciones (en el 90% de los casos, es simplemente el viejo y regular useMemo() o memo()). Pero hablaremos de todo lo que viene antes - y aprenderemos a analizar cualquier problema de rendimiento de React, paso a paso.
(Nota: Esta masterclass es más adecuada para ingenieros que ya están familiarizados con cómo funcionan useMemo() y memo() - pero quieren mejorar en el uso de las herramientas de rendimiento alrededor de React. Además, estaremos cubriendo el rendimiento de la interacción, no la velocidad de carga, por lo que no escucharás una palabra sobre Lighthouse 🤐)
Construyendo aplicaciones web que iluminan Internet con QwikCity
JSNation 2023JSNation 2023
170 min
Construyendo aplicaciones web que iluminan Internet con QwikCity
Featured WorkshopFree
Miško Hevery
Miško Hevery
Construir aplicaciones web instantáneas a gran escala ha sido elusivo. Los sitios del mundo real necesitan seguimiento, análisis y interfaces y interacciones de usuario complejas. Siempre comenzamos con las mejores intenciones pero terminamos con un sitio menos que ideal.
QwikCity es un nuevo meta-framework que te permite construir aplicaciones a gran escala con un rendimiento de inicio constante. Veremos cómo construir una aplicación QwikCity y qué la hace única. El masterclass te mostrará cómo configurar un proyecto QwikCity. Cómo funciona el enrutamiento con el diseño. La aplicación de demostración obtendrá datos y los presentará al usuario en un formulario editable. Y finalmente, cómo se puede utilizar la autenticación. Todas las partes básicas para cualquier aplicación a gran escala.
En el camino, también veremos qué hace que Qwik sea único y cómo la capacidad de reanudación permite un rendimiento de inicio constante sin importar la complejidad de la aplicación.
Next.js 13: Estrategias de Obtención de Datos
React Day Berlin 2022React Day Berlin 2022
53 min
Next.js 13: Estrategias de Obtención de Datos
Top Content
WorkshopFree
Alice De Mauro
Alice De Mauro
- Introducción- Prerrequisitos para la masterclass- Estrategias de obtención: fundamentos- Estrategias de obtención – práctica: API de obtención, caché (estática VS dinámica), revalidar, suspense (obtención de datos en paralelo)- Prueba tu construcción y sírvela en Vercel- Futuro: Componentes de servidor VS Componentes de cliente- Huevo de pascua de la masterclass (no relacionado con el tema, destacando la accesibilidad)- Conclusión
Depuración del Rendimiento de React
React Advanced Conference 2023React Advanced Conference 2023
148 min
Depuración del Rendimiento de React
Workshop
Ivan Akulov
Ivan Akulov
Los primeros intentos de Ivan en la depuración de rendimiento fueron caóticos. Veía una interacción lenta, probaba una optimización aleatoria, veía que no ayudaba, y seguía probando otras optimizaciones hasta que encontraba la correcta (o se rendía).
En aquel entonces, Ivan no sabía cómo usar bien las herramientas de rendimiento. Hacía una grabación en Chrome DevTools o React Profiler, la examinaba, intentaba hacer clic en cosas al azar, y luego la cerraba frustrado unos minutos después. Ahora, Ivan sabe exactamente dónde y qué buscar. Y en esta masterclass, Ivan te enseñará eso también.
Así es como va a funcionar. Tomaremos una aplicación lenta → la depuraremos (usando herramientas como Chrome DevTools, React Profiler, y why-did-you-render) → identificaremos el cuello de botella → y luego repetiremos, varias veces más. No hablaremos de las soluciones (en el 90% de los casos, es simplemente el viejo y regular useMemo() o memo()). Pero hablaremos de todo lo que viene antes - y aprenderemos cómo analizar cualquier problema de rendimiento de React, paso a paso.
(Nota: Esta masterclass es más adecuada para ingenieros que ya están familiarizados con cómo funcionan useMemo() y memo() - pero quieren mejorar en el uso de las herramientas de rendimiento alrededor de React. Además, cubriremos el rendimiento de interacción, no la velocidad de carga, por lo que no escucharás una palabra sobre Lighthouse 🤐)
Master Patrones de JavaScript
JSNation 2024JSNation 2024
145 min
Master Patrones de JavaScript
Workshop
Adrian Hajdin
Adrian Hajdin
Durante este masterclass, los participantes revisarán los patrones esenciales de JavaScript que todo desarrollador debe conocer. A través de ejercicios prácticos, ejemplos del mundo real y discusiones interactivas, los asistentes profundizarán su comprensión de las mejores prácticas para organizar el código, resolver desafíos comunes y diseñar arquitecturas escalables. Al final del masterclass, los participantes ganarán confianza en su capacidad para escribir código JavaScript de alta calidad que perdure en el tiempo.
Puntos Cubiertos:
1. Introducción a los Patrones de JavaScript2. Patrones Fundamentales3. Patrones de Creación de Objetos4. Patrones de Comportamiento5. Patrones Arquitectónicos6. Ejercicios Prácticos y Estudios de Caso
Cómo Ayudará a los Desarrolladores:
- Obtener una comprensión profunda de los patrones de JavaScript y sus aplicaciones en escenarios del mundo real- Aprender las mejores prácticas para organizar el código, resolver desafíos comunes y diseñar arquitecturas escalables- Mejorar las habilidades de resolución de problemas y la legibilidad del código- Mejorar la colaboración y comunicación dentro de los equipos de desarrollo- Acelerar el crecimiento profesional y las oportunidades de avance en la industria del software
Masterclass de alto rendimiento Next.js
React Summit 2022React Summit 2022
50 min
Masterclass de alto rendimiento Next.js
Workshop
Michele Riva
Michele Riva
Next.js es un marco convincente que facilita muchas tareas al proporcionar muchas soluciones listas para usar. Pero tan pronto como nuestra aplicación necesita escalar, es esencial mantener un alto rendimiento sin comprometer el mantenimiento y los costos del servidor. En este masterclass, veremos cómo analizar el rendimiento de Next.js, el uso de recursos, cómo escalarlo y cómo tomar las decisiones correctas al escribir la arquitectura de la aplicación.