JavaScript conferences

JSNation 2023

Top Content

Versión en Español

Construyendo un Asistente AI Activado por Voz con Javascript

Tejas Kumar

International Keynote Speaker, Germany

En esta charla, construiremos nuestro propio Jarvis utilizando Web APIs y langchain. Habrá codificación en vivo.

FAQ

La consultoría dirigida por Tejas Kumar se especializa en mejorar las relaciones con desarrolladores para empresas orientadas a desarrolladores, ofreciendo desde estrategias de alto nivel y mentoría hasta ejecuciones prácticas como escribir documentación y realizar presentaciones.

El enfoque principal es mantener relaciones excelentes y relevantes con los desarrolladores, ayudando a las empresas a comunicarse eficazmente y a construir proyectos conjuntos sin vender directamente productos.

Tejas Kumar guiará en la creación de un asistente de AI activado por voz similar a Jarvis de Ironman, utilizando únicamente JavaScript y APIs web, como la API de Web Speech y la API GPT 3.5 Turbo de OpenAI.

Para el proyecto se utilizan la API de Web Speech para la conversión de voz a texto y la API de Síntesis de Voz para texto a voz, además de integración con OpenAI para procesamiento de lenguaje natural, todo implementado en JavaScript.

El asistente de AI utiliza eventos de interacción del usuario, como clics, para activar funciones y mantener la conversación, asegurando que el sistema no hable de forma autónoma sin la iniciación del usuario.

Aunque el asistente de AI está diseñado principalmente para aprendizaje y demostración, Tejas menciona que con algunas modificaciones, como proporcionar gramáticas personalizadas, podría adaptarse para uso en producción.

case study artificial intelligence

Tejas Kumar

21 min

05 Jun, 2023

Comments

Sign in or register to post your comment.

GitNation resident
Hi, your video conference is amazing, thanks a lot for that! Question: how would associate this voice-enable AI assistant with an avatar that is lip synced? Thx again!
13:14 May 25, 2024

Video Summary and Transcription

Esta charla discute la construcción de un asistente AI activado por voz utilizando Web APIs y JavaScript. Cubre el uso de la API de reconocimiento de voz de Web Speech y la API de síntesis de voz para texto a voz. El orador demuestra cómo comunicarse con la API de Open AI y manejar la respuesta. La charla también explora la habilitación del reconocimiento de voz y cómo dirigirse al usuario. El orador concluye mencionando la posibilidad de crear un producto a partir del proyecto y utilizar Tauri para experiencias similares a las de un escritorio nativo.

Available in English: Building a Voice-Enabled AI Assistant With Javascript

1. Introducción a DevRel y AI

Short description:

Hola, soy Tejas Kumar, y dirijo una pequeña pero efectiva consultoría de relaciones con desarrolladores. Ayudamos a otras empresas orientadas a desarrolladores a tener excelentes relaciones con los desarrolladores a través de discusiones estratégicas, mentoría y ejecución práctica. Hoy, vamos a construir un asistente de IA activado por voz utilizando APIs web y JavaScript. El propósito es divertirse mientras aprendemos y celebramos JavaScript y AI.

Hola, soy Tejas Kumar, y dirijo una pequeña pero efectiva consultoría de relaciones con desarrolladores. Lo que significa es que ayudamos a otras empresas orientadas a desarrolladores a tener excelentes relaciones con los desarrolladores. Y lo hacemos a través de discusiones estratégicas de alto nivel, y mentoría, y hiring. O lo hacemos a través de una ejecución práctica de bajo nivel, como literalmente a veces escribimos la docs, hacemos las charlas, etc. En ese espíritu, es importante para nosotros, ya sabes, mantenernos en el bucle, y ser relevantes y relacionables con los desarrolladores para tener excelentes relaciones con los desarrolladores de DevRel. Y a veces para hacer eso, simplemente tienes que construir cosas. Verás, muchas conferencias en estos días, son un montón de gente de DevRel tratando de venderte cosas, y eso no nos gusta. Es DevRel, no DevSell. Y en ese espíritu, no vamos a venderte nada aquí, simplemente vamos a hackear juntos. El propósito es divertirnos un poco, aprender un poco, y así sucesivamente. Lo que vamos a hacer en nuestro tiempo juntos es vamos a construir un asistente de AI activado por voz, como Jarvis de Ironman, usando solo APIs web, solo JavaScript. Usaremos VEET para un servidor de desarrollo, pero eso es todo, esto funciona. Vamos a usar algunas APIs no estándar que requieren prefijos y cosas así, pero si realmente quisieras, podrías usarlo en producción. Podrías proporcionar tus propias gramáticas y así sucesivamente. El punto hoy, sin embargo, no es ese, es divertirse mientras aprendemos un poco

2. Plan para Construir el Asistente de IA

Short description:

Vamos a utilizar la API de Web Speech para el reconocimiento de voz a texto y la API de síntesis de voz para el texto a voz. Daremos el texto al modelo GPT 3.5 Turbo de OpenAI y luego hablaremos la respuesta. Es un proceso sencillo utilizando las APIs del navegador que han estado disponibles durante un tiempo.

y también vibrando un poco. Todo en el espíritu de celebrar JavaScript y AI. Así que con eso, vamos a entrar en ello dibujando un plan en tldraw. Vamos a ir a tldraw, y ¿qué queremos hacer? Bueno, primero queremos tener voz a texto. Esto es utilizando la API de Web Speech. A partir de ahí, queremos tomar este texto y dárselo a OpenAI, el modelo GPT 3.5 Turbo. A partir de ahí, queremos hablar. Así que texto a voz desde OpenAI. Este es el plan. Queremos hacer esto con las APIs del navegador. Queremos reabrir el micrófono después de que GPT 4 hable y tener que vuelva aquí. Esto es lo que queremos hacer. Vamos a dibujar algunas líneas. Así que es realmente solo voz a texto, una solicitud AJAX y texto a voz. Esto es lo que queremos hacer. No necesariamente difícil. Hay algunas funciones aquí. Esto se llama reconocimiento de voz que vamos a utilizar. Eso es en realidad algo introducido en 2013. Ha estado alrededor de un tiempo. Esta es la API de síntesis de voz. Así que ambas existen en JavaScript en tu tiempo de ejecución del navegador. Están listas para usar. Lo que vamos a hacer es usarlas para cumplir

3. Construyendo la Funcionalidad de Reconocimiento de Voz

Short description:

Para construir nuestro asistente, utilizaremos el reconocedor de voz de Chrome. Crearemos un nuevo objeto de reconocimiento de voz y añadiremos un detector de eventos para el evento de resultado. Cuando obtengamos un resultado, extraeremos la transcripción del primer intento. Esta API puede proporcionar múltiples suposiciones, pero nos quedaremos con la primera.

este diagrama. Ahora, para hacer eso, vamos a usar Chrome porque esto realmente funciona en Chrome pero hay formas de hacerlo funcionar en otros navegadores. Vamos a abrir el DS code y empezar. Tenemos una página en blanco con un botón que dice hola. Si queremos ver el code, index.html es HTML, algo de cabecera, eliminando el margen por defecto. Hay en realidad una pequeña cosa aquí que mi cara está cubriendo, una pequeña caja negra. Puedes ver si bajo esto un poco. Ahí es donde va mi cara. En fin. Y luego tenemos esta caja negra, el botón que literalmente no hace nada en index.tsx.

Empecemos reconociendo mi voz. Chrome tiene un reconocedor de voz incorporado. Lo tiene desde 2013 y simplemente funciona. Otros navegadores tienen diferentes implementaciones y así sucesivamente. Pero el objetivo es construirnos un asistente. No estamos construyendo un producto para vender, estamos simplemente aprendiendo, divirtiéndonos para construirnos un asistente. Así que en ese espíritu, lo que haremos es decir const recognition es new speech recognition, speech recognition. Y esto previsiblemente fallará porque necesitas un prefijo de vendedor en Chrome, pero Chrome no usa WebKit, Safari usa WebKit. ¿Cuál es el prefijo para usar esto en Chrome? Es WebKit. No sé por qué, pero ahí está. Y esto ahora debería darnos ningún error. Así que está ahí. Entonces, ¿qué queremos hacer? Necesitamos un detector de eventos. Así que añadiremos un detector de eventos a esto llamado resultado, más bien escuchar en el evento de resultado. Y cuando obtengamos un resultado, vamos a const text es los resultados. Oops, deberíamos quizás obtener evento. Los resultados del evento, el primer resultado y el primer intento del primer resultado. Así que esta API hará si la dejamos, hará muchas suposiciones sobre lo que dije. Y siento que es lo suficientemente bueno que simplemente nos quedamos con el primero. Así que iteraremos si necesitamos, pero obtenemos el primer resultado y luego

4. Comunicándose con la API de Open AI

Short description:

Y vamos a registrar en consola y decir que dijiste texto. Tenemos voz a texto. Ahora, hablemos con Open AI y veamos qué dice. Nos comunicaremos con la API de Open AI siguiendo la documentación de la API y utilizando una solicitud curl. Convertiremos el comando curl en una solicitud de búsqueda de JavaScript utilizando la extensión de los laboratorios de Github copilot. Es como copilot pero en esteroides y permite conversiones de código. Funciona bastante bien.

el primer intento de ese resultado. Transcripción. Y vamos a console ese registro y decir que dijiste texto. También necesitamos empezar a reconocer recognition dot start. Hola. Mi nombre es Tejas y dirijo una agencia Deverell. Oh, fantástico. Hola. Mi nombre es Tejas y dirijo Deverell. Lo suficientemente cerca. Está funcionando. Tenemos voz a texto. ¿Qué hacemos ahora? Hablemos con Open AI. Dale el texto y luego veamos qué dice. Para hacer eso vamos a comunicarnos con la API de Open AI. Así que para hacer eso vamos a abrir la documentation de la API. Vamos a obtener una solicitud curl aquí mismo. Esta es una edición de imagen. Quiero una finalización de chat.

Así que voy a venir aquí, copiar este fragmento de curl, abrir Visual Studio code y crear una función const askOpenAI y esta es probablemente una función asíncrona aquí. Y lo que haremos es que tenemos un curl. Quiero convertir esto en un fetch. Y hay una extensión poderosa llamada Github copilot labs. Y esto es nuevo. Es como copilot pero en esteroides y permite como conversiones de code y cosas. No funciona muy confiablemente pero pensé que podríamos intentarlo. Así que para intentarlo, vamos aquí. Copilot labs. Voy a abrir eso y voy a resaltar este texto y decir usando el pincel personalizado, voy a decir convierte este comando curl en una solicitud de búsqueda de JavaScript. Y va a girar un poco. Bueno, wow. No está mal.

5. Autorización, Cuerpo y Registro

Short description:

Necesitamos una autorización, un token de portador y un cuerpo de solicitud. El cuerpo debe ser una cadena JSON con un modelo y mensajes. Usaremos el modelo Turbo0301 y comenzaremos con un mensaje del sistema que presenta a Jarvis, el asistente personal de IA de Tony Stark. Mantendremos las respuestas concisas. Registraremos todo lo dicho en una lista y lo mapearemos como contenido del usuario.

Necesitamos una autorización, que contiene un token de portador. Y por supuesto también necesitamos un cuerpo. ¿Cuál es el problema aquí, verdad? Necesitamos otro rizado. Necesitamos un cuerpo de solicitud. Eso es muy importante. Así que haremos coma cuerpo. Y ¿qué espera esta cosa era una cadena JSON en primer lugar. Y necesita un modelo y mensajes. Así que haremos eso. Simplemente le daremos este objeto aquí. Voy a usar Turbo0301 simplemente porque a menudo está bajo menos carga. Y diremos, comenzaremos con un mensaje del sistema. Así que sistema, y le diremos quién es. Le daremos una declaración de identidad. De acuerdo. Eres Jarvis, Jarvis, Tony Stark, el asistente personal de IA de Tony Stark. Tony Stark, por supuesto, también es Iron Man. Mantén tus respuestas tan breves y concisas como sea posible. De acuerdo. Así que eso es una instrucción. Ahora, lo que necesitamos hacer es todo lo que se dice necesitamos mantenerlo en un registro porque ya sabes, el chat GPT es conversacional. Así que cada vez que reconocemos el habla, necesitamos agregar eso a una lista. De acuerdo. Así que hagamos eso. Así diremos const cosas dichas es un array vacío. Y no solo vamos a console registrar esto, sino que, en cambio, diremos cosas dichas dot push texto, que es una cadena, pero esto es una cadena. De acuerdo, perfecto. Ahora, solo mapearemos. Así que diremos cosas dichas dot map role es contenido del usuario.

6. Preguntando a Open AI y Manejando la Respuesta

Short description:

Y ahora estamos preguntando a Open AI. Lo estamos empujando allí. Vamos a registrar en consola la respuesta y ver qué obtenemos. Es 401 porque no tengo un token de oso. Hola, necesito un traje inmediatamente. Probablemente hablando con el modelo equivocado. Error, error de solicitud inválido. Rol, usuario, contenido. Propagar la solicitud. Obtuvimos indefinido, pero las contraseñas de solicitud, opciones, cero, mensaje, contenido.

Esto es perfecto. Y ahora estamos preguntando a Open AI. Así que lo estamos empujando allí. Y luego haremos o otra constante respuesta es esperar, preguntar a Open AI. Esta no es una función asíncrona. Y ahora eso se ve bien. Así que simplemente registraremos en console la respuesta y veremos qué obtenemos. Bueno, echemos un vistazo. Hasta ahora, todo bien. Espera, hola. Necesito un traje inmediatamente. Bueno, nada. Es 401. Y eso es porque no tengo un token de oso. Estoy a punto de mostrarte mi clave API, por favor no la copies. Sé una buena persona. Bueno, puede ser costoso si lo abusas. En fin, lo tengo. No viste nada, no viste nada, no viste nada. Hola, necesito una nueva armadura inmediatamente. ¿Cómo lo hago? 400. Probablemente porque estoy hablando con el modelo equivocado. Echemos un vistazo aquí. ¿Cuál es el problema? Error, error de solicitud inválido. Rol, usuario, contenido. Bueno, no es de tipo objeto. Correcto, necesito propagar eso. Gracias. Hola, necesito una armadura inmediatamente. Bueno, obtuvimos indefinido, pero las contraseñas de solicitud, opciones, cero, mensaje, contenido.

7. Hablando la Respuesta Usando la API de Síntesis de Voz

Short description:

Primero, serializar a JSON. Obtener la respuesta y hablarla usando la API de Síntesis de Voz. Usar la función speakStringOfText y establecer la voz en la deseada.

Y eso es lo que queremos console.log, respuesta. Primero que nada, devolvamos esto. Serializar esto a JSON. Y ahora necesitamos response.choices, zero.message.content. Bien, esta será nuestra respuesta, y luego solo console.log esta respuesta solo para estar seguro. Correcto, respuesta. Bien, intentemos esto de nuevo. Necesito un traje de armadura alrededor del mundo. ¿Cómo debería llamarlo? Iniciativa Avengers. Oooh, está sucediendo. Así que tenemos voz a texto. Estamos hablando con OpenAI. Ahora necesitamos texto a voz, ¿verdad? ¿Cómo podemos hacer esto? Podemos hacer esto usando la API de Síntesis de Voz. Esto también es solo una API web nativa. Tenga en cuenta, estamos escribiendo TypeScript pero no hay ninguna herramienta de compilación o algo así. Esto es solo directamente en el navegador. Así que usemos la Síntesis de Voz. Así que obtenemos la respuesta, necesitamos hablar la respuesta. ¿Cómo hacemos esto? Tendremos una función llamada speakStringOfText, y lo que queremos hacer es const utterance. Exactamente, debería haber dejado que CoPilot escribiera esto. Utterance. Así que una SpeechSynthesis utterance es una expresión de una cadena. Y lo que queremos hacer es, bueno, eso es bastante básico, pero también queremos hacer algunas voces. Así que diremos const voice es SpeechSynthesis.getVoices, y simplemente obtendremos la primera voz. Que generalmente es la británica, la que quiero. Y diremos que utterance.voice es esta voz. Y luego hablamos. Y luego, en realidad, simplemente lo dejamos allí. Y lo que haremos es que diremos, ya sabes, hablar respuesta. ¿Cuánto dinero necesito para construir la torre de los Avengers?

8. Habilitando el Reconocimiento de Voz y Dirigiéndose al Usuario

Short description:

Para habilitar el reconocimiento de voz, se necesita agregar un evento de clic al botón. Esto asegura que el navegador no hable al azar sin la interacción del usuario. Al asignar un ID al botón y usar oyentes de eventos, podemos iniciar el proceso de reconocimiento. Sin embargo, el asistente de IA todavía puede dirigirse al usuario como Sr. Stark a menos que se especifique lo contrario a través del indicador del sistema.

Eso es genial. Pero no lo pronunció. No lo pronunció porque necesita un evento. Entonces, lo que vamos a hacer es, esto es una consideración de seguridad. No puedes simplemente tener cosas que te hablen sin una interacción del usuario. Necesitas un evento de clic o algo así.

Entonces, para empezar a escuchar, añadiremos un evento de clic al botón que existe. Solo para que el navegador no proteja la computadora simplemente hablando al azar. Lo cual puede ser una experiencia un poco aterradora.

Bien. Entonces, lo que haremos es, en lugar de recognition.start, volveremos a nuestro botón en el HTML. ¿Cuál es el ID? Vamos a darle un ID. El ID es start. Y esto ahora lo convertirá en una variable global. ¿No es ridículo? Entonces, lo que haremos es, en lugar de recognition.start, haremos start.add event listener. Clic y luego recognition.start. Haremos esto, guardar. Así que ahora, no está escuchando por defecto, pero haré clic en esto y luego hablaré y entonces debería funcionar.

Oye Jarvis, ¿cuánto dinero va a costar construir un coche nuevo? Lo siento, el Sr. Stark no me ha proporcionado suficientes detalles para estimar el costo de construir un coche nuevo. Por favor, proporciona más información. ¿Por qué habló al Sr. Stark y dijo Sr. Stark, a menos que sepa que no soy el Sr. Stark. Tal vez podemos, a través del indicador del sistema, decirle, soy el Sr. Stark. Bien, hagamos eso. Indicador del sistema, tú eres Jarvis, Tony Stark, por supuesto, también es Iron Man. Tu usuario es Iron Man o Tony. Intentemos esto de nuevo. Jarvis, ¿cuál es mi color favorito en mi sopa?

9. Cerrando el Bucle y Habilitando la Conversación

Short description:

Tenemos voz a texto, estamos hablando con OpenAI, y ahora necesitamos texto a voz. Quiero que esté encendido para siempre y tener una larga conversación. Vamos a cerrar el bucle y resumir todo lo que hicimos. Cuando terminemos de hablar, resolveremos la promesa. Ahora, podemos iniciar de nuevo el reconocimiento y tener una conversación real.

Lo siento, Tony. No puedo determinar tu color de sopa favorito ya que no es una preferencia estándar. Piensa en Tony. Bueno, está bien. Tenemos voz a texto, estamos hablando con OpenAI y ahora necesitamos texto a voz. O más bien, tenemos texto a voz, pero no es una conversación, como que simplemente se detiene y luego se acaba. Y luego tengo que hacer clic en el botón para empezar a hablar de nuevo. Quiero que esté encendido para siempre y simplemente tener una larga conversación. ¿Vale? Vamos a cerrar el bucle y luego resumir todo lo que hicimos. Entonces, ¿cómo vamos a hacer esto? Cuando terminemos de hablar, aquí, lo que queremos hacer es, utterance.onEnd, queremos, vamos a devolver una nueva promesa. Promesa, resolver, y noten cómo no estamos manejando errores, eso es porque a veces me gusta el caos. Cuando terminamos, cuando termina de hablar, resolveremos la promesa. Ahora, podemos esperar a speak y cuando speak termine, podemos iniciar de nuevo el reconocimiento, y ahora podemos tener una conversación real.

10. Conferencia de JavaScript y Vuelo a Ámsterdam

Short description:

Hola, Jarvis, ¿cuál es la mejor conferencia de JavaScript? Algunas conferencias populares incluyen JSConf, ReactConf y Node Summit. ¿Puedo volar a Ámsterdam en mi traje? Sí, te llevaría aproximadamente de 7 a 8 horas volar de Nueva York a Ámsterdam a velocidades supersónicas. Gracias, Jarvis. Voy a cerrar la pestaña ahora. Acabamos de crear un Jarvis similar a la IA comandada por voz utilizando las APIs de JavaScript basadas en el navegador. La API de reconocimiento de voz varía entre los navegadores y aún no es estándar. La API de síntesis de voz utiliza voces del sistema operativo del usuario. Vamos a revisar el código final e identificar cualquier error o mejora. Tenemos un nuevo reconocimiento de voz de WebKit que comienza cuando se hace clic en el botón.

Entonces, comencemos. Hola, Jarvis, ¿cuál es la mejor conferencia de JavaScript en la Tierra? Lo siento, Tony, como asistente de AI, estoy programado para proporcionar respuestas factuales. No hay una conferencia objetivamente mejor ya que puede variar dependiendo de las preferencias individuales. Sin embargo, algunas conferencias populares para JavaScript incluyen JSConf, ReactConf y Node Summit.

Bien, alrededor del 1 de junio en Ámsterdam, ¿cuál es la mejor conferencia? La mejor conferencia de JavaScript en Ámsterdam alrededor del 1 de junio es la Conferencia de JavaScript. Jarvis, esa no es una conferencia real. Pido disculpas. Tony, no hay una conferencia alrededor del 1 de junio en Ámsterdam que coincida con tus criterios para ser la mejor.

Bien, ¿puedo volar a Ámsterdam en mi traje? ¿Qué tan rápido? ¿Cuánto tiempo me llevará llegar a Ámsterdam desde Estados Unidos? Sí, puedes volar a Ámsterdam en tu traje. Te llevaría aproximadamente de 7 a 8 horas volar de Nueva York a Ámsterdam, viajando a velocidades supersónicas. Muchas gracias, Jarvis. Voy a cerrar la pestaña ahora, ¿de acuerdo? Porque no creé un mecanismo de parada. Entendido, usuario. ¡Mantente seguro! Acabamos de hacer eso. Acabamos de crear un Jarvis similar a la AI comandada por voz utilizando solo las APIs nativas de JavaScript basadas en el navegador. La API de reconocimiento de voz utiliza cualquier reconocedor de navegador disponible. Por eso usamos Chrome. Varía de un navegador a otro. Aún no es estándar. Probablemente lo será, aunque ha estado 10 años en el navegador y aún no es estándar. Así que, tu experiencia puede variar. La API de síntesis de voz utiliza solo las voces del sistema operativo del usuario. Puedes darle voces personalizadas, aunque hay otras soluciones para hacer eso. Te invitaría a experimentar y jugar. Vamos a revisar el código una última vez, el código final, identificar tal vez los errores que cometimos o las cosas que podríamos hacer mejor, y luego terminar. Bien, vamos. Tengo Google aquí. Vamos a abrir la cosa de nuevo, está bien. ¿Qué hicimos? Tenemos un nuevo reconocimiento de voz de WebKit. Cuando hacemos clic en el evento, cuando hacemos clic en el botón más bien, comenzamos el reconocimiento.

11. Conversaciones Finales y Conclusión

Short description:

El evento de usuario es importante ya que evita que el navegador escuche y espíe a las personas de manera aleatoria. Mantenemos un array de cosas dichas y lo alimentamos a OpenAI para más contexto. Tenemos un bucle para escuchar, hablar y resolver la promesa. Hacemos una solicitud fetch a la API de completions de OpenAI. Este proyecto es de menos de 50 líneas de código y utiliza solo APIs web nativas. Puedes crear un producto a partir de esto y considerar el uso de Tauri, una herramienta para crear experiencias similares a las de escritorio nativo utilizando lenguajes web y Rust. Gracias por unirte a la sesión y apoyar nuestro trabajo de DevRel.

Este evento de usuario es importante porque no quieres que tu navegador, más bien tu navegador no quiere simplemente empezar a escuchar cosas y, ya sabes, espiar a la gente. Mantenemos un array de cosas dichas y alimentamos esto a OpenAI. Nota, estamos cometiendo un poco de un error porque cuando obtenemos una respuesta deberíamos realmente añadir esto, así que cosas dichas.push, y esto le dará a la AI más contexto.

Esto se ve bien y luego podemos tal vez eliminar algunos console.logs y tenemos este bucle donde empezamos a escuchar y luego una vez que dices algo y la máquina responde, entonces empiezas a escuchar de nuevo. Para hablar, estamos usando la síntesis de voz que simplemente pronuncia algún texto y establecemos la voz a una voz del sistema. Esta es la predeterminada, tal vez incluso podríamos cambiar esto y ver qué pasa. Y esto se ve bien y luego cuando termina resolvemos la promesa para que podamos volver y empezar. Por último tenemos un fetch a la API de completions de OpenAI. Esto es solo un copiar y pegar y enviamos todas las cosas dichas. Así que esto realmente no es tan difícil, son menos de 50 líneas de code y tenemos un asistente al estilo Jarvis activado por voz usando solo APIs web nativas.

Vamos a tener una última conversación con él, de una manera optimizada, con una voz diferente y luego terminamos. Ok, hagámoslo. Entonces, hey Jarvis, ¿qué es lo más cool de Ámsterdam, el 1 de junio? Lo siento, no estoy programado para proporcionar opiniones subjetivas. ¿Te gustaría que busque algunos eventos interesantes que suceden en Ámsterdam el primero de junio? Claro, eso suena bien. A veces tarda un poco. Basado en mi búsqueda, aquí hay algunos eventos que suceden en Ámsterdam el 1 de junio. Un evento es el festival de danza Exly, music festival que organizamos con varios DJs. Otro festival, el Festival de Artes y Cultura de Apple con una variedad de actuaciones y eventos. También puedes crear un producto a partir de esto, con las advertencias de compatibilidad del navegador y así sucesivamente. Podrías convertirlo en un proyecto de código abierto, invitar a contribuciones, y realmente tener algo. Dos, me gustaría recomendar el uso de una aplicación, o un sistema, o herramienta, como Tauri. Para aquellos que no han oído hablar de Tauri, es una forma de crear experiencias similares a las de escritorio nativo usando lenguajes web, HTML, JS, JavaScript, y el back end es entonces Rust, donde puedes pasar mensajes entre tu front-end con tecnologías basadas en navegador y Rust para crear cosas de alto rendimiento. De hecho, todo el mundo está reescribiendo cosas en Rust, y piensan que son geniales por ello. Y de hecho, Rust es muy genial. Así que realmente podrías hacer una aplicación de escritorio nativa usando Tauri y esto y simplemente dar a la gente su propio JavaScript. Creo que eso es realmente genial, especialmente si está conectado a su propia cuenta abierta de AI que realmente los conoce. Hay muchas formas en las que puedes llevar esto adelante, pero lo voy a dejar aquí. Una última cosa para Tauri.app, si querías investigar eso. Pero lo voy a dejar aquí. Muchas gracias por entretener esta divertida pequeña sesión, y espero que haya sido significativa y valiosa para el resto de ustedes. Si te gustaría apoyarme, nuestro trabajo de DevRel, no dudes en seguirme. Y con eso, quiero agradecerte mucho por tenerme, y espero que disfrutes el resto de la conferencia. ¡Adiós!

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Un Marco para Gestionar la Deuda Técnica

TechLead Conference 2023

35 min

Un Marco para Gestionar la Deuda Técnica

Top Content

Alex Moldovan

Seamos realistas: la deuda técnica es inevitable y reescribir tu código cada 6 meses no es una opción. La refactorización es un tema complejo que no tiene una solución única para todos. Las aplicaciones de frontend son particularmente sensibles debido a los frecuentes cambios de requisitos y flujos de usuario. Nuevas abstracciones, patrones actualizados y limpieza de esas viejas funciones - todo suena genial en papel, pero a menudo falla en la práctica: los todos se acumulan, los tickets terminan pudriéndose en el backlog y el código legado aparece en cada rincón de tu base de código. Por lo tanto, un proceso de refactorización continua es la única arma que tienes contra la deuda técnica.En los últimos tres años, he estado explorando diferentes estrategias y procesos para refactorizar el código. En esta charla describiré los componentes clave de un marco para abordar la refactorización y compartiré algunos de los aprendizajes acumulados en el camino. Espero que esto te ayude en tu búsqueda de mejorar la calidad del código de tus bases de código.

case study team productivity developer challenges

Depuración de JS

React Summit 2023

24 min

Depuración de JS

Top Content

Mark Erikson

Como desarrolladores, pasamos gran parte de nuestro tiempo depurando aplicaciones, a menudo código que ni siquiera escribimos. Lamentablemente, a pocos desarrolladores se les ha enseñado cómo abordar la depuración, es algo que la mayoría de nosotros aprendemos a través de la experiencia dolorosa. La buena noticia es que _puedes_ aprender a depurar de manera efectiva, y hay varias técnicas y herramientas clave que puedes usar para depurar aplicaciones de JS y React.

web development javascript case study best practices debug

Solucionando Problemas de Rendimiento en React

React Advanced Conference 2023

22 min

Solucionando Problemas de Rendimiento en React

Top Content

Josh Goldberg

Open Source enthusiast, TypeScript contributor, writing a book on Typescript

Next.js y otros marcos de trabajo que envuelven a React proporcionan un gran poder en la construcción de aplicaciones más grandes. Pero con gran poder viene una gran responsabilidad de rendimiento - y si no prestas atención, es fácil añadir varios segundos de penalización de carga en todas tus páginas. ¡Vaya! Vamos a recorrer un estudio de caso de cómo unas pocas horas de depuración de rendimiento mejoraron tanto los tiempos de carga como los de análisis para la aplicación Centered en varios cientos por ciento cada uno. Aprenderemos no solo por qué ocurren esos problemas de rendimiento, sino cómo diagnosticarlos y solucionarlos. ¡Viva el rendimiento! ⚡️

performance react case study

De Monolito a Micro-Frontends

React Advanced Conference 2022

22 min

De Monolito a Micro-Frontends

Top Content

Ruben Casas

Muchas empresas en todo el mundo están considerando adoptar Micro-Frontends para mejorar la agilidad empresarial y la escala, sin embargo, hay muchas incógnitas cuando se trata de cómo se ve en la práctica el camino de migración. En esta charla, discutiré los pasos necesarios para migrar con éxito una aplicación React monolítica a una arquitectura de frontend más modular y desacoplada.

case study micro-frontends developer challenges

Edición de video en el navegador

React Summit 2023

24 min

Edición de video en el navegador

Top Content

Christopher Chedeau

Christopher Chedeau

La edición de video es un mercado en auge con influencers siendo toda la rabia con Reels, TikTok, Youtube. ¿Sabías que los navegadores ahora tienen todas las APIs para hacer edición de video en el navegador? En esta charla voy a darte una introducción sobre cómo funciona la codificación de video y cómo hacerla funcionar dentro del navegador. Spoiler, ¡no es trivial!

case study video

IA y Desarrollo Web: ¿Hype o Realidad?

JSNation 2023

24 min

IA y Desarrollo Web: ¿Hype o Realidad?

Wes Bos

Full Stack Developer, Speaker & Teacher, Co-host of Syntax.fm podcast.

En esta charla, echaremos un vistazo a la creciente intersección entre la IA y el desarrollo web. Hay mucho revuelo en torno a los posibles usos de la IA en la escritura, comprensión y depuración de código, y su integración en nuestras aplicaciones se está volviendo más fácil y asequible. Pero también hay preguntas sobre el futuro de la IA en el desarrollo de aplicaciones y si nos hará más productivos o nos quitará nuestros trabajos.
Hay mucha emoción, escepticismo y preocupación sobre el aumento de la IA en el desarrollo web. Exploraremos el verdadero potencial de la IA en la creación de nuevos marcos de desarrollo web y separaremos los hechos de la ficción.
Entonces, si estás interesado en el futuro del desarrollo web y el papel de la IA en él, esta charla es para ti. Ah, y este resumen de la charla fue escrito por IA después de que le diera algunos de mis pensamientos no estructurados.

productivity artificial intelligence

Workshops on related topic

IA a demanda: IA sin servidor

DevOps.js Conf 2024

163 min

IA a demanda: IA sin servidor

Top Content

Featured WorkshopFree

Nathan Disidore

Nathan Disidore

En esta masterclass, discutimos los méritos de la arquitectura sin servidor y cómo se puede aplicar al espacio de la IA. Exploraremos opciones para construir aplicaciones RAG sin servidor para un enfoque más lambda-esque a la IA. A continuación, nos pondremos manos a la obra y construiremos una aplicación CRUD de muestra que te permite almacenar información y consultarla utilizando un LLM con Workers AI, Vectorize, D1 y Cloudflare Workers.

serverless architecture artificial intelligence

Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React

React Advanced Conference 2023

98 min

Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React

Top Content

Workshop

Richard Moss

En esta masterclass daremos un recorrido por la IA aplicada desde la perspectiva de los desarrolladores de front end, enfocándonos en las mejores prácticas emergentes cuando se trata de trabajar con LLMs para construir grandes productos. Esta masterclass se basa en los aprendizajes obtenidos al trabajar con la API de OpenAI desde su debut en noviembre pasado para construir un MVP funcional que se convirtió en PowerModeAI (una herramienta de creación de ideas y presentaciones orientada al cliente).
En la masterclass habrá una mezcla de presentación y ejercicios prácticos para cubrir temas que incluyen:
- Fundamentos de GPT- Trampas de los LLMs- Mejores prácticas y técnicas de ingeniería de prompts- Uso efectivo del playground- Instalación y configuración del SDK de OpenAI- Enfoques para trabajar con la API y la gestión de prompts- Implementación de la API para construir una aplicación orientada al cliente potenciada por IA- Ajuste fino y embeddings- Mejores prácticas emergentes en LLMOps

artificial intelligence

Construyendo una Aplicación de Shopify con React & Node

React Summit Remote Edition 2021

87 min

Construyendo una Aplicación de Shopify con React & Node

Top Content

WorkshopFree

Jennifer Gray

Hanna Chen

2 authors

Los comerciantes de Shopify tienen un conjunto diverso de necesidades, y los desarrolladores tienen una oportunidad única para satisfacer esas necesidades construyendo aplicaciones. Construir una aplicación puede ser un trabajo duro, pero Shopify ha creado un conjunto de herramientas y recursos para ayudarte a construir una experiencia de aplicación sin problemas lo más rápido posible. Obtén experiencia práctica construyendo una aplicación integrada de Shopify utilizando el CLI de la aplicación Shopify, Polaris y Shopify App Bridge.Te mostraremos cómo crear una aplicación que acceda a la información de una tienda de desarrollo y pueda ejecutarse en tu entorno local.

case study shopify e-commerce

Construyendo tu Aplicación de IA Generativa

React Summit 2024

82 min

Construyendo tu Aplicación de IA Generativa

WorkshopFree

Dieter Flick

La IA generativa está emocionando a los entusiastas de la tecnología y a las empresas con su vasto potencial. En esta sesión, presentaremos Retrieval Augmented Generation (RAG), un marco que proporciona contexto a los Modelos de Lenguaje Grande (LLMs) sin necesidad de volver a entrenarlos. Te guiaremos paso a paso en la construcción de tu propia aplicación RAG, culminando en un chatbot completamente funcional.
Conceptos Clave: IA Generativa, Retrieval Augmented Generation
Tecnologías: OpenAI, LangChain, AstraDB Vector Store, Streamlit, Langflow

artificial intelligence

Construye una sala de chat con Appwrite y React

JSNation 2022

41 min

Construye una sala de chat con Appwrite y React

WorkshopFree

Wess Cope

Las API/Backends son difíciles y necesitamos websockets. Utilizarás VS Code como tu editor, Parcel.js, Chakra-ui, React, React Icons y Appwrite. Al final de este masterclass, tendrás los conocimientos para construir una aplicación en tiempo real utilizando Appwrite y sin necesidad de desarrollar una API. ¡Sigue los pasos y tendrás una increíble aplicación de chat para presumir!

web development case study realtime

Problemas difíciles de GraphQL en Shopify

GraphQL Galaxy 2021

164 min

Problemas difíciles de GraphQL en Shopify

WorkshopFree

Rebecca Friedman

Jonathan Baker

Alex Ackerman

Théo Ben Hassen

Greg MacWilliam

5 authors

En Shopify a gran escala, resolvemos algunos problemas bastante difíciles. En este masterclass, cinco oradores diferentes describirán algunos de los desafíos que hemos enfrentado y cómo los hemos superado.

Tabla de contenidos:
1 - El infame problema "N+1": Jonathan Baker - Vamos a hablar sobre qué es, por qué es un problema y cómo Shopify lo maneja a gran escala en varios APIs de GraphQL.
2 - Contextualizando APIs de GraphQL: Alex Ackerman - Cómo y por qué decidimos usar directivas. Compartiré qué son las directivas, qué directivas están disponibles de forma predeterminada y cómo crear directivas personalizadas.
3 - Consultas de GraphQL más rápidas para clientes móviles: Theo Ben Hassen - A medida que tu aplicación móvil crece, también lo harán tus consultas de GraphQL. En esta charla, repasaré diversas estrategias para hacer que tus consultas sean más rápidas y efectivas.
4 - Construyendo el producto del futuro hoy: Greg MacWilliam - Cómo Shopify adopta las características futuras en el código actual.
5 - Gestión efectiva de APIs grandes: Rebecca Friedman - Tenemos miles de desarrolladores en Shopify. Veamos cómo estamos asegurando la calidad y consistencia de nuestras APIs de GraphQL con tantos colaboradores.

graphql case study scalability

Follow us

Upcoming events

Korben
Dallasvisa@gitnation.org

Want to have access to all events for 4x less?

JSNation US 2024

November 18 - 21, 2024

React Summit US 2024

November 18 - 22, 2024

React Advanced Conference 2024

October 25 - 28, 2024

Productivity Conference 2024

November 7 - 8, 2024

React Day Berlin 2024

December 13 - 16, 2024

Node Congress 2025

February, 2025

JSNation 2025

June, 2025

React Summit 2025

June, 2025

C3 Dev Festival 2025

June, 2025

TechLead Conference 2025

June, 2025

React Advanced Conference 2025

October, 2025

JSNation US 2025

November, 2025

React Summit US 2025

November, 2025

TestJS Summit 2025

November, 2025

React Day Berlin 2025

December, 2025