Lleva la búsqueda basada en IA a tu aplicación web

Rate this content
Bookmark

ChatGPT causó sensación en el mundo tecnológico. Todo el mundo habla de ello, desde tu CTO hasta tu peluquero (al menos el mío lo hace). Y hay muchas razones por las que todos deberíamos estar emocionados al respecto y muchas otras innovaciones de IA/ML.


Pero, ¿cómo las incorporas a tu pila tecnológica, a tu sitio web/backend, para trabajar con tus datos y proporcionar búsqueda impulsada por IA y aumento de datos?


Existe una nueva generación de bases de datos nativas de IA, que utilizan modelos de aprendizaje profundo para encontrar respuestas a consultas en lenguaje natural. Estamos hablando de la capacidad de buscar a través de texto, imágenes, videos, ADN o cualquier dato no estructurado, todo con una sola consulta.


La regla general es: si hay un modelo de ML, podemos buscar a través de él.


Únete a mí para aprender sobre los bloques fundamentales (LLMs y vector embeddings, Bases de datos vectoriales), cómo interactúan todos ellos y, lo más importante, cómo puedes construir algo tú mismo con tecnología de código abierto.


Y, por supuesto!!! Habrá una demostración de codificación en vivo, donde te guiaré a través de la experiencia de construir una búsqueda basada en IA, con Weaviate, una base de datos vectorial de código abierto, y agregarla a una aplicación. Ahora la pregunta... ¿deberíamos hacer esto en Angular, React, Vue o simplemente JS puro? ;)


#QueLosDiosesDeLaDemoEsténConNosotros


FAQ

El machine learning involucra modelos que generan incrustaciones de vector, es decir, matrices de números que representan datos. Estos modelos son accesibles y no requieren un entendimiento avanzado o un doctorado para ser utilizados, especialmente con las herramientas y plataformas actuales que simplifican su aplicación.

Las herramientas de machine learning se han vuelto más accesibles, permitiendo a los usuarios crear cuentas en plataformas como OpenAI y comenzar a interactuar con IA de manera sencilla. Esto ha democratizado el uso de tecnologías avanzadas para un público más amplio.

La búsqueda semántica implica entender el significado de las consultas en lugar de solo buscar coincidencias de palabras clave. Utiliza el machine learning para mejorar la precisión de los resultados, ofreciendo respuestas más relevantes basadas en el contexto y contenido semántico de la consulta.

Las incrustaciones de vector son matrices de números que representan datos de manera que las máquinas pueden entender. Estas incrustaciones permiten que los modelos de machine learning procesen y analicen la información de manera efectiva.

En aplicaciones de JavaScript, se puede integrar machine learning para mejorar la búsqueda de datos, tanto en el backend como en el frontend. Herramientas como Weaviate ofrecen bases de datos vectoriales que facilitan esta integración, permitiendo búsquedas avanzadas en diversos tipos de datos.

Weaviate es una base de datos de código abierto y ofrece una experiencia de desarrollador superior, permitiendo realizar consultas complejas con menos código. Además, Weaviate puede implementarse tanto en la nube como en sistemas locales, ofreciendo flexibilidad en su uso.

Sí, Weaviate admite varias métricas de distancia y es muy modular, lo que permite a los usuarios añadir nuevas métricas según sus necesidades específicas.

Indexar datos en formato PDF con Weaviate involucra extraer texto de los PDFs, posiblemente fragmentando el contenido en partes más manejables, y luego convertir esos datos en incrustaciones de vector para su indexación y búsqueda efectiva.

Sebastian Witalec
Sebastian Witalec
31 min
01 Jun, 2023

Comments

Sign in or register to post your comment.

Video Summary and Transcription

La charla analiza el uso del aprendizaje automático en los motores de búsqueda, centrándose específicamente en la búsqueda semántica y los vectores de incrustación. Explora la integración de JavaScript y los modelos de aprendizaje automático, utilizando Weaviate como una base de datos vectorial de código abierto. La charla demuestra cómo conectarse a Weaviate, consultar datos y realizar consultas de aprendizaje automático. También destaca los beneficios de Weaviate, como su excelente experiencia para los desarrolladores y su rendimiento. Además, la charla aborda las opciones de personalización, las preocupaciones sobre la privacidad de los datos y la efectividad variable de diferentes modelos de aprendizaje automático.

1. Introducción a Machine Learning y Búsqueda

Short description:

Estoy muy emocionado de presentarte este tema. No tenía idea de ello hace un año. Comencemos. Mi viaje comienza con una charla en una conferencia sobre machine learning. Al principio, estaba confundido y pensé que necesitaba un doctorado. Pero luego me di cuenta de que las herramientas de machine learning se han vuelto accesibles para todos. Me enfocaré en el tema de la búsqueda utilizando machine learning, ya que todo en Internet comienza con la búsqueda.

Así que, gracias por esta introducción tan amable. Y estoy muy emocionado de presentarte este tema que, seamos sinceros, hace un año no tenía idea. Así que te llevaré en mi viaje de un año conmigo. Comencemos. Escuchaste la introducción, mi nombre es Sebastian Vitales, construyo cosas geniales, y quiero hablar contigo sobre ello. Así que mi viaje comienza hace algunos años, hace mucho tiempo en una galaxia muy, muy lejana. Fui a una conferencia y hubo una charla muy interesante que me emocionó mucho que prometía que no necesitas un doctorado para entender machine learning. Y obviamente estaba muy emocionado al respecto porque, en primer lugar, no tenía ni idea de ML pero realmente quería involucrarme, como, hey, había una promesa, como, tal vez no necesitaba estudiar durante cinco años para hacer algo relacionado con ML. La cosa es que a los 10 minutos de esa charla estaba tan confundido que ni siquiera sabía cómo me llamaba. E inmediatamente mi suposición fue como, sí, necesitas un doctorado, nunca más voy a tocar ML en mi vida, ya sabes. Eso es todo. Terminado. Pero luego pensé, bueno, no me voy a rendir. Lo que cambió y está sucediendo últimamente, y estoy seguro de que todos lo están experimentando, es que todo el mundo está hablando de ChargPT, IA, ML, como todas esas cosas que estás escuchando. Como actualmente vivo en Dinamarca. No hablo danés pero si estoy en un café, hay personas hablando en danés al azar y atrapando ChargPT, algo, algo, como que sigues atrapándolo. Fui a cortarme el pelo, ¿verdad?, y mi peluquero se confundió. Fue como, bueno, voy a preguntarle a ChargPT qué tipo de corte de pelo te queda bien. Incluso ChargPT puede ayudar con eso, así que está bien. Y lo que cambió es que esas herramientas de machine learning se volvieron accesibles, ¿verdad? De repente, están al alcance de tus dedos. De repente, puedes ir, ya sabes, a OpenAI y crear una cuenta, y luego puedes comenzar a escribir comandos y hacer preguntas a la IA y esto es alucinante. Y hay tantas aplicaciones diferentes, todo tipo de generación de imágenes, todo tipo de cosas sucediendo. Pero solo tengo 20 minutos para la charla. Y los organizadores, como, ya me lo han preguntado cinco veces. Así que, voy a terminar a tiempo. Así que, me voy a enfocar y solo hablaré sobre una cosa muy específica del machine learning, especialmente porque tengo 20 minutos y también quiero hacer algo de programación en vivo. Así que, vamos a ceñirnos a eso. Entonces, el tema de la presentación era la búsqueda o el uso de machine learning, búsqueda. Y seamos sinceros, todo lo que hacemos en Internet comienza con la búsqueda, ¿verdad? ¿Quieres escuchar música? Buscas. ¿Quieres ver una película? ¿Vas de compras? ¿Quieres encontrar información? Vas a Wikipedia, siempre buscas.

2. Desafíos con la Búsqueda Tradicional

Short description:

La búsqueda funciona, pero podría ser mejor. Los motores de búsqueda tradicionales pueden no entender el significado de una pregunta, lo que lleva a resultados irrelevantes. Por otro lado, la búsqueda semántica se centra en el significado de la pregunta y puede proporcionar respuestas más precisas. Mediante el uso de machine learning, podemos mejorar el poder de la búsqueda semántica.

Y quiero decir, probablemente pienses que es como, bueno, ¿cuál es el problema? Hemos estado haciendo eso durante décadas. La búsqueda funciona. Bueno, yo difiero, ¿verdad? Como que funciona más o menos, pero podría ser mejor. Permíteme darte un ejemplo. Entonces, con la búsqueda tradicional, puedes enfrentar algunos desafíos. Si fueras y preguntaras, como, a un motor de búsqueda tradicional, como, ¿por qué vuelan los aviones? Tal vez tengas una database completa de documentos que lo expliquen. Podrías obtener una respuesta como, ¿por qué deberías volar con aviones caros? Y es como, bueno, quiero decir, está bastante bien porque coincide con aviones, coincide con por qué y vuelan y todo eso. ¿Por qué se queja este tipo? Es como una coincidencia perfecta. Bueno, quiero decir, en realidad, preguntamos cómo vuelan los aviones, y nos dijeron que voláramos con aerolíneas caras. Bueno, eso lo resuelve para mí. Gracias. Bueno, la solución para mí es más bien buscar la pregunta desde el punto de vista semántico. ¿Cuál es el significado de la pregunta y qué tipo de respuesta puedo encontrar para ti? Y en realidad, si pones esta pregunta en Google Search, obtendrás una respuesta como esta. Vas y encontrarás la dinámica del vuelo de la NASA. Y luego, allí, la parte que nos ayudó a encontrar la respuesta fue que las alas de los aviones están diseñadas para hacer que el aire se mueva más rápido sobre la parte superior del ala, blah, blah, blah, blah, blah. Como que realmente no tenemos ninguna coincidencia de palabras clave, pero el significado está ahí, ¿verdad? Y eso es básicamente el poder de la búsqueda semántica. Así que al observar esos dos ejemplos y el tipo de cosas que puedes obtener entre los dos, quiero decir, la conclusión es bastante clara, ¿verdad? Deberíamos ir y buscar más en el tipo de búsqueda semántica y usar machine learning para ello.

QnA

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Construyendo un Asistente AI Activado por Voz con Javascript
JSNation 2023JSNation 2023
21 min
Construyendo un Asistente AI Activado por Voz con Javascript
Top Content
En esta charla, construiremos nuestro propio Jarvis utilizando Web APIs y langchain. Habrá codificación en vivo.
IA y Desarrollo Web: ¿Hype o Realidad?
JSNation 2023JSNation 2023
24 min
IA y Desarrollo Web: ¿Hype o Realidad?
En esta charla, echaremos un vistazo a la creciente intersección entre la IA y el desarrollo web. Hay mucho revuelo en torno a los posibles usos de la IA en la escritura, comprensión y depuración de código, y su integración en nuestras aplicaciones se está volviendo más fácil y asequible. Pero también hay preguntas sobre el futuro de la IA en el desarrollo de aplicaciones y si nos hará más productivos o nos quitará nuestros trabajos.
Hay mucha emoción, escepticismo y preocupación sobre el aumento de la IA en el desarrollo web. Exploraremos el verdadero potencial de la IA en la creación de nuevos marcos de desarrollo web y separaremos los hechos de la ficción.
Entonces, si estás interesado en el futuro del desarrollo web y el papel de la IA en él, esta charla es para ti. Ah, y este resumen de la charla fue escrito por IA después de que le diera algunos de mis pensamientos no estructurados.
El Ascenso del Ingeniero de IA
React Summit US 2023React Summit US 2023
30 min
El Ascenso del Ingeniero de IA
Estamos observando un cambio generacional hacia la derecha en la aplicación de la IA, impulsado por las capacidades emergentes y la disponibilidad de modelos de fundación de código abierto/API. Una amplia gama de tareas de IA que solían requerir 5 años y un equipo de investigación para lograr en 2013, ahora sólo requieren documentación de API y una tarde libre en 2023. Las capacidades emergentes están creando un nuevo título: para manejarlas, tendremos que ir más allá del Ingeniero de Prompts y escribir *software*. ¡Exploremos la amplia gama de nuevas oportunidades en la era del Software 3.0!
Aplicaciones Web del Futuro con Web AI
JSNation 2024JSNation 2024
32 min
Aplicaciones Web del Futuro con Web AI
La IA está en todas partes, pero ¿por qué deberías preocuparte como desarrollador web? Únete a Jason Mayes, líder de Web AI en Google, quien te pondrá en el camino desmitificando la terminología común para asegurarse de que nadie se quede atrás, y luego te guiará a través de algunos de los últimos modelos de aprendizaje automático, herramientas y frameworks que puedes utilizar directamente en el navegador a través de JavaScript para ayudarte a dar vida a tus ideas creativas de aplicaciones web para casi cualquier industria en la que estés trabajando. Al mover la IA al lado del cliente, no hay dependencia del servidor después de la carga de la página, lo que te brinda beneficios como privacidad, baja latencia, soluciones sin conexión y costos más bajos, que serán de creciente importancia a medida que se desarrolle el campo. Esta charla es adecuada para todos los curiosos de la web y el aprendizaje automático, así que ven y aprende algo nuevo para agregar a tu conjunto de herramientas de ingeniería web para 2024.
Construyendo la IA para Athena Crisis
JS GameDev Summit 2023JS GameDev Summit 2023
37 min
Construyendo la IA para Athena Crisis
Esta charla se adentrará en cómo construir una IA para un juego de estrategia por turnos desde cero. Cuando comencé a construir Athena Crisis, no tenía idea de cómo construir una IA. Todos los recursos disponibles eran demasiado complejos o confusos, así que simplemente comencé a construirlo basándome en cómo jugaría el juego. ¡Si quieres aprender cómo construir una IA, no te pierdas esta charla!
Cobertura de código con IA
TestJS Summit 2023TestJS Summit 2023
8 min
Cobertura de código con IA
En esta demostración rápida mostraré cómo Codium, una herramienta generativa de IA de vanguardia, está revolucionando la integridad del código. Demostraremos la capacidad de Codium para generar pruebas Mocha útiles, tomadas de un repositorio público y destacaremos la integración perfecta. Puedes ver a Codium transformando escenarios de prueba complejos en información accionable, impulsando la cobertura de código hacia adelante. ¡Únete a nosotros para un vistazo perspicaz al futuro de las pruebas automatizadas donde la velocidad se encuentra con la calidad!

Workshops on related topic

IA a demanda: IA sin servidor
DevOps.js Conf 2024DevOps.js Conf 2024
163 min
IA a demanda: IA sin servidor
Top Content
Featured WorkshopFree
Nathan Disidore
Nathan Disidore
En esta masterclass, discutimos los méritos de la arquitectura sin servidor y cómo se puede aplicar al espacio de la IA. Exploraremos opciones para construir aplicaciones RAG sin servidor para un enfoque más lambda-esque a la IA. A continuación, nos pondremos manos a la obra y construiremos una aplicación CRUD de muestra que te permite almacenar información y consultarla utilizando un LLM con Workers AI, Vectorize, D1 y Cloudflare Workers.
Cómo Resolver Problemas del Mundo Real con Remix
Remix Conf Europe 2022Remix Conf Europe 2022
195 min
Cómo Resolver Problemas del Mundo Real con Remix
Featured Workshop
Michael Carter
Michael Carter
- ¿Errores? Cómo renderizar y registrar tus errores del servidor y del clientea - Cuándo devolver errores vs lanzar excepcionesb - Configurar servicios de registro como Sentry, LogRocket y Bugsnag- ¿Formularios? Cómo validar y manejar formularios de varias páginasa - Usar zod para validar los datos del formulario en tu acciónb - Pasar por formularios de varias páginas sin perder datos- ¿Atascado? Cómo solucionar errores o funciones faltantes en Remix para que puedas continuara - Usar patch-package para solucionar rápidamente tu instalación de Remixb - Mostrar herramienta para gestionar múltiples parches y seleccionar solicitudes de extracción abiertas- ¿Usuarios? Cómo manejar aplicaciones de varios inquilinos con Prismaa - Determinar el inquilino por el host o por el usuariob - Base de datos múltiples o base de datos única/múltiples esquemasc - Asegura que los datos del inquilino siempre estén separados de los demás
Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React
React Advanced Conference 2023React Advanced Conference 2023
98 min
Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React
Top Content
Workshop
Richard Moss
Richard Moss
En esta masterclass daremos un recorrido por la IA aplicada desde la perspectiva de los desarrolladores de front end, enfocándonos en las mejores prácticas emergentes cuando se trata de trabajar con LLMs para construir grandes productos. Esta masterclass se basa en los aprendizajes obtenidos al trabajar con la API de OpenAI desde su debut en noviembre pasado para construir un MVP funcional que se convirtió en PowerModeAI (una herramienta de creación de ideas y presentaciones orientada al cliente).
En la masterclass habrá una mezcla de presentación y ejercicios prácticos para cubrir temas que incluyen:
- Fundamentos de GPT- Trampas de los LLMs- Mejores prácticas y técnicas de ingeniería de prompts- Uso efectivo del playground- Instalación y configuración del SDK de OpenAI- Enfoques para trabajar con la API y la gestión de prompts- Implementación de la API para construir una aplicación orientada al cliente potenciada por IA- Ajuste fino y embeddings- Mejores prácticas emergentes en LLMOps
Modelado de Bases de Datos Relacionales para GraphQL
GraphQL Galaxy 2020GraphQL Galaxy 2020
106 min
Modelado de Bases de Datos Relacionales para GraphQL
Top Content
WorkshopFree
Adron Hall
Adron Hall
En esta masterclass profundizaremos en el modelado de datos. Comenzaremos con una discusión sobre varios tipos de bases de datos y cómo se mapean a GraphQL. Una vez que se haya establecido esa base, el enfoque se desplazará a tipos específicos de bases de datos y cómo construir modelos de datos que funcionen mejor para GraphQL en varios escenarios.
Índice de contenidosParte 1 - Hora 1      a. Modelado de Datos de Bases de Datos Relacionales      b. Comparando Bases de Datos Relacionales y NoSQL      c. GraphQL con la Base de Datos en menteParte 2 - Hora 2      a. Diseño de Modelos de Datos Relacionales      b. Relación, Construcción de Tablas Multijoin      c. Complejidades de Consulta de Modelado de Datos Relacionales y GraphQL
Prerrequisitos      a. Herramienta de modelado de datos. El formador utilizará dbdiagram      b. Postgres, aunque no es necesario instalar esto localmente, ya que estaré utilizando una imagen de Dicker de Postgres, de Docker Hub para todos los ejemplos      c. Hasura
Construyendo tu Aplicación de IA Generativa
React Summit 2024React Summit 2024
82 min
Construyendo tu Aplicación de IA Generativa
WorkshopFree
Dieter Flick
Dieter Flick
La IA generativa está emocionando a los entusiastas de la tecnología y a las empresas con su vasto potencial. En esta sesión, presentaremos Retrieval Augmented Generation (RAG), un marco que proporciona contexto a los Modelos de Lenguaje Grande (LLMs) sin necesidad de volver a entrenarlos. Te guiaremos paso a paso en la construcción de tu propia aplicación RAG, culminando en un chatbot completamente funcional.
Conceptos Clave: IA Generativa, Retrieval Augmented Generation
Tecnologías: OpenAI, LangChain, AstraDB Vector Store, Streamlit, Langflow
Escalando tu base de datos con ReadySet
Node Congress 2023Node Congress 2023
33 min
Escalando tu base de datos con ReadySet
WorkshopFree
Aspen Smith
Nick Marino
2 authors
La base de datos puede ser una de las partes más difíciles de escalar en una aplicación web. Muchos proyectos terminan utilizando sistemas de caché ad-hoc que son complejos, propensos a errores y costosos de construir. ¿Qué pasaría si pudieras implementar un sistema de caché listo para usar para mejorar el rendimiento y la optimización de consultas sin necesidad de realizar cambios en el código de tu aplicación?
Únete a los desarrolladores Aspen Smith y Nick Marino para ver cómo puedes cambiar una línea de configuración en tu aplicación y utilizar ReadySet para escalar el rendimiento de tus consultas en órdenes de magnitud hoy mismo.