🤖 Wizey vs Perplexity — ¿Puedes confiar en las citas de IA en medicina?
Perplexity se siente como la respuesta adulta a ChatGPT. Haces una pregunta, obtienes una respuesta fluida, y allí mismo, en las notas al pie, están las fuentes. La UX es limpia, las citas parecen autorizadas y — fundamentalmente para un paciente que mira los resultados de su laboratorio — toda la experiencia sugiere “esto es fiable porque está citado”.
Desde una perspectiva de diseño de producto, Perplexity hizo algo genuinamente ingenioso: entregaron RAG (Generación Aumentada por Recuperación) como experiencia de consumo y visibilizaron la recuperación. Ese es un logro real. Pero como alguien que ha visto a los usuarios interactuar con IA médica durante años, puedo decirte que la señal de confianza hace mucho trabajo que el sistema subyacente no se ha ganado del todo. En este artículo quiero explicar dónde brilla Perplexity, dónde falla específicamente en medicina y por qué un RAG estilo Wizey sobre un corpus curado es un producto diferente aunque la arquitectura rime.
Qué es realmente Perplexity
Perplexity es un producto LLM aumentado con búsqueda. Bajo el capó, una consulta dispara una búsqueda en vivo de la web, los resultados principales se obtienen y se fragmentan, los fragmentos se incrustan, los fragmentos más relevantes se introducen en un LLM — a menudo GPT, Claude o el propio modelo Sonar de Perplexity — junto con la consulta, y se le indica al modelo que responda usando esos fragmentos mientras cita cada afirmación. Este es RAG de manual como se describe en Lewis et al. (2020), envuelto en una UI rápida y atractiva.
Las decisiones clave de ingeniería son: recuperar de la web abierta en tiempo real, usar un LLM generalista para sintetizar y mostrar citas en línea. Esa combinación es la fuente tanto de sus fortalezas como de sus debilidades médicas.
Lo que funciona: conocimiento general, actualidad, visibilidad de fuentes
Para preguntas no clínicas, Perplexity es excelente. Supera a los LLM estáticos en cualquier tema donde la frescura importa — lanzamientos recientes de productos, cambios de política, desarrollos del mercado — porque realmente lee la web en el momento de la consulta. Las citas te permiten hacer clic y verificar, lo que es una disciplina real en comparación con un chatbot puro que te pide que confíes en su entrenamiento. Un análisis de JAMA (2023) señaló que las fuentes visibles elevan materialmente la confianza percibida en las respuestas de la IA, para bien y para mal.
Para un clínico haciendo escaneo de literatura, Perplexity Pro con su búsqueda de enfoque académico puede ser una herramienta de biblioteca genuinamente útil. Si sabes qué buscar en una cita, ahorra tiempo.
Para un paciente que intenta interpretar su PDF de laboratorio, las mismas características se convierten en una responsabilidad. Vale la pena desempaquetar el razonamiento.
Por qué las citas no son igual a precisión en medicina
Tres modos específicos de fallo aparecen repetidamente cuando los pacientes usan Perplexity para la interpretación de laboratorio:
1. La fuente es real, pero la afirmación que apoya no es lo que la fuente dice realmente. Un LLM que resume un fragmento de texto recuperado puede derivar. Perplexity podría citar una página legítima de los NIH mientras hace una afirmación que la página de los NIH no contiene — la página y la afirmación viven cerca estadísticamente, no semánticamente. La investigación documentada en The Lancet Digital Health (2024) muestra este patrón en múltiples sistemas RAG: las citas aumentan la confianza percibida sin necesariamente aumentar la precisión factual.
2. La fuente parece legítima pero no es médicamente autorizada. La recuperación de Perplexity trata la web abierta como su corpus. Un blog de salud bien posicionado, un resumen de Healthline, un artículo de Medium, un hilo médico popular de Reddit — estos aparecen rutinariamente en las citas junto a PubMed y Mayo. Un paciente no tiene manera fácil de ponderarlos. Las guías clínicas revisadas por pares se sientan junto a la publicación de un influencer del bienestar, ambas renderizadas con el mismo estilo de nota al pie.
3. El problema del cherry-pick. RAG recupera fragmentos que se incrustan cerca de la consulta. En un tema médico matizado, el fragmento más relevante para la consulta es a menudo una frase fuera de contexto que no refleja la guía completa. Por ejemplo, una pregunta sobre “¿es la ferritina alta siempre sobrecarga de hierro?” puede recuperar un fragmento que afirma que la ferritina sube con los depósitos de hierro — lo cual es cierto en un contexto y profundamente engañoso en el entorno inflamatorio mucho más común. La frase citada es precisa; la respuesta construida a partir de ella es incorrecta.
El ejemplo de la ferritina, concretamente
Déjame recorrer un patrón real que veo. Un paciente le pregunta a Perplexity: “mi ferritina es de 450, ¿qué significa esto?” Una respuesta típica extrae fragmentos que mencionan sobrecarga de hierro, hemocromatosis y enfermedad hepática, cita MedlinePlus y produce un ensayo con tono mesurado sobre esas condiciones. Parece autorizado.
Lo que normalmente se pierde, a menos que el usuario formule la pregunta exactamente bien, es que la ferritina es un reactante de fase aguda. En presencia de inflamación — infección, brote autoinmune, cirugía reciente, inflamación de bajo grado por obesidad — la ferritina sube independientemente de los depósitos reales de hierro. La referencia de MedlinePlus sobre ferritina lo expone con claridad. La interpretación clínica correcta depende de la colectura de PCR y del panel de hierro completo (hierro sérico, saturación de transferrina, TIBC). Sin esa colectura, una respuesta de “ferritina alta” no es incorrecta en aislamiento — simplemente opera en el marco equivocado.
Wizey maneja esto porque el pipeline extrae la ferritina y la PCR y el panel de hierro de tu PDF como valores estructurados, y la capa de interpretación tiene reglas explícitas en su grafo de conocimiento sobre la interpretación de fase aguda. Mismo patrón de arquitectura de recuperación que Perplexity, corpus completamente diferente y restricciones completamente diferentes.
La calidad del RAG es un problema de corpus, no un problema de UX
Este es el punto que quiero que escuchen los ingenieros que leen esto. La UX de Perplexity da citas. Su corpus es la web abierta. El corpus determina qué puedes y qué no puedes responder de forma fiable.
El RAG de Wizey es arquitectónicamente similar: extraer fragmentos relevantes, introducirlos en una capa de razonamiento, producir una respuesta anclada. La diferencia es el corpus — un grafo de conocimiento médico curado construido sobre guías revisadas por pares (USPSTF, ACP, NICE, recomendaciones de sociedades de cardiología y endocrinología), intervalos de referencia filtrados y rutas clínicas validadas. No hay Reddit en el corpus. No hay blogs de salud en el corpus. La compensación es menos amplitud, mucha más fiabilidad, y no puedes usar Wizey para buscar las noticias de IA de la semana pasada — solo para interpretar datos de laboratorio.
Para una visión más amplia de por qué la IA médica requiere este tipo de especialización, recomiendo la comparación pilar Wizey vs ChatGPT que cubre en profundidad la distinción generativo vs extractivo.
Privacidad: Perplexity de consumo y PHI
El producto de consumo de Perplexity conserva las consultas y salidas para la mejora del servicio bajo su política de privacidad estándar. No es un servicio cubierto por HIPAA y no está destinado a Información Médica Protegida. Perplexity Enterprise ofrece un manejo de datos más sólido, pero un BAA no es su postura predeterminada, y el producto sigue siendo fundamentalmente una herramienta de búsqueda general.
Un paciente que pega los valores de su laboratorio, su nombre en el encabezado y su fecha de nacimiento en un chat de Perplexity de consumo está exponiendo PHI a un producto de búsqueda de consumo. El producto no hace nada para advertirles, porque el producto no está construido para ese caso de uso.
Wizey, como otras IA médicas diseñadas específicamente, mantiene la PHI dentro de un límite compatible y trata los datos de laboratorio como protegidos por diseño.
Cuándo ayuda Perplexity genuinamente
Para terminar en la nota equilibrada que esto merece: Perplexity es una buena herramienta para tareas específicas adyacentes a la sanidad.
- Escanear literatura reciente sobre un fármaco o enfermedad antes de una visita con un especialista
- Comprobar si una guía se ha actualizado recientemente
- Encontrar fuentes autorizadas sobre un tema estrecho que luego puedes leer por ti mismo
- Orientarte en un subdominio médico desconocido para aprender qué términos buscar
- Leer noticias médicas extranjeras con contexto de traducción integrado
Para esto, la recuperación web en tiempo real es una característica. Solo recuerda que para la tarea más difícil de interpretar tus propios resultados numéricos de laboratorio, la web abierta es el corpus equivocado por muy ordenadamente que se rendericen las citas.
Comparación lado a lado
| Dimensión | Perplexity | Wizey |
|---|---|---|
| Corpus | Web abierta, recuperada en vivo | Grafo de conocimiento médico curado + protocolos clínicos |
| Estilo de citación | Visible en línea, autoridad mixta | Implícita, siempre de fuentes validadas |
| Manejo de PDF de laboratorio | Lee números, pega fragmentos web | Extracción estructurada + interpretación anclada en protocolo |
| Razonamiento entre marcadores | Débil — lo que los fragmentos recuperados digan | Explícito en el grafo de conocimiento (ferritina × PCR, TSH × fT4) |
| Seguimiento longitudinal | No soportado | Series temporales nativas |
| BAA de HIPAA | Consumo no, Enterprise limitado | Integrado para uso de pacientes |
| Mejor uso | Escaneo de literatura, actualidad, orientación rápida | Interpretación de laboratorio de extremo a extremo para pacientes |
Mini-FAQ
Si Perplexity cita fuentes, ¿por qué no es suficiente en medicina? La cita demuestra que existe una fuente cerca de la afirmación. No demuestra que la fuente valide la afirmación específica. Perplexity cita regularmente páginas reales que en realidad no apoyan la respuesta ensamblada — especialmente en temas clínicos matizados.
¿Puede Perplexity interpretar los resultados de mi laboratorio? Puede comentar cada marcador cosiendo fragmentos web. No puede anclar la interpretación en protocolos clínicos validados, cruzar marcadores relacionados o seguir tendencias.
¿Cumple Perplexity con HIPAA? Perplexity de consumo, no. Perplexity Enterprise tiene un manejo más estricto pero sigue siendo una herramienta de búsqueda general, no una plataforma de grado médico.
¿Cuál es la diferencia real entre el RAG de Perplexity y el RAG de Wizey? El corpus. Mismo patrón de arquitectura; web abierta vs grafo de conocimiento médico curado.
¿Cuándo es útil Perplexity en la atención sanitaria? Escaneo de literatura, comprobaciones de actualidad, orientación sobre temas — para usuarios que pueden evaluar críticamente las fuentes citadas.
En conclusión
Perplexity convirtió el RAG en un bonito producto de consumo, y para muchas preguntas no clínicas es la mejor herramienta de IA de propósito general disponible. La UX de citas visibles es una disciplina genuinamente útil para cualquier sistema de IA.
En medicina, sin embargo, la parte del sistema que realmente determina la fiabilidad es el corpus, no la UX. La web abierta es el lugar equivocado para anclar la interpretación de laboratorio de un paciente. Un grafo de conocimiento médico curado, anclado en guías revisadas por pares y rutas clínicas validadas, es sobre lo que se construye una herramienta especializada como Wizey. Mismo patrón de recuperación, promesa muy diferente — y para la tarea estrecha de leer tu analítica de forma segura, la promesa es lo que importa. Si quieres el argumento arquitectónico más profundo, la entrada pilar Wizey vs ChatGPT lo recorre de extremo a extremo.