Desarrollador Senior Full-Stack (Python & React) ¿Quiénes somos? En APIUX nos identificamos como una fábrica de talento con una fuerte orientación de negocio donde continuamente brindamos espacios a las nuevas generaciones para mostrar y desarrollar ideas, conocimientos, y exponer modelos de negocio innovadores enfocados en cubrir siempre, con una propuesta de valor, las necesidades de nuestros clientes. ¿Qué hacemos? Posicionamos al mejor talento, dándole un enfoque estratégico y nos esforzamos por entender a fondo la cultura y valores de cada uno de nuestros clientes para así hacer el match perfecto entre cliente y talento. Además nos aseguramos de brindar una experiencia de candidato y Employee experience ejemplar para nuestros futuros Happeners. ¿Quiénes somos? En APIUX nos identificamos como una fábrica de talento con una fuerte orientación de negocio donde continuamente brindamos espacios a las nuevas generaciones para mostrar y desarrollar ideas, conocimientos, y exponer modelos de negocio innovadores enfocados en cubrir siempre, con una propuesta de valor, las necesidades de nuestros clientes. ¿Qué hacemos? Posicionamos al mejor talento, dándole un enfoque estratégico y nos esforzamos por entender a fondo la cultura y valores de cada uno de nuestros clientes para así hacer el match perfecto entre cliente y talento. Además nos aseguramos de brindar una experiencia de candidato y Employee experience ejemplar para nuestros futuros Happeners. Ser Happeners significa pertenecer a una familia con principios integrales donde el espíritu ágil, colaborativo, innovador y deportivo son el combustible que inyectamos en nuestro corazón día a día para hacer las cosas cada vez mejor. Objetivo del cargo: Diseñar y construir la capa de aplicación de extremo a extremo para un sistema Generative-AI on-premise, integrando pipelines RAG sobre grafos y servicios de LLM fine-tuneados. ¿Cuáles serán tus funciones? Arquitectura de Generative AI. Diseñar la integración de RAG (GraphRAG) con LlamaIndex/TextToCypherRetriever y vLLM. Crear abstracciones backend en Python que combinen recuperación semántica, consultas Cypher y batching dinámico de tokens. Pipeline de inferencia y fine-tuning. Implementar endpoints que orquesten el contexto: Recuperación vectorial + graph traversal (Cypher via LLM). Preprocesado de prompts avanzados (prompt templates, few-shot). Gestionar llamadas a vLLM (y/o TGI) con control de temperatura, top-k sampling y tokens máximos. Frontend React para GenAI. Componentes interactivos para: Formulación de consultas en lenguaje natural. Visualización dinámica del subgrafo Neo4j (D3.js o vis.js). Presentación de cadenas de pensamiento (CoT) y citas textuales extraídas. Calidad y métricas. Instrumentar métricas en tiempo real: latencia de infencia, throughput de tokens/segundo, tasas de “hallucination” (comparar citas vs. KG). Colaborar con QA para definir escenarios de prueba de modelos (robustness, bias, fidelity). Seguridad y escalabilidad. Asegurar rutas seguras (OAuth2, JWT). Desplegar en Kubernetes con autoscaling de pods vLLM y balanceo de carga. ¿Qué esperamos de ti para hacer un buen match? Requisitos imprescindibles 5+ años full-stack con Python/React JS. 3+ años integrando Generative AI: RAG, LLM APIs, vLLM o similar. Experiencia con LlamaIndex, LangChain o similares. Conocimiento profundo de vLLM/TGI, prompt engineering y fine-tuning local (LoRA/QLoRA). Docker, Kubernetes (NVIDIA Device Plugin), CI/CD (GitHub Actions/GitLab). ¿Qué te haría sumar puntitos adicionales con nosotros? Visualización de grafos interactivos. Familiaridad con frameworks de testing de IA (e.g., Guardrails, OpenAI function calling). Contribuciones a proyectos open-source de RAG o LLMs. Modalidad de trabajo: Remoto Algunos de nuestros beneficios: Apiux Days Día libre en tu cumpleaños Día libre por mudanza Bonos por nacimiento, matrimonio y referidos Alianzas con Open English, Coderhouse, Self Development y Y-Share Afiliación a caja de compensación #J-18808-Ljbffr