When should I use XPath instead of CSS selectors?

CSS selectors are simpler and faster for basic element selection by tag, class, or ID. Choose XPath when you need to select by text content (//a[contains(text(),'Login')]), navigate upward to parent nodes, use complex predicates, or work with XML (not HTML) documents. XPath is also required in XSLT and XQuery contexts.

What changed between XPath 1.0 and 2.0?

XPath 2.0 added a richer type system (dates, sequences, regular expressions), conditional expressions (if/then/else), quantified expressions (some/every), and range expressions. However, most browsers and scraping tools only support XPath 1.0. Use XPath 2.0 features in server-side tools like Saxon or when working with XSLT 2.0.

How do I handle XML namespaces in XPath?

Namespaced elements require a prefix mapping. In most APIs, you register a namespace prefix (e.g., ns='http://example.com') and then query using that prefix: //ns:book/ns:title. Without registering the namespace, //book will not match elements in a namespace even if the local name is 'book'. Some tools support local-name() as a workaround: //*[local-name()='book'].

XPath Tester: consultar documentos XML con XPath

En este artículo

Que es XPath?

XPath (XML Path Language) es un lenguaje de consulta estandarizado por el W3C para seleccionar nodos de documentos XML. Utiliza una sintaxis similar a rutas para navegar por la estructura jerarquica de un arbol XML, seleccionando elementos, atributos y nodos de texto segun su posicion, nombre o valor.

XPath no es una tecnologia independiente -- esta integrado en otros estandares como XSLT, XQuery y las API del DOM. Todos los navegadores modernos soportan XPath para consultar documentos HTML, y herramientas como Selenium, Scrapy y lxml utilizan ampliamente las expresiones XPath para web scraping y pruebas automatizadas.

Como funcionan las consultas XPath

Una expresion XPath navega por el arbol del documento usando ejes (direcciones), pruebas de nodos (filtros) y predicados (condiciones). Comprender estos tres conceptos le permite construir cualquier consulta.

Ejes y rutas -- / selecciona desde la raiz, // selecciona descendientes en cualquier lugar, .. sube al padre, y los ejes nombrados como following-sibling:: navegan relativo al nodo actual
Predicados y filtros -- los corchetes [] agregan condiciones: //book[price>30] selecciona libros con precio superior a 30, mientras que //div[@class='main'] selecciona divs con un atributo de clase especifico
Funciones y operadores -- XPath proporciona funciones integradas como contains(), starts-with(), normalize-space() y count() para manipulacion de cadenas, comparacion y conteo de nodos

Pruébalo gratis — sin registro

Probar una consulta XPath →

Cuando usar XPath

XPath es esencial siempre que necesite extraer datos especificos de documentos XML o HTML programaticamente.

Web scraping -- extraiga precios de productos, titulos de articulos o enlaces de paginas web usando expresiones XPath en herramientas como Scrapy, Puppeteer o las consolas de desarrollador del navegador
Configuracion XML -- consulte y valide archivos de configuracion complejos como Maven pom.xml, manifiestos Android o contextos Spring XML para encontrar configuraciones o dependencias especificas
Transformaciones XSLT -- seleccione nodos para transformacion en hojas de estilo XSLT, que dependen enteramente de las expresiones XPath para hacer coincidir y procesar elementos XML en diferentes formatos de salida

Preguntas frecuentes

Cuando debo usar XPath en lugar de selectores CSS?

Los selectores CSS son mas simples y rapidos para la seleccion basica de elementos por etiqueta, clase o ID. Elija XPath cuando necesite seleccionar por contenido de texto (//a[contains(text(),'Iniciar sesion')]), navegar hacia nodos padre, usar predicados complejos o trabajar con documentos XML (no HTML). XPath tambien es requerido en contextos XSLT y XQuery.

Que cambio entre XPath 1.0 y 2.0?

XPath 2.0 agrego un sistema de tipos mas rico (fechas, secuencias, expresiones regulares), expresiones condicionales (if/then/else), expresiones cuantificadas (some/every) y expresiones de rango. Sin embargo, la mayoria de los navegadores y herramientas de scraping solo soportan XPath 1.0. Use las funciones de XPath 2.0 en herramientas del lado del servidor como Saxon o cuando trabaje con XSLT 2.0.

Como manejar espacios de nombres XML en XPath?

Los elementos con espacio de nombres requieren un mapeo de prefijo. En la mayoria de las API, registra un prefijo de espacio de nombres (ej. ns='http://example.com') y luego consulta usando ese prefijo: //ns:book/ns:title. Sin registrar el espacio de nombres, //book no coincidira con elementos en un espacio de nombres aunque el nombre local sea 'book'. Algunas herramientas soportan local-name() como alternativa: //*[local-name()='book'].

Herramientas relacionadas

JSONPath: lenguaje de consulta para extraer datos JSONAprenda la sintaxis JSONPath para filtrar y extraer valores de estructuras JSON complejas.Leer artículo → Formateador JSON: Embellece, minifica y valida JSON en líneaEl JSON desordenado es difícil de leer y depurar. Aprende a formatear y validar datos JSON al instante.Leer artículo → Formateador XML: embellecer, validar y minificar XMLFormatea, valida y minifica datos XML con indentación configurable. Aprende cómo funciona el formateo XML.Leer artículo →

Volver al Blog