When should I use XPath instead of CSS selectors?

CSS selectors are simpler and faster for basic element selection by tag, class, or ID. Choose XPath when you need to select by text content (//a[contains(text(),'Login')]), navigate upward to parent nodes, use complex predicates, or work with XML (not HTML) documents. XPath is also required in XSLT and XQuery contexts.

What changed between XPath 1.0 and 2.0?

XPath 2.0 added a richer type system (dates, sequences, regular expressions), conditional expressions (if/then/else), quantified expressions (some/every), and range expressions. However, most browsers and scraping tools only support XPath 1.0. Use XPath 2.0 features in server-side tools like Saxon or when working with XSLT 2.0.

How do I handle XML namespaces in XPath?

Namespaced elements require a prefix mapping. In most APIs, you register a namespace prefix (e.g., ns='http://example.com') and then query using that prefix: //ns:book/ns:title. Without registering the namespace, //book will not match elements in a namespace even if the local name is 'book'. Some tools support local-name() as a workaround: //*[local-name()='book'].

XPath Tester: запити до XML-документів з XPath

У цій статті

Що таке XPath?

XPath (XML Path Language) — це стандартна мова запитів W3C для вибору вузлів з XML-документів. Вона використовує синтаксис, подібний до шляхів, для навігації ієрархічною структурою XML-дерева, вибираючи елементи, атрибути та текстові вузли на основі їхньої позиції, назви або значення.

XPath не є самостійною технологією — він вбудований в інші стандарти, такі як XSLT, XQuery та DOM API. Усі сучасні браузери підтримують XPath для запитів до HTML-документів, а інструменти як Selenium, Scrapy та lxml широко використовують вирази XPath для веб-скрапінгу та автоматизованого тестування.

Як працюють запити XPath

Вираз XPath навігує деревом документа, використовуючи осі (напрямки), тести вузлів (фільтри) та предикати (умови). Розуміння цих трьох концепцій дозволяє побудувати будь-який запит.

Осі та шляхи — / вибирає від кореня, // вибирає нащадків будь-де, .. переходить до батьківського елемента, а іменовані осі як following-sibling:: навігують відносно поточного вузла
Предикати та фільтри — квадратні дужки [] додають умови: //book[price>30] вибирає книги з ціною понад 30, а //div[@class='main'] вибирає div з конкретним атрибутом класу
Функції та оператори — XPath надає вбудовані функції, такі як contains(), starts-with(), normalize-space() та count() для маніпулювання рядками, порівняння та підрахунку вузлів

Спробуйте безкоштовно — реєстрація не потрібна

Тестувати запит XPath →

Коли використовувати XPath

XPath є незамінним, коли потрібно програмно витягувати конкретні дані з XML або HTML-документів.

Веб-скрапінг — витягуйте ціни товарів, заголовки статей або посилання з веб-сторінок за допомогою виразів XPath в інструментах як Scrapy, Puppeteer або консолях розробника браузерів
Конфігурація XML — запитуйте та валідуйте складні конфігураційні файли, такі як Maven pom.xml, маніфести Android або контексти Spring XML, для пошуку конкретних налаштувань або залежностей
XSLT-перетворення — вибирайте вузли для перетворення в таблицях стилів XSLT, які повністю покладаються на вирази XPath для зіставлення та обробки XML-елементів у різні вихідні формати

Поширені запитання

Коли використовувати XPath замість CSS-селекторів?

CSS-селектори простіші та швидші для базового вибору елементів за тегом, класом або ID. Обирайте XPath, коли потрібно вибирати за текстовим вмістом (//a[contains(text(),'Увійти')]), навігувати вгору до батьківських вузлів, використовувати складні предикати або працювати з XML-документами (не HTML). XPath також необхідний у контекстах XSLT та XQuery.

Що змінилося між XPath 1.0 та 2.0?

XPath 2.0 додав багатшу систему типів (дати, послідовності, регулярні вирази), умовні вирази (if/then/else), квантифіковані вирази (some/every) та вирази діапазону. Однак більшість браузерів та інструментів скрапінгу підтримують лише XPath 1.0. Використовуйте функції XPath 2.0 в серверних інструментах, таких як Saxon, або при роботі з XSLT 2.0.

Як обробляти простори імен XML у XPath?

Елементи з просторами імен вимагають відображення префіксів. У більшості API ви реєструєте префікс простору імен (наприклад, ns='http://example.com') і потім запитуєте з цим префіксом: //ns:book/ns:title. Без реєстрації простору імен //book не відповідатиме елементам у просторі імен, навіть якщо локальне ім'я 'book'. Деякі інструменти підтримують local-name() як обхідний шлях: //*[local-name()='book'].

Пов'язані інструменти

JSONPath: мова запитів для вилучення даних з JSONВивчіть синтаксис JSONPath для фільтрації, нарізки та вилучення значень зі складних структур JSON.Читати статтю → Форматер JSON: Форматуйте, мінімізуйте та перевіряйте JSON онлайнБезладний JSON важко читати та відлагоджувати. Навчіться форматувати та перевіряти дані JSON.Читати статтю → Форматувальник XML: прикрашення, валідація та мініфікація XMLФорматуйте, валідуйте та мініфікуйте XML-дані з налаштовуваними відступами. Дізнайтеся, як працює форматування XML.Читати статтю →

Назад до блогу