Processor trong XML




Khi một chương trình phần mềm đọc một tài liệu XML và thực hiện các hành động tương ứng, công việc này được gọi là tiến trình xử lý XML. Bất cứ chương trình nào mà có thể đọc và xử lý các tài liệu XML đều được biết đến như là một XML Processor. Một XML Processor đọc XML file và chuyển nó vào trong các cấu trúc in-memory mà phần còn lại của chương trình có thể truy cập.

XML Processor chủ yếu nhất đọc một tài liệu XML và chuyển đổi nó thành một biểu diễn nội tại cho các chương trình hoặc chương trình con khác để sử dụng. Đây được gọi là một Parser, và nó là một thành phần quan trọng của mỗi chương trình xử lý XML.

Processor liên quan tới tiến trình xử lý các chỉ thị. Bạn có thể tìm hiểu về các chỉ thị xử lý này trong chương: Chỉ thị xử lý trong XML.

Phân loại

XML Processor được phân loại thành Validating hoặc Non-validating phụ thuộc vào việc có hay không chúng kiểm tra tính hợp lệ của các tài liệu XML. Một Processor mà phát hiện một lỗi về tính hợp lệ phải có thể báo cáo nó, nhưng có thể vẫn tiếp tục tiến trình xử lý như bình thường.

Một số loại Validating là:xml4c (IBM, trong C++), xml4j (IBM, trong Java), MSXML (Microsoft, trong Java), TclXML (TCL), xmlproc (Python), XML::Parser (Perl), Java Project X (Sun, trong Java).

Một số loại Non-validating là: OpenXML (Java), Lark (Java), xp (Java), AElfred (Java), expat (C), XParse (JavaScript), xmllib (Python).