Discover OCR language support and migration guide

PSPDFKit Server has been deprecated and replaced by Document Engine. To migrate to Document Engine and unlock advanced document processing capabilities, refer to our migration guide. Learn more about these enhancements on our blog.

The Nutrient OCR component supports a wide range of languages, enabling precise text recognition based on linguistic characteristics such as ligatures, punctuation rules, and symbol variations. To ensure accurate text extraction, you must specify the language of the document during OCR configuration.

The following languages are supported across all platforms:

Croatian
Czech
Danish
Dutch
English
Finnish
French
German
Indonesian
Italian
Malay
Norwegian
Polish
Portuguese
Serbian
Slovak
Slovenian
Spanish
Swedish
Turkish
Welsh

Languages aren’t region-specific. For example, English applies to both American English and British English.

If your required language isn’t listed, contact Support for assistance.