Andrew Ng представил новый Agentic Document Extraction, OCR с помощью LLM-ок.
Обещают, что система правильно понимает формат, в том числе различные инвойсы, и не галлюцинирует. К сожалению, координаты найденных частей текста не выдаются. Было бы интересно сравнить с классическим Document Understanding от Microsoft и Google.
Загрузка страницы занимает 8 секунд. Потестировать можно на va.landing.ai.
Обещают, что система правильно понимает формат, в том числе различные инвойсы, и не галлюцинирует. К сожалению, координаты найденных частей текста не выдаются. Было бы интересно сравнить с классическим Document Understanding от Microsoft и Google.
Загрузка страницы занимает 8 секунд. Потестировать можно на va.landing.ai.