Andrew Ng представил новый Agentic Document Extraction, OCR с помощью LLM-ок.
Обещают правильно понимать формат, в том числе инвойсы всякие, и не галлюцинировать. Но конечно координаты найденных частей текста не выдают. Интересно потестить с классическим Document Understanding от Microsoft и Google.
На страницу сейчас уходит 8 секунд. Можно потестить на va.landing.ai
Обещают правильно понимать формат, в том числе инвойсы всякие, и не галлюцинировать. Но конечно координаты найденных частей текста не выдают. Интересно потестить с классическим Document Understanding от Microsoft и Google.
На страницу сейчас уходит 8 секунд. Можно потестить на va.landing.ai