Якщо корпоративні дані у вашій компанії неструктуровані, ви будете довго шукати потрібний файл на комп’ютері або документ серед сотень контрактів, рахунків-фактур, паспортів тощо. Не кажучи вже про те, що, можливо, колись доведеться весь цей обсяг даних аналізувати. У частині компаній, які працюють з персональними даними клієнтів, співробітники досі вручну виписують інформацію з посвідчень особи й інших документів. Якщо ж перекласти заповнення цих форм на клієнтів, незручностей стає ще більше.

Усі ці проблеми об’єднує одне: більшість компаній під час роботи з документами використовують ручні, трудо- та ресурсомісткі процеси. Але люди можуть помилятися, працювати так складніше, а якість обслуговування падає. 

Щоб допомогти бізнесу оптимізувати ці процеси, 2020 року в Google запустили Document AI – штучний інтелект, який дозволяє організаціям застосовувати машинне навчання (ML), щоб розв’язувати проблеми автоматизації сканування документів. 

Команда Wise IT в партнерському матеріалі розповідає більше про цей інструмент: для кого він стане корисним, які можливості має та як ним користуватися.

Партнерський матеріал?

Де застосовують Document AI

Робота з документами – невіддільна повсякденність будь-якого бізнесу. Складно знайти сферу, де Document AI не стане у пригоді. Ось лише декілька прикладів застосування цієї технології:

  • Банківський сектор. Банки можуть використовувати технологію розпізнавання документів, щоб автоматично обробляти дані, пов’язані із клієнтськими рахунками, кредитними картками, паспортами включно з фотографіями тощо. Це зменшує час, необхідний для обробки документів, а ризик помилитися при цьому менше.
  • Медичні заклади. Автоматичне сканування документів допоможе обробляти медичні записи, листи направлень до лікарів, результати тестів та інші документи.
  • Бізнес-сектор. Компанії можуть використовувати Document AI, щоб автоматично обробляти й сортувати документи, пов’язані з фінансовою звітністю, контрактами, документами про сплату податків тощо.
  • Державні установи. Урядові структури можуть автоматично обробляти документи, пов’язані зі зверненнями громадян, податковою звітністю, ліцензуванням тощо.
  • Готельний бізнес. За допомогою автоматичного сканування документів можна значно прискорити реєстрацію гостей.
  • Прикордонні служби. Через контрольно-пропускні пункти проходять великі потоки людей. Якщо дані з їхніх паспортів вносити автоматично, можна уникнути довгих черг і затримок.

Компанія Google вже розробила спеціалізовані моделі для використання в певних галузях, наприклад, обробка іпотечних кредитів і закупівлі. Але за допомогою інструментів навчання моделей кожна організація може налаштувати Document AI під свої потреби.

Ми у Wise IT вже маємо досвід впровадження Document AI серед компаній фінансового сектора. У низці пілотних проєктів ми автоматизували процес верифікації. Також ми налаштували процеси розпізнавання нових документів і поточного архіву – у ньому було понад мільйон документів. Це допомогло прискорити пошук і процес структурування даних більш ніж на 50%.

Document AI та ряд інших сервісів Google Cloud дають необмежені можливості для вирішення будь-яких завдань з розпізнавання документів, причому можна використовувати як уже налаштовані моделі, так і створювати будь-яких кастомні клієнтські шаблони. 

Дізнатися більше про Wise IT

З чого складається Document AI

Основними інструментами Document AI є Document AI Workbench і Document AI Warehouse – засоби для навчання моделей штучного інтелекту, зберігання документів та роботи з ними. 

Document AI від Google: ШІ, який обробляє документи швидше за людину. Його можна налаштувати під себе
Складові частини Document AI

Як обробляти документи з Document AI Workbench

За допомогою Document AI Workbench організації можуть обробляти документи – створювати власні моделі машинного навчання, що відповідають їхнім бізнес-потребам, та отримувати структуровані дані з високим рівнем точності. Зі зручним інтерфейсом навіть бізнес-користувачі, які не дуже знайомі з машинним навчанням, можуть «навчити» модель.

Щобільше, якщо організація хоче передати знання із заздалегідь навчених моделей і покращити їх, скажімо, щоб включити нові поля, тепер можна зробити це за допомогою «донавчання». Функція підвищення кваліфікації моделі особливо корисна для поширених, але складних варіантів використання. Так вам не доведеться починати все спочатку, ви заощадите час і ресурси.

Наприклад, компанія Libeo використала Document AI, щоб підвищити точність аналізатора рахунків з 75,6% до 83,9%

«Завдяки донавчанню моделі результати Document AI тепер перевершують результати конкурентів і дозволяють Libeo заощадити близько 20% від загальних витрат на навчання моделей у довгостроковій перспективі», – розповів технічний директор Libeo П’єр-Антуан Гландьє.

На конференції Next’22 Google оголосив про нові можливості перевірки посвідчень особи за допомогою гнучкого API. З його допомогою можна виявляти змінені чи підроблені документи, що засвідчують особу.

Детальніше про те, як обробляти документи з Document AI Workbench тут

Як зберігати документи й керувати ними з Document AI Warehouse

Інструмент Document AI Warehouse дозволяє підприємствам шукати, зберігати, контролювати документи й керувати ними, а також їхніми даними та метаданими, витягнутими за допомогою ШІ, на єдиній платформі. Завдяки простому й інтуїтивно зрозумілому вебінтерфейсу Document AI Warehouse користувачі можуть переглядати, редагувати, масово оновлювати і впорядковувати документи з тек.

А інструменти безпеки допоможуть контролювати, хто має доступ на рівні документів і тек, а також призначати користувачам і групам дозволи на перегляд, редагування, керування, спільне використання та видалення документів. Ви можете переносити, синхронізувати чи об’єднувати документи з інших сховищ, таких як Microsoft SharePoint, Amazon S3 та IBM FileNet. Або, якщо це неможливо, Google просто індексує контент і будь-які вилучені/помічені метадані.

Детальніше про те, що дозволяє робити Document AI Warehouse за посиланням

А що «під капотом»?

Окрім передових розробок у сфері машинного навчання Google використовує технологію оптичного розпізнавання символів, або OCR. Це технологія перетворення зображень тексту на комп’ютерний текст, який можна індексувати, шукати й редагувати. Під час роботи над нею команди інженерів Google використовували підхід, орієнтований на широке мовне охоплення. Так вони змогли розробити архітектуру, яка потенційно може працювати з усіма наявними мовами та системами письма. 

Google використовує приховані марковські моделі (HMM), щоб розуміти вхідні дані як цілу послідовність, а не намагатися спершу розбити її на частини. Це схоже на те, як сучасні системи розпізнавання мовлення розпізнають аудіовхід.

Ця технологія доступна для кожного в Google Workspace. Google додав OCR до Google Drive та адаптував її для підтримки всіх основних мов світу – їх понад двісті. Щоб скористатися даною технологією, достатньо відкрити на «Google Диску» відсканований документ як документ Google. У результаті відкриється файл з оцифрованим текстом зображення.

Вам навіть не потрібно вказувати, якою мовою написаний документ, система визначить це автоматично. Але ви також можете використовувати API «Google Диску» для більш явного контролю над визначенням мови в документах.


Wise IT як Google Premier Partner має команду висококваліфікованих фахівців, які здатні виконати будь-яке завдання, пов’язане з рішеннями Google Cloud і Google Workspace. Якщо вашому бізнесу потрібно автоматизувати роботу з документами, або ви зацікавлені в інших інструментах, розроблених каліфорнійським техногігантом, звертайтесь за безкоштовною консультацією за телефоном +380442772323 або за адресою [email protected].

Партнерський матеріал?

Дізнатися більше про Wise IT

Це партнерський матеріал. Інформацію для цього матеріалу надав партнер.
Редакція відповідає за відповідність стилістики редакційним стандартам.
Замовити матеріал про вас у форматі PR-статті ви можете тут.

Loading comments...

Повідомити про помилку

Текст, який буде надіслано нашим редакторам: