Google Gradient поддерживает Send AI, чтобы помочь предприятиям извлекать данные из сложных документов

Янв 24, 2024 | Железо и Программы | Нет комментариев

0
(0)
Время чтения 4 минуты

Молодой голландский стартап хочет помочь компаниям получать дополнительные данные из больших объемов сложных документов, где точность и безопасность имеют первостепенное значение. Для этого он только что заручился поддержкой Google Gradient Ventures.

Send AI, как называется стартап, бросает вызов признанным игрокам в области обработки документов, таким как UiPath, Abbyy, Rossum и Kofax, с настраиваемой платформой, которая позволяет компаниям точно настраивать модели ИИ для индивидуального извлечения данных. потребности.

Например, компании, работающей в строго регулируемой отрасли, такой как страхование, скорее всего, придется обрабатывать множество форматов: от PDF-файлов и бумажных файлов до фотографий на смартфоне, снятых со всевозможными ориентациями и фоновым «шумом». Такие нестандартные «неструктурированные» типы данных могут быть достаточно сложными для анализа людьми, но полностью машинный подход может привести к ошибочному отклонению претензий или возмещению расходов, а также к административной головной боли в дальнейшем.

Действительно, типичное готовое программное обеспечение для обработки документов часто предназначено для более распространенных типов документов, которые пересекаются с несколькими отраслями, что делает их непригодными для определенных случаев использования. С другой стороны, с помощью Send AI компании могут обучить модель компьютерного зрения распознавать конкретные документы и отдельную языковую модель для извлечения и проверки соответствующих данных — с подключением людей, если есть какие-либо сомнения, для контроля и проверки каждого документа. пройти через веб-интерфейс.

«Эта проверка может быть такой же простой, как проверка того, действительно ли ожидаемое число является числом, или более сложный поиск регистрационного номера в базе данных, чтобы увидеть, есть ли совпадение», — рассказал TechCrunch основатель и генеральный директор Send AI Том Трентельман. «О любых нарушениях безопасности будет сообщено на рассмотрение человека».

Компания Send AI, основанная в Амстердаме в 2021 году первоначально как Autopilot, ранее привлекла небольшие инвестиции в размере 100 000 долларов США от фонда выпускников университетов, но по мере того, как она начинает наращивать темпы, теперь она привлекла еще 2,2 миллиона евро (2,4 миллиона долларов США) в рамках предварительной программы. -начальный раунд финансирования, возглавляемый Google Gradient Ventures и Keen Venture Partners, при участии ряда ангелов из таких компаний, как DeepMind.

Как это работает

Компании могут получить доступ к облачному программному обеспечению Send AI через API, который передает данные из документов, отправленных по электронной почте. После получения Send AI визуально улучшает документы перед отправкой в ​​свои языковые модели для классификации и извлечения.

Что касается целевого рынка, Трентельман говорит, что компания в основном ориентирована на более крупные предприятия, поскольку они «больше всего борются с документами», хотя на самом деле любая компания, которая обрабатывает большие объемы документов, может найти применение этой технологии.

Авторы изображений : Отправить AI: извлечение данных

Возможно, само собой разумеется, что помимо множества существующих инструментов обработки документов, которые уже есть на рынке, Send AI противостоит новому поколению стартапов, продающих услуги, основанные на новых мощных моделях больших языков (LLM), таких как OpenAI. GPT-X (который поддерживает ChatGPT). Но хотя Трентельман признает, что такие продукты отлично работают в ситуациях, требующих «субъективно хорошей» оценки, таких как обобщение или ответы на вопросы, где требуется высокая степень точности при работе с большими объемами документов, это совсем другая история.

«Рано или поздно вы столкнетесь с этими технологиями — большие, общие LLM по-прежнему непредсказуемы, медленны и дороги», — сказал Трентельман. «В Send AI мы позволяем клиенту создавать собственное решение».

Под капотом Send AI построен на небольших моделях с открытым исходным кодом, которые клиент сначала обучает, обрабатывая небольшой набор документов вручную, после чего он промывает и повторяет новые документы с участием людей для внесения исправлений.

Что касается цен, Send AI взимает базовую кредитную оплату, при этом клиенты платят за каждый этап обработки. «Таким образом, мы можем различать обработку 50-страничного PDF-файла или просто фрагмента одного текста», — сказал Трентельман. «Наши модели дешевы, быстры и надежны, поэтому мы можем развертывать их индивидуально для каждого клиента. Таким образом, клиенты могут контролировать свои данные и производительность, поэтому мы преуспеваем в регулируемых отраслях, таких как медицинское страхование и государственное управление».

Контроль

Send AI утверждает, что ее технология понравится жестко регулируемым отраслям из-за контроля, который она дает клиентам над их данными, что может показаться нелогичным, учитывая, что все они основаны на облаке. Тем не менее, Трентельман указывает на то, как работает типичный LLM от OpenAI, по сравнению с тем, как он может объединять данные обучения от нескольких разных клиентов в единую модель, что повышает вероятность утечки конфиденциальных данных. Именно поэтому мы стали свидетелями появления множества стартапов, обещающих защитить частные данные с помощью программного обеспечения на базе LLM.

Компания Send AI пытается решить подобные проблемы, развертывая небольшие изолированные модели трансформаторов с открытым исходным кодом для каждого клиента.

«Для выполнения работы мы используем множество из них — в готовом виде они не производят особого впечатления, но после обучения на высококачественных данных они становятся мощными и точными», — сказал Трентельман.

Таким образом, хотя модели и связанные с ними данные обучения по-прежнему хранятся в облаке Send AI, использование изолированных моделей означает, что они могут точно определить, где находятся данные, и, таким образом, удалить их по запросу. Этого, по мнению Трентельмана, достаточно, чтобы сделать его «предпочтительным кандидатом» перед другими поставщиками, и это в некоторой степени помогает убедить компании, ориентированные на конфиденциальность данных, в том, что локальное развертывание — не единственный вариант.

«В настоящее время более регулируемые компании разрешают поставщикам использовать публичное облако при условии, что они соблюдают обширный список правил», — сказал Трентельман. «С самого начала у нас всегда возникал вопрос, можем ли мы развернуть локальное решение, но в конечном итоге все компании, кроме одной, выбрали наше предложение публичного облака».

На данный момент Send AI работает в режиме закрытого бета-тестирования, хотя у него уже есть несколько впечатляющих клиентов, включая страхового гиганта Axa. Имея сегодня команду из семи человек, компания планирует использовать новые денежные вливания, чтобы удвоить численность персонала в течение года перед полным коммерческим запуском.

Насколько публикация полезна?

Нажмите на звезду, чтобы оценить!

Средняя оценка 0 / 5. Количество оценок: 0

Оценок пока нет. Поставьте оценку первым.

Подпишитесь на нашу рассылку

AliExpress WW

0 Комментариев

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

 

Не копируйте текст!