Гарвард создал цифровую базу данных судебных дел для обучения ИИ

В Гарвардском университете отсканировали и загрузили в интернет документы более 6 млн судебных дел с целью обучения искусственного интеллекта (ИИ).

Гарвардская библиотека школы права завершила проект Caselaw Access Project (CAP) в стремлении оцифровать каждое задокументированное в Соединенных Штатах судебное дело — начиная с 1600-х годов вплоть до лета текущего года. Процесс включал в себя сканирование более 40 млн страниц. После пяти лет работы приблизительно 6,5 млн дел стали доступны онлайн, сообщил MIT Technology Review 31 октября.

Проект разрабатывался с целью создания большой базы данных юридической документации. Теперь компьютерная программа сможет анализировать тексты документов и помогать юристам в осуществлении их деятельности. Компании получат возможность обучать искусственный интеллект с тем, чтобы алгоритмы были способны принимать решения на основе анализа данных и тем самым облегчать процесс в суде.

«Думаю теперь (с базой данных. — Ред.) будут много экспериментировать, и прогресс ускорится. Действительно, очень сложно построить удобный интерфейс, если так сложно получить доступ к основным данным», — сказал один из авторов проекта Адам Циглер.

Отмечается, что раньше одним из основных препятствий в обучении ИИ для применения в юриспруденции было отсутсвие упорядоченной базы данных о судебных делах в Сети. Разработчикам алгоритмов приходилось создавать собственные базы для обучения программ.

28 октября стало известно, что швейцарская компания ABB, которая специализируется в сфере информационных технологий, собирается построить в Шанхае «самую продвинутую фабрику роботов в мире». На предприятии роботы будут производить роботов.

Источник: iz.ru

Написать комментарий