Inteligência Artificial na Justiça: como encontrar “agulhas no palheiro” em milhões de processos

10/09/2018 | 2 min. de leitura

Cientistas de dados do Lab da Justiça da Softplan aplicaram técnicas de Inteligência Artificial para encontrar processos semelhantes entre si. Documentos que representam “agulhas no palheiro” num universo de milhões de documentos. O resultado mostrou como as novas tecnologias podem solucionar tarefas impossíveis de serem realizadas manualmente.

O estudo de Tiago Melo e Richerland de Medeiros foi feito a pedido de uma operadora de planos de saúde. O objetivo era encontrar, num universo de 65,1 milhões de processos no TJSP, TJRJ e STJ, pedidos similares referentes a seis temas determinados. Estes temas são relacionados ao setor de saúde suplementar e candidatos a Incidente de Resolução de Demanda Repetitiva (IRDR).

O IRDR é um instrumento legal introduzido no novo Código de Processo Civil. Ele possibilita que decisões de cortes superiores sejam seguidas de forma automática a processos que tenham os mesmos precedentes. A grosso modo: uma só decisão pode repercutir em milhares de outros processos semelhantes.

Segundo o CNJ, apenas 2,5% dos processos na Justiça estão hoje vinculados aos temas precedentes. Isso equivale a 2,1 milhões de ações que podem ser resolvidas uniformemente.

Metodologia do estudo

A primeira etapa do trabalho foi reduzir a população: de 65,1 milhões, foram selecionados 643,4 mil processos em que uma das partes é uma empresa operadora de saúde. Destes, 225 mil tinham petições iniciais digitais, em que os pedidos podiam ser “lidos” por uma inteligência artificial. Este filtro diminuiu o trabalho de processamento de dados.

Nesta base de 225 mil petições, os autores então aplicaram a técnica de análise de semântica latente (LSA — Latent Semantic Analysis) para buscar os processos cabíveis de IRDR. A LSA é uma técnica da Ciência de Dados que possibilita utilizar recursos matemáticos para interpretação textual. Quando bem empregada, permite categorizar documentos por grau de similaridade que, textualmente, não tenham afinidade aparente.

Como os temas a serem classificados ainda são candidatos a se tornaram IRDR, não havia um conjunto de processos que pudessem orientar o treinamento de um modelo matemático. Dessa forma, os autores adotaram uma abordagem por indução, com a elaboração de um dicionário semântico individual, contemplando os termos, expressões e contextos que definem cada tema. Todas as petições iniciais foram lidas artificialmente e receberam uma pontuação por grau de similaridade com cada dicionário.

Conclusão: 8.706 casos candidatos a IRDR

De 225 mil petições pesquisadas, foram encontrados 8.706 casos candidatos a Incidente de Resolução de Demanda Repetitiva. Ou seja, 3,8% dos processos que poderiam ser resolvidos uniformemente de acordo com a jurisprudência. Este é um é um percentual bastante representativo, considerando a especificidade dos seis temas objeto de estudo.

“Juridicamente e socialmente, esse é um expediente de um grande impacto. Além de aliviar as unidades judiciais de análise e atenção em uma quantidade significativa de processos, permitirá, que as decisões em instâncias superiores sejam aplicadas de forma homogênea, elevando significativamente seus patamares de produtividade”, escreveram Melo e Medeiros.

O estudo deu origem a um artigo acadêmico que foi apresentado no VIII Encontro Internacional do Conselho Nacional de Pesquisa e Pós-Graduação em Direito (Conpedi), em Zaragoza, na Espanha. A Softplan esteve presente no evento, que ocorreu nos dias 6 e 7 de setembro.

Seus comentários são sempre muito bem-vindos. Comente!

Este espaço destina-se às repercussões sobre notícias e artigos publicados no SAJ Digital. São de responsabilidade de seus autores. Não servem como abertura de chamados e atendimentos para o portal e-SAJ.

Leia também

Receba nossas novidades por e-mail:

Fale com o
especialista
Desenvolvido por: Linkedin Instagram