Startup cria sistema que lê todas a páginas da internet

Desenvolvida pela Diffbot, da Califórnia, tecnologia de inteligência artificial já é utilizada por clientes como Snapchat, Nasdaq, Adidas e a Nike

21/09/2020

Startup cria sistema que lê todas a páginas da internet

Tamanho fonte

Por redação AIoT Brasil

Um sistema de inteligência artificial que lê todas as páginas da internet, em todos os idiomas, e extrai o máximo possível de fatos para “aprender” com eles e criar o maior gráfico de conhecimento de todos os tempos: essa é proposta da startup Diffbot, de Stanford, Califórnia, ao desenvolver um novo modelo de linguagem que automatiza totalmente o processo de construção de textos.

Assim como o GPT-3, lançado em julho pela OpenAI, o sistema da Diffbot coleta na web bilhões de dados e cria textos que parecem ter sido escritos por humanos. Porém, em vez de usar os dados para treinar um modelo de linguagem, a Diffbot transforma o que lê em uma série de informações inter-relacionadas, com sujeito, verbo e objeto.

Ao comparar os modelos de linguagem atuais com o novo sistema, Mike Tung, CEO da Diffbot, disse que eles são imitadores incríveis, mas têm pouca noção do que estão realmente dizendo: “Eles são realmente bons em gerar histórias sobre unicórnios, mas não são treinados para serem factuais”, afirmou, em entrevista à revista do Instituto de Tecnologia de Massachusetts.

O gráfico de conhecimento é reconstruído de quatro em quatro dias, com base nos quase 150 milhões de novos dados recolhidos a cada mês, e usa mais algoritmos de aprendizado de máquinas para conectar esses novos fatos aos antigos e criar novas conexões que substituem as desatualizadas. A IA da Diffbot lê a web como um humano o faria, mas com muito mais velocidade e em todos os idiomas.

O sistema da Diffbot é aberto a pesquisadores, gratuitamente, mas a startup já tem cerca de 400 clientes pagantes, entre os quais, Snapchat, Nasdaq, Adidas e a Nike (a fabricantes de artigo esportivo utilizam a ferramenta para pesquisar tênis falsificados na web). Ao lado do Google e da Microsoft, a Diffbot é uma das três únicas empresas norte-americanas que rastreiam toda a web pública, o tempo todo.

Mike Tung pretende adicionar uma interface de linguagem natural para os usuários e construir um “sistema de resposta universal”, com as devidas fontes de referência, possivelmente combinando-o com um modelo de linguagem como o GPT-3.

COMPARTILHE

Notícias Relacionadas

Nvidia lança plataforma de agentes de IA de código aberto

O Nemoclaw foi projetada para segurança de nível empresarial, proteção de privacidade e automação escalável de tarefas

19/03/2026

Organizações se movimentam para criar o selo “livre de IA”

Objetivo é desenvolver um logotipo universalmente reconhecido para identificar produtos e serviços “feitos por humanos”

17/03/2026

Ferramentas de IA terão papel fundamental na Copa do Mundo

Conjunto de inovações Football AI Pro oferecerá desde uma nova versão da Visão do Árbitro até avatares 3D dos jogadores

16/03/2026