Menos da metade das empresas brasileiras usa IA generativa
Pesquisa patrocinada pelo SAS Institute revela que a China ocupa o primeiro lugar no ranking global de aplicação da tecnologia; Brasil está em 11º
19/09/202421/09/2020
Por redação AIoT Brasil
Um sistema de inteligência artificial que lê todas as páginas da internet, em todos os idiomas, e extrai o máximo possível de fatos para “aprender” com eles e criar o maior gráfico de conhecimento de todos os tempos: essa é proposta da startup Diffbot, de Stanford, Califórnia, ao desenvolver um novo modelo de linguagem que automatiza totalmente o processo de construção de textos.
Assim como o GPT-3, lançado em julho pela OpenAI, o sistema da Diffbot coleta na web bilhões de dados e cria textos que parecem ter sido escritos por humanos. Porém, em vez de usar os dados para treinar um modelo de linguagem, a Diffbot transforma o que lê em uma série de informações inter-relacionadas, com sujeito, verbo e objeto.
Ao comparar os modelos de linguagem atuais com o novo sistema, Mike Tung, CEO da Diffbot, disse que eles são imitadores incríveis, mas têm pouca noção do que estão realmente dizendo: “Eles são realmente bons em gerar histórias sobre unicórnios, mas não são treinados para serem factuais”, afirmou, em entrevista à revista do Instituto de Tecnologia de Massachusetts.
O gráfico de conhecimento é reconstruído de quatro em quatro dias, com base nos quase 150 milhões de novos dados recolhidos a cada mês, e usa mais algoritmos de aprendizado de máquinas para conectar esses novos fatos aos antigos e criar novas conexões que substituem as desatualizadas. A IA da Diffbot lê a web como um humano o faria, mas com muito mais velocidade e em todos os idiomas.
O sistema da Diffbot é aberto a pesquisadores, gratuitamente, mas a startup já tem cerca de 400 clientes pagantes, entre os quais, Snapchat, Nasdaq, Adidas e a Nike (a fabricantes de artigo esportivo utilizam a ferramenta para pesquisar tênis falsificados na web). Ao lado do Google e da Microsoft, a Diffbot é uma das três únicas empresas norte-americanas que rastreiam toda a web pública, o tempo todo.
Mike Tung pretende adicionar uma interface de linguagem natural para os usuários e construir um “sistema de resposta universal”, com as devidas fontes de referência, possivelmente combinando-o com um modelo de linguagem como o GPT-3.
#AI#Diffbot#GPT-3#IA#linguagem natural#Mike Tung#modelo de linguagem#open AI#rastreio web#rastreio web pública
Pesquisa patrocinada pelo SAS Institute revela que a China ocupa o primeiro lugar no ranking global de aplicação da tecnologia; Brasil está em 11º
19/09/2024Os bots e assistentes virtuais que organizam tarefas diárias e os recursos que ajudam a redigir textos estão no topo da lista
09/09/2024Millena Xavier criou uma ferramenta de IA para a triagem de autismo e conquistou uma posição no top 10 do “Nobel dos Estudantes”
06/09/2024